日本語に強いオープンなLLMを、アカデミックな研究開発から

Swallow LLM

Swallow LLM

特色

日本で高性能かつオープンな大規模言語モデルを開発しています

日本語で高性能な大規模言語モデル

日本に関する知識が豊富なだけでなく、数学、コーディング、推論にも強い、汎用型の大規模言語モデルを目指しています

商用利用可能なライセンスで公開

できるだけ利用制限の少ないライセンスを採用し、構築したモデルをHuggingFace上で公開しています

アカデミックな研究開発

東京科学大学の岡崎研究室、横田研究室、産業技術総合研究所のメンバーを中心に開発しています

オープンな研究開発

高性能なモデルを構築するためのレシピ、訓練データ、実験結果を共有し、日本の人工知能研究・応用を促進しています

主な成果

GPT-OSS Swallow

GPT-OSS Swallow

GPT-OSSの日本語能力と思考力を強化した推論型LLM (20B, 120B)

Qwen3 Swallow

Qwen3 Swallow

Qwen3の日本語能力と思考力を強化した推論型LLM (8B, 30B-A3B, 32B)

Gemma-2-Llama Swallow

Gemma-2-Llama Swallow

Gemma 2をベースに日本語の能力を強化した大規模言語モデル (2B, 9B, 27B)

Llama 3.3 Swallow

Llama 3.3 Swallow

Llama 3.3をベースに日本語の能力を強化した大規模言語モデル (70B)

Llama 3.1 Swallow v0.5

Llama 3.1 Swallow v0.5

Llama 3.1 8Bをベースに日本語の能力を強化した大規模言語モデル (8B)

Swallow Leaderboard v2

Swallow Leaderboard v2

高難易度ベンチマークに対応した大規模言語モデルのリーダーボード

SwallowCode-v2

SwallowCode-v2

LLMのコーディング能力を効率よく高める学習データ

実績

コミュニティで広がる Swallow LLM の利用と実績(2026年2月時点)

230万
モデル・ダウンロード
54万
データセット・ダウンロード
135
モデル
17
データセット

メンバー

岡崎 直観

岡崎 直観

東京科学大学 教授


全体の統括、事前学習コーパスの構築、ウェブ開発者

横田 理央

横田 理央

東京科学大学 教授


学習チームのリーダー

水木 栄

水木 栄

産総研/東京科学大学 非常勤研究員


指示チューニングのリーダー、評価チームのリーダー

藤井 一喜

藤井 一喜

東京科学大学 修士課程学生


事前学習、事後学習

中村 泰士

中村 泰士

東京科学大学 修士課程学生


事前学習、事後学習、評価

馬 尤咪

馬 尤咪

東京科学大学 助教


事後学習

大葉 大輔

大葉 大輔

東京科学大学 特任助教


事後学習

太田 晋

太田 晋

東京科学大学 非常勤研究員


事後学習

前田 航希

前田 航希

東京科学大学 博士課程学生


評価

大井 聖也

大井 聖也

東京科学大学 修士課程学生


評価

岡本 拓己

岡本 拓己

東京科学大学 修士課程学生


指示チューニング

石田 茂樹

石田 茂樹

東京科学大学 修士課程学生


評価

川村 政貴

川村 政貴

東京科学大学 修士課程学生


言語資源の構築

田島 幸人

田島 幸人

東京科学大学 修士課程学生


言語資源の構築

塩谷 泰平

塩谷 泰平

東京科学大学 修士課程学生


評価

島田 比奈理

島田 比奈理

東京科学大学 修士課程学生


評価、安全性

齋藤 幸史郎

齋藤 幸史郎

東京科学大学 修士課程学生


評価

一瀬 達矢

一瀬 達矢

東京科学大学 学部生


評価

松下 直矢

松下 直矢

東京科学大学 学部生


評価

宮本 空

宮本 空

東京科学大学 学部生


評価

野原 ⼤輔

野原 ⼤輔

東京科学大学 学部生


事後学習

片山 結太

片山 結太

東京科学大学 学部生


言語資源の構築、指示チューニング

Nguyen Tien Dung

Nguyen Tien Dung

東京科学大学 学部生


言語資源の構築

高村 大也

高村 大也

産総研 AIRC チーム長


マネージャー

過去のメンバー

Sangwhan Moon

Sangwhan Moon

東京科学大学 非常勤研究員


事後学習

Mengsay Loem

Mengsay Loem

東京工業大学 修士課程修了


評価

平井 翔太

平井 翔太

東京工業大学 修士課程修了


事前学習コーパスの構築

飯田 大貴

飯田 大貴

東京工業大学 博士課程修了


大規模言語モデルにおけるトークン化

服部 翔

服部 翔

東京科学大学 修士課程修了


事前学習コーパスの構築、評価