GPT-OSS Swallow
GPT-OSSの日本語能力と思考力を強化した推論型LLM (20B, 120B)

日本で高性能かつオープンな大規模言語モデルを開発しています
日本に関する知識が豊富なだけでなく、数学、コーディング、推論にも強い、汎用型の大規模言語モデルを目指しています
できるだけ利用制限の少ないライセンスを採用し、構築したモデルをHuggingFace上で公開しています
東京科学大学の岡崎研究室、横田研究室、産業技術総合研究所のメンバーを中心に開発しています
高性能なモデルを構築するためのレシピ、訓練データ、実験結果を共有し、日本の人工知能研究・応用を促進しています
GPT-OSSの日本語能力と思考力を強化した推論型LLM (20B, 120B)
Qwen3の日本語能力と思考力を強化した推論型LLM (8B, 30B-A3B, 32B)
Gemma 2をベースに日本語の能力を強化した大規模言語モデル (2B, 9B, 27B)
Llama 3.3をベースに日本語の能力を強化した大規模言語モデル (70B)
Llama 3.1 8Bをベースに日本語の能力を強化した大規模言語モデル (8B)
高難易度ベンチマークに対応した大規模言語モデルのリーダーボード
LLMのコーディング能力を効率よく高める学習データ
コミュニティで広がる Swallow LLM の利用と実績(2026年2月時点)
岡崎 直観
東京科学大学 教授
全体の統括、事前学習コーパスの構築、ウェブ開発者
横田 理央
東京科学大学 教授
学習チームのリーダー
水木 栄
産総研/東京科学大学 非常勤研究員
指示チューニングのリーダー、評価チームのリーダー
藤井 一喜
東京科学大学 修士課程学生
事前学習、事後学習
中村 泰士
東京科学大学 修士課程学生
事前学習、事後学習、評価
馬 尤咪
東京科学大学 助教
事後学習
大葉 大輔
東京科学大学 特任助教
事後学習
太田 晋
東京科学大学 非常勤研究員
事後学習
前田 航希
東京科学大学 博士課程学生
評価
大井 聖也
東京科学大学 修士課程学生
評価
岡本 拓己
東京科学大学 修士課程学生
指示チューニング
石田 茂樹
東京科学大学 修士課程学生
評価
川村 政貴
東京科学大学 修士課程学生
言語資源の構築
田島 幸人
東京科学大学 修士課程学生
言語資源の構築
塩谷 泰平
東京科学大学 修士課程学生
評価
島田 比奈理
東京科学大学 修士課程学生
評価、安全性
齋藤 幸史郎
東京科学大学 修士課程学生
評価
一瀬 達矢
東京科学大学 学部生
評価
松下 直矢
東京科学大学 学部生
評価
宮本 空
東京科学大学 学部生
評価
野原 ⼤輔
東京科学大学 学部生
事後学習
片山 結太
東京科学大学 学部生
言語資源の構築、指示チューニング
Nguyen Tien Dung
東京科学大学 学部生
言語資源の構築
高村 大也
産総研 AIRC チーム長
マネージャー
Sangwhan Moon
東京科学大学 非常勤研究員
事後学習
Mengsay Loem
東京工業大学 修士課程修了
評価
平井 翔太
東京工業大学 修士課程修了
事前学習コーパスの構築
飯田 大貴
東京工業大学 博士課程修了
大規模言語モデルにおけるトークン化
服部 翔
東京科学大学 修士課程修了
事前学習コーパスの構築、評価