NEW GPT-OSS Swallow と Qwen3 Swallow を公開しました！

日本語に強いオープンなLLMを、アカデミックな研究開発から

Swallow LLM

Swallow は、大学・研究機関を中心としたアカデミックな研究開発に基づき、日本語性能を重視した大規模言語モデルを構築・公開するプロジェクトです。モデル、データ、ソフトウェア、実験結果を可能な限り公開し、透明性、再現性、知見の共有を重視した研究開発を通じて、大規模言語モデル研究の健全な発展を目指します。

より詳しく

Swallow LLM

特色

日本で高性能かつオープンな大規模言語モデルを開発しています

日本語で高性能な大規模言語モデル

日本に関する知識が豊富なだけでなく、数学、コーディング、推論にも強い、汎用型の大規模言語モデルを目指しています

商用利用可能なライセンスで公開

できるだけ利用制限の少ないライセンスを採用し、構築したモデルをHuggingFace上で公開しています

アカデミックな研究開発

東京科学大学の岡崎研究室、横田研究室、産業技術総合研究所のメンバーを中心に開発しています

オープンな研究開発

高性能なモデルを構築するためのレシピ、訓練データ、実験結果を共有し、日本の人工知能研究・応用を促進しています

主な成果

GPT-OSS Swallow

GPT-OSS Swallow

GPT-OSSの日本語能力と思考力を強化した推論型LLM (20B, 120B)

Qwen3 Swallow

Qwen3 Swallow

Qwen3の日本語能力と思考力を強化した推論型LLM (8B, 30B-A3B, 32B)

Gemma-2-Llama Swallow

Gemma-2-Llama Swallow

Gemma 2をベースに日本語の能力を強化した大規模言語モデル (2B, 9B, 27B)

Llama 3.3 Swallow

Llama 3.3 Swallow

Llama 3.3をベースに日本語の能力を強化した大規模言語モデル (70B)

Llama 3.1 Swallow v0.5

Llama 3.1 Swallow v0.5

Llama 3.1 8Bをベースに日本語の能力を強化した大規模言語モデル (8B)

Swallow Leaderboard v2

Swallow Leaderboard v2

高難易度ベンチマークに対応した大規模言語モデルのリーダーボード

$SwallowCode-v2$

SwallowCode-v2

LLMのコーディング能力を効率よく高める学習データ

実績

コミュニティで広がる Swallow LLM の利用と実績（2026年3月時点）

241万

モデル・ダウンロード

55万

データセット・ダウンロード

132

モデル

19

データセット

メンバー

岡崎直観

東京科学大学教授

全体の統括、事前学習コーパスの構築、ウェブ開発者

横田理央

東京科学大学教授

学習チームのリーダー

水木栄

産総研／東京科学大学非常勤研究員

指示チューニングのリーダー、評価チームのリーダー

藤井一喜

東京科学大学博士課程学生

事前学習、事後学習

中村泰士

東京科学大学博士課程学生

事前学習、事後学習、評価

馬尤咪

東京科学大学助教

事後学習

大葉大輔

東京科学大学特任助教

事後学習

太田晋

東京科学大学非常勤研究員

事後学習

前田航希

東京科学大学博士課程学生

評価

大井聖也

東京科学大学博士課程学生

事後学習

石田茂樹

東京科学大学博士課程学生

評価

川村政貴

東京科学大学修士課程学生

言語資源の構築

田島幸人

東京科学大学修士課程学生

言語資源の構築

齋藤幸史郎

東京科学大学修士課程学生

評価

一瀬達矢

東京科学大学修士課程学生

評価

松下直矢

東京科学大学修士課程学生

評価

宮本空

東京科学大学学部生

評価

野原⼤輔

東京科学大学修士課程学生

事後学習

片山結太

東京科学大学学部生

言語資源の構築、指示チューニング

Nguyen Tien Dung

東京科学大学学部生

言語資源の構築

平塚貴也

東京科学大学学部生

評価、言語資源の構築

Kumdee Thanasan

東京科学大学学部生

評価

高村大也

産総研 AIRC チーム長

マネージャー

過去のメンバー

岡本拓己

東京科学大学修士課程修了

指示チューニング

塩谷泰平

東京科学大学修士課程修了

評価

島田比奈理

東京科学大学修士課程修了

評価、安全性

Sangwhan Moon

東京科学大学非常勤研究員

事後学習

Mengsay Loem

東京工業大学修士課程修了

評価

平井翔太

東京工業大学修士課程修了

事前学習コーパスの構築

飯田大貴

東京工業大学博士課程修了

大規模言語モデルにおけるトークン化

服部翔

東京科学大学修士課程修了

事前学習コーパスの構築、評価