Swallow LLM

Swallow LLM

東京科学大学(旧・東京工業大学)情報理工学院の岡崎研究室と横田研究室を中心に、大規模言語モデルの研究・開発をしています。

View on HuggingFace
Swallow LLM

Gemma-2-Llama Swallow

Gemma 2の日本語能力を強化した大規模言語モデル (2B, 9B, 27B)

Llama 3.1 Swallow 8B v0.5

Llama 3.1 8Bの日本語能力を強化した大規模言語モデル

Llama 3.3 Swallow 70B v0.4

Llama 3.3 70Bの日本語能力を強化した大規模言語モデル

Llama 3.1 Swallow

Llama 3.1の日本語能力を強化した大規模言語モデル (8B, 70B)

Llama 3 Swallow

Llama 3の日本語能力を強化した大規模言語モデル (8B, 70B)

Swallow on mistral

Mistral 7BおよびMixtral 8x7Bの日本語能力を強化した大規模言語モデル

Swallow

Llama 2の日本語能力を強化した大規模言語モデル (7B, 13B, 70B)

Swallow LLM Leaderboard

Swallowチームで実施した日本語の大規模言語モデルの評価

Llama 3.1 Swallowに関するライセンスおよび利用規約の修正について

Llama 3.1 Swallowの公開に際し、「Llama 3.1 SwallowはMeta Llama 3.1コミュニティライセンスに従う限...

Regarding the License and Terms of Use Amendment for Llama 3.1 Swallow

In conjunction with the release of Llama 3.1 Swallow, we initially state...

大規模言語モデルSwallowを公開

Llama 2に対する継続事前学習で日本語を強化した大規模言語モデルSwallowを公開しました。詳しくは、Swallowをご覧ください。

岡崎 直観

岡崎 直観

東京科学大学 教授

全体の統括、事前学習コーパスチームのリーダー、ウェブ開発者

横田 理央

横田 理央

東京科学大学 教授

学習チームのリーダー

水木 栄

水木 栄

産総研/東京科学大学 非常勤研究員

指示チューニングのリーダー、評価チームのリーダー

藤井 一喜

藤井 一喜

東京科学大学 修士課程学生

大規模言語モデルの事前学習、指示チューニング

中村 泰士

中村 泰士

東京科学大学 修士課程学生

大規模言語モデルの事前学習、指示チューニング、大規模言語モデルの評価

馬 尤咪

馬 尤咪

東京科学大学 助教

事後学習

Sangwhan Moon

Sangwhan Moon

東京科学大学 非常勤研究員

事後学習

前田 航希

前田 航希

東京科学大学 博士課程学生

大規模言語モデルの評価

大井 聖也

大井 聖也

東京科学大学 修士課程学生

大規模言語モデルの評価

岡本 拓己

岡本 拓己

東京科学大学 修士課程学生

指示チューニング

石田 茂樹

石田 茂樹

東京科学大学 修士課程学生

大規模言語モデルの評価

川村 政貴

川村 政貴

東京科学大学 修士課程学生

言語資源の構築

田島 幸人

田島 幸人

東京科学大学 修士課程学生

言語資源の構築

塩谷 泰平

塩谷 泰平

東京科学大学 修士課程学生

大規模言語モデルの評価

島田 比奈理

島田 比奈理

東京科学大学 修士課程学生

大規模言語モデルの評価、安全性

齋藤 幸史郎

齋藤 幸史郎

東京科学大学 修士課程学生

大規模言語モデルの評価

一瀬 達矢

一瀬 達矢

東京科学大学 学部生

大規模言語モデルの評価

松下 直矢

松下 直矢

東京科学大学 学部生

大規模言語モデルの評価

宮本 空

宮本 空

東京科学大学 学部生

大規模言語モデルの評価

片山 結太

片山 結太

東京科学大学 学部生

言語資源の構築、指示チューニング

Nguyen Tien Dung

Nguyen Tien Dung

東京科学大学 学部生

言語資源の構築

高村 大也

高村 大也

産総研 AIRC チーム長

マネージャー

Mengsay Loem

Mengsay Loem

東京工業大学 修士課程修了

大規模言語モデルの評価

平井 翔太

平井 翔太

東京工業大学 修士課程修了

事前学習コーパスの構築

飯田 大貴

飯田 大貴

東京工業大学 博士課程修了

大規模言語モデルにおけるトークン化

服部 翔

服部 翔

東京科学大学 修士課程学生

事前学習コーパスの構築、大規模言語モデルの評価

Get in touch

Avenco comes with a built-in contact form.