Swallow LLM

Swallow LLM

東京工業大学情報理工学院の岡崎研究室と横田研究室を中心に、大規模言語モデルの研究・開発をしています。

View on HuggingFace
Swallow LLM

Llama 3 Swallow

Llama 3の日本語能力を強化した大規模言語モデル (8B, 70B)

Swallow on mistral

Mistral 7BおよびMixtral 8x7Bの日本語能力を強化した大規模言語モデル

Swallow

Llama 2の日本語能力を強化した大規模言語モデル (7B, 13B, 70B)

大規模言語モデルSwallowを公開

Llama 2に対する継続事前学習で日本語を強化した大規模言語モデルSwallowを公開しました。詳しくは、Swallowをご覧ください。

岡崎 直観

岡崎 直観

東京工業大学 教授

全体の統括、事前学習コーパスチームのリーダー、ウェブ開発者

横田 理央

横田 理央

東京工業大学 教授

学習チームのリーダー

水木 栄

水木 栄

産総研/東京工業大学 非常勤研究員

指示チューニングのリーダー、評価チームのリーダー

藤井 一喜

藤井 一喜

東京工業大学 修士課程学生

大規模言語モデルの事前学習、指示チューニング

中村 泰士

中村 泰士

東京工業大学 修士課程学生

大規模言語モデルの事前学習、指示チューニング、大規模言語モデルの評価

Youmi Ma

Youmi Ma

東京工業大学 博士課程学生

大規模言語モデルの評価

前田 航希

前田 航希

東京工業大学 博士課程学生

大規模言語モデルの評価

服部 翔

服部 翔

東京工業大学 修士課程学生

事前学習コーパスの構築、大規模言語モデルの評価

大井 聖也

大井 聖也

東京工業大学 修士課程学生

大規模言語モデルの評価

岡本 拓己

岡本 拓己

東京工業大学 修士課程学生

指示チューニング

石田 茂樹

石田 茂樹

東京工業大学 修士課程学生

大規模言語モデルの評価

塩谷 泰平

塩谷 泰平

東京工業大学 修士課程学生

大規模言語モデルの評価

齋藤 幸史郎

齋藤 幸史郎

東京工業大学 学部生

大規模言語モデルの評価、トークン化の検討

高村 大也

高村 大也

産総研 AIRC チーム長

マネージャー

Mengsay Loem

Mengsay Loem

東京工業大学 修士課程修了

大規模言語モデルの評価

平井 翔太

平井 翔太

東京工業大学 修士課程修了

事前学習コーパスの構築

飯田 大貴

飯田 大貴

東京工業大学 博士課程修了

大規模言語モデルにおけるトークン化

Get in touch

Avenco comes with a built-in contact form.