オープンソースでGPTベースの大規模言語モデル「Cerebras-GPT」7種類が一気に誰でもダウンロード可能に: iroiro

<< 2024年12月 >>
日	月	火	水	木	金	土
1	2	3	4	5	6	7
8	9	10	11	12	13	14
22	23	24	25	26	27	28
29	30	31

日

月

火

水

木

金

土

<< 2024年12月 >>

2023年03月30日

オープンソースでGPTベースの大規模言語モデル「Cerebras-GPT」7種類が一気に誰でもダウンロード可能に

ChatGPT

AI企業のCerebrasが、大規模言語モデル「Cerebras-GPT」をオープンソースで公開しました。このモデルは、OpenAIのGPT-3をベースに、DeepMindのChinchilla方式で学習したものであり、どのモデルよりも短い学習時間、低い学習コスト、そして少ない消費電力を特徴としています。Cerebras-GPTは、7種類のモデルがあり、パラメータ数は1億1100万から130億です。Cerebrasは、各モデルサイズに最適な学習トークンを使用し、単位計算量あたりのデータ損失を最小限に抑えることに成功しています。また、Cerebras-GPTは下流タスクでも高い学習効率を維持し、グラフによれば、他のモデルよりも優れた性能を発揮していることが示されています。

Bing AIの説明

Cerebras-GPTは、Cerebras社が開発した大規模言語モデルで、OpenAIのGPT-3をベースに、DeepMindが2022年3月にリリースしたChinchilla方式で学習したモデルです。Cerebras-GPTは、最先端の学習効率を持つ初の公開大規模GPTモデル群として、効率的な学習のためのレシピとして、またさらなるコミュニティ研究のための参考資料として役立つことを期待されています。
Cerebras-GPTは、Cerebrasが抱えるAIスーパーコンピューターの Andromeda の一部であるCS-2システムで数週間で学習が行われているとのことです。Cerebras-GPTは、7つのGPT-3モデルを111百万から130億パラメータに拡張し、精度と計算効率において新しい基準を設定しました。
Chinchilla方式とは、DeepMindが2022年3月にリリースした、GPT-3の学習に使用された方法です。Chinchilla方式は、学習データとモデルサイズを均等にスケーリングすることで、最適な学習を行うことができることが示されています。Cerebras-GPTは、Chinchilla方式で学習されたモデルの一つです

https://gigazine.net/news/20230329-cerebras-gpt/

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

ゲームから学ぶAI --環境シミュレータ×深層強化学習で広がる世界 [ 西田圭介 ]
価格：2,970円（税込、送料無料) (2023/3/31時点)

楽天で購入

【このカテゴリーの最新記事】

posted by 3chan at 07:38| （カテゴリなし）