「Stockmark 2: 日本語に特化した1000億パラメータLLMの開発と公開 - Stockmark Tech Blog」

ストックマークではGENIACの第２期のプロジェクトで日本語を主な対象とした1000億パラメータのLLMの開発を行なっています。このブログではGENIACの取り組みについて簡単に紹介します。また、開発自体はまだ続いていますが、一定の性能が出てきたことから、現段階のモデル、Stockmark-2-100B-Instruct-betaをベータ版としてHuggingFace HubでMITライセンスで公開します。日本語MT-Benchではこれまで日本で開発されてきたオープンなモデルに比べて高い性能を示すことがわかりました。このモデルは1.5兆トークンのデータで事前学習を行い、その後に事後学習を行なっ…

ストックマークではGENIACの第２期のプロジェクトで日本語を主な対象とした1000億パラメータのLLMの開発を行なっています。このブログではGENIACの取り組みについて簡単に紹介します。また、開発自体はまだ続いていますが、一定の性能が出てきたことから、現段階のモデル、Stockmark-2-100B-Instruct-betaをベータ版としてHuggingFace HubでMITライセンスで公開します。日本語MT-Benchではこれまで日本で開発されてきたオープンなモデルに比べて高い性能を示すことがわかりました。このモデルは1.5兆トークンのデータで事前学習を行い、その後に事後学習を行なっ…

Webページ

コンテンツ文字数：0 文字

見出し数（H2/H3タグ）：0 個

閲覧数：4 件

2025-03-07 20:00:31

オリジナルページを開く