「Stockmark 2: 日本語に特化した1000億パラメータLLMの開発と公開 - Stockmark Tech Blog」
ストックマークではGENIACの第2期のプロジェクトで日本語を主な対象とした1000億パラメータのLLMの開発を行なっています。このブログではGENIACの取り組みについて簡単に紹介します。また、開発自体はまだ続いていますが、一定の性能が出てきたことから、現段階のモデル、Stockmark-2-100B-Instruct-betaをベータ版としてHuggingFace HubでMITライセンスで公開します。日本語MT-Benchではこれまで日本で開発されてきたオープンなモデルに比べて高い性能を示すことがわかりました。このモデルは1.5兆トークンのデータで事前学習を行い、その後に事後学習を行なっ…
コンテンツ文字数:0 文字
見出し数(H2/H3タグ):0 個
閲覧数:4 件
2025-03-07 20:00:31