Web担トップ » ニュース記事一覧 » サイバーエージェントが生成AIの基盤になる独自の日本語LLMを新たに一般公開

サイバーエージェントが生成AIの基盤になる独自の日本語LLMを新たに一般公開

「CyberAgentLM」のバージョン2、日本語の文章で一度に約5万文字が処理可能

山川健（Web担編集部） 2023/11/6 7:01 マーケティング／広告 | 便利ツール／サービス

5 4 0

インターネット広告事業のサイバーエージェントは、生成AI(人工知能)の基盤になる独自の日本語LLM(大規模言語モデル)を新たに一般公開した、と11月2日発表した。5月に一般公開した「CyberAgentLM」のバージョン2で、70億パラメータ・3万2000トークンに対応した。共有サイト「Hugging Face」に公開した。

今回公開した日本語LLMは、日本語と英語のデータで事前学習した70億パラメータのベースモデル「CyberAgentLM2-7B」と、チャット形式にチューニングした「CyberAgentLM2-7B-Chat」の2種類。CyberAgentLM2-7B-Chatは入出力の長さで3万2000トークンに対応し、日本語の文章で一度に約5万文字が処理できる。

サイバーエージェントは日本語LLMの開発を推進し、CyberAgentLMの公開後もLLMの研究を続け、さまざまなモデルを開発。広告の配信前に効果を予測するサービス「極予測AI」をはじめ、自社のサービスに活用している。日本語LLMを一般公開することで、性能の強化と日本の自然言語処理技術の発展につなげる。

AI / LLM / チャット / 日本語

この記事が役に立ったらシェア!4 0

※記事へのコメント機能は2021年11月をもって終了しました。編集部へのご連絡は、問い合わせフォーム・メール・Twitterなどをご利用ください。

Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]

[GOLD SPONSOR]

株式会社日本レジストリサービス

[SPONSOR]

株式会社キノトロープ Sitecore 株式会社ミツエーリンクス株式会社電通デジタル株式会社サイズ