sansansansan
  • DIGITALIST
  • Trends
  • サイバーエージェントが最大68億パラメータの日本語大規模言語モデルを一般公開 商用利用可能で、日本語ベースの自然言語処理研究を推進
Pocket HatenaBlog facebook Twitter Close
新製品・サービス 公開日: 2023.05.21

サイバーエージェントが最大68億パラメータの日本語大規模言語モデルを一般公開 商用利用可能で、日本語ベースの自然言語処理研究を推進

お気に入り

▼ ニュースのポイント
①サイバーエージェントが最大68億パラメータの日本語大規模言語モデルを一般公開した。
②国内の公開モデルとしては最大級。
③同モデルは商用利用が可能。

国内最大級の公開モデル

 サイバーエージェントは5月17日、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開した。



 近年、生成AI・LLMの開発が急速に進化しているが、そのほとんどは英語中心に学習され、日本語や日本文化に精通したLLMは少ないのが現状だ。

 こうした中、同社は自然な日本語の文章生成を実現しようと、独自の日本語LLMの開発に取り組んでいる。

 今回は、日本国内の公開モデルとしては最大級の規模となるモデル「OpenCALM-7B」をHugging Face Hubにて公開した。

 同モデルは、WikipediaやCommon Crawlの日本語データで学習したもので、商用利用が可能(ライセンスはCC BY-SA 4.0)。同モデルをベースにチューニングすることで、対話型AIの開発なども可能となり、より多くの人が日本語ベースの自然言語処理に関する最先端の研究を行うことができるようになる。

LLMを活用したビジネス開発を予定

 同社では、これまで培った知見を活かし、業界に特化したLLMの構築や、企業連携LLMを活用したビジネスの開発を予定している。このため、エンジニアを新規採用し、体制を強化する考えだ。

(画像はプレスリリースより)


▼外部リンク

サイバーエージェント プレスリリース
https://www.cyberagent.co.jp/news/detail/id=28817


▼ 会社概要
サイバーエージェントは、メディア事業、インターネット広告事業、ゲーム事業などを行う企業。

社名:株式会社サイバーエージェント
代表取締役:藤田 晋
所在地:東京都渋谷区宇田川町40番1号 Abema Towers

関連記事

DIGITALIST会員が
できること

  • 会員限定記事が全て読める
  • 厳選情報をメルマガで確認
  • 同業他社のニュースを閲覧
    ※本機能は、一部ご利用いただけない会員様がいます。

公開終了のお知らせ

2024年1月24日以降に
ウェブサイトの公開を終了いたします