新製品・サービス
公開日: 2023.05.21
サイバーエージェントが最大68億パラメータの日本語大規模言語モデルを一般公開 商用利用可能で、日本語ベースの自然言語処理研究を推進
▼ ニュースのポイント
①サイバーエージェントが最大68億パラメータの日本語大規模言語モデルを一般公開した。
②国内の公開モデルとしては最大級。
③同モデルは商用利用が可能。

近年、生成AI・LLMの開発が急速に進化しているが、そのほとんどは英語中心に学習され、日本語や日本文化に精通したLLMは少ないのが現状だ。
こうした中、同社は自然な日本語の文章生成を実現しようと、独自の日本語LLMの開発に取り組んでいる。
今回は、日本国内の公開モデルとしては最大級の規模となるモデル「OpenCALM-7B」をHugging Face Hubにて公開した。
同モデルは、WikipediaやCommon Crawlの日本語データで学習したもので、商用利用が可能(ライセンスはCC BY-SA 4.0)。同モデルをベースにチューニングすることで、対話型AIの開発なども可能となり、より多くの人が日本語ベースの自然言語処理に関する最先端の研究を行うことができるようになる。
(画像はプレスリリースより)
▼外部リンク
サイバーエージェント プレスリリース
https://www.cyberagent.co.jp/news/detail/id=28817
▼ 会社概要
サイバーエージェントは、メディア事業、インターネット広告事業、ゲーム事業などを行う企業。
社名:株式会社サイバーエージェント
代表取締役:藤田 晋
所在地:東京都渋谷区宇田川町40番1号 Abema Towers
①サイバーエージェントが最大68億パラメータの日本語大規模言語モデルを一般公開した。
②国内の公開モデルとしては最大級。
③同モデルは商用利用が可能。
国内最大級の公開モデル
サイバーエージェントは5月17日、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開した。
近年、生成AI・LLMの開発が急速に進化しているが、そのほとんどは英語中心に学習され、日本語や日本文化に精通したLLMは少ないのが現状だ。
こうした中、同社は自然な日本語の文章生成を実現しようと、独自の日本語LLMの開発に取り組んでいる。
今回は、日本国内の公開モデルとしては最大級の規模となるモデル「OpenCALM-7B」をHugging Face Hubにて公開した。
同モデルは、WikipediaやCommon Crawlの日本語データで学習したもので、商用利用が可能(ライセンスはCC BY-SA 4.0)。同モデルをベースにチューニングすることで、対話型AIの開発なども可能となり、より多くの人が日本語ベースの自然言語処理に関する最先端の研究を行うことができるようになる。
LLMを活用したビジネス開発を予定
同社では、これまで培った知見を活かし、業界に特化したLLMの構築や、企業連携LLMを活用したビジネスの開発を予定している。このため、エンジニアを新規採用し、体制を強化する考えだ。(画像はプレスリリースより)
▼外部リンク
サイバーエージェント プレスリリース
https://www.cyberagent.co.jp/news/detail/id=28817
▼ 会社概要
サイバーエージェントは、メディア事業、インターネット広告事業、ゲーム事業などを行う企業。
社名:株式会社サイバーエージェント
代表取締役:藤田 晋
所在地:東京都渋谷区宇田川町40番1号 Abema Towers
関連記事
-
新製品・サービス
2023.07.01
ネルプがAI人物画像生成ソフト「Zoe」を活用した法人向けサービスを提供開始 生成したAI人物画像を広告コンテンツに活用できる
-
新製品・サービス
2023.06.30
XAION DATAが「AUTOHUNT」に新機能を追加 ChatGPTを活用した3つの機能を実装
-
新製品・サービス
2023.06.30
コチラエが「KOCHILAE」をリリース ショッピングセンターや商店街などでの買い回りを支援するクーポン発行プラットフォーム
-
新製品・サービス
2023.06.30
エルイズビーが現場写真共有アプリ「タグショット/タグアルバム」をリリース 撮るだけでタグが付きクラウド上に自動で保存・分類・共有
-
新製品・サービス
2023.06.30
ジオコードが「ネクストSFA」に新機能追加 ChatGPTを活用した「履歴要約機能」で通話内容・商談履歴・メール履歴を要約
-
新製品・サービス
2023.06.30
USEN-NEXT HOLDINGSが「Hello Caddy」を提供 プレイヤーに追従して走行、ゴルフバッグ・荷物を搬送