海外
公開日: 2022.11.29
人気画像生成AI「Stable Diffusion」がメジャーアップデート、高解像度化と社会の問題懸念払拭へ
▼ ニュースのポイント
①Stability AIが「Stable Diffusion 2.0」をリリースした。
②テキストからの生成画像品質が大幅に向上、画像解像度を4倍に高めるモデルや奥行きを維持する深度画像拡散モデルも搭載する。
③健全な創造性開放への寄与を高め、AIポルノなどの不当生成を困難にし、懸念される問題にも対応したとする。

CompVisによって開発されたオリジナルの初代「Stable Diffusion」は、オープンソースのAIモデルにおける革新的存在となり、世界で誕生するその後の何百ものモデルや、多数のイノベーションに影響を与えてきた。わずか2カ月足らずで33Kスターを獲得し、GitHubの10Kスターに最も速く到達したソフトウェアのひとつになったことも、その支持の高さと影響の大きさを示している。
今回、リリースした「Stable Diffusion 2.0」では、初代に多くの改善点が加えられ、新たな機能も複数追加搭載された。
まず「Stable Diffusion」は、自然なテキストプロンプトから画像を生成できるソフトだが、最新バージョンは、新たに開発されたテキストエンコーダー(OpenCLIP)を用いて学習させたText-to-Imageモデルを含んでおり、生成画像の品質を大幅に向上させることに成功している。
この最新版に含まれるテキスト画像生成モデルは、512×512ピクセルと、768×768ピクセルの両デフォルト解像度で画像を生成できるようになった。

また、「Depth2img」と呼ばれる新たな深度誘導型安定拡散モデルにより、初代の画像間拡散機能を拡張、奥行きある仕上がりでクリエイティブに新たな可能性をもたらすものともしている。
「Depth2img」は、入力画像の奥行きを推測し、テキストと奥行き情報の両方を用いて新たな画像を生成、オリジナルとは全く異なる画像でありながら、その画像の一貫性と自然な奥行きを維持した変換を実現し、構造保存型の画像間合成や、形状条件付きの画像合成にも活用できるなど、多様な創造的アプリケーションを提供できるようになっている。

さらに、新しいテキストガイド型インペイントモデルを含むものともなった。これは生成画像に適切な微調整を施すもので、画像の一部をインテリジェントかつ迅速に切り替え変更するといったことがごく簡単にできる仕組みを実現している。
こうした強力な新機能を付加するとともに、昨今広がる社会的な懸念点にも対応した。開発チームの作成したデータセット学習とフィルターにより、成人向けコンテンツを除去、AIによる不適切なポルノ生成を困難にしているという。
なお、こうした多くの点における改善・変更が加えられたが、シングルGPUでの動作に最適化した仕様であるという特徴は最新版でも維持された。Stability AIでは、この特徴により、保有するリソースの水準を問わず、アクセスできるものとすること、何百万人もの才能ある人々の膨大な潜在能力を活かせるようなものとすることを目指したとしている。
加えて同社はこのリリースに続き、同モデルを数日以内に自社のAPIプラットフォームや画像生成サービスの「DreamStudio」にも適用させ、リリースすることもアナウンスした。
(画像はプレスリリースより)
▼外部リンク
Stability AI プレスリリース
https://stability.ai/blog/
▼会社概要
Stability AIは、世界初のコミュニティ主導型オープンソースAIツールを開発・提供することを謳うテクノロジースタートアップ企業。画像、言語、音声、映像、3Dなど多岐にわたる領域の最先端オープンAIモデル開発を推進する。大学研究者らと共同開発した画像生成AI「Stable Diffusion」によってにわかに注目を集める存在となった。Webデザイン界に革命を起こすと指摘する声もあり、まとまった資金調達を成功させてきている。
社名:Stability AI, Inc.
CEO:Emad Mostaque
所在地:英国・Notting Hill, London
①Stability AIが「Stable Diffusion 2.0」をリリースした。
②テキストからの生成画像品質が大幅に向上、画像解像度を4倍に高めるモデルや奥行きを維持する深度画像拡散モデルも搭載する。
③健全な創造性開放への寄与を高め、AIポルノなどの不当生成を困難にし、懸念される問題にも対応したとする。
人気画像生成AI、待望のメジャーアップデート
Stability AIは現地時間の24日、提供する画像生成AIの最新メジャーアップデート版「Stable Diffusion 2.0」をリリースしたことを発表した。ソフトウェア開発プラットフォーム「GitHub」を通じ、一般公開されている。
CompVisによって開発されたオリジナルの初代「Stable Diffusion」は、オープンソースのAIモデルにおける革新的存在となり、世界で誕生するその後の何百ものモデルや、多数のイノベーションに影響を与えてきた。わずか2カ月足らずで33Kスターを獲得し、GitHubの10Kスターに最も速く到達したソフトウェアのひとつになったことも、その支持の高さと影響の大きさを示している。
今回、リリースした「Stable Diffusion 2.0」では、初代に多くの改善点が加えられ、新たな機能も複数追加搭載された。
まず「Stable Diffusion」は、自然なテキストプロンプトから画像を生成できるソフトだが、最新バージョンは、新たに開発されたテキストエンコーダー(OpenCLIP)を用いて学習させたText-to-Imageモデルを含んでおり、生成画像の品質を大幅に向上させることに成功している。
この最新版に含まれるテキスト画像生成モデルは、512×512ピクセルと、768×768ピクセルの両デフォルト解像度で画像を生成できるようになった。

より美しく便利に、懸念される問題にも対応
「Stable Diffusion 2.0」には、画像の解像度を4倍に高める超解像アップスケーラー拡散モデルも搭載されている。これにより、テキストから画像への変換モデルと組み合わせれば、単純なテキストプロンプトから、よりリアルで解像度の高い画像、2048×2048ピクセル、またはそれ以上の解像度で描出した高解像度画像を生成・取得することができる。また、「Depth2img」と呼ばれる新たな深度誘導型安定拡散モデルにより、初代の画像間拡散機能を拡張、奥行きある仕上がりでクリエイティブに新たな可能性をもたらすものともしている。
「Depth2img」は、入力画像の奥行きを推測し、テキストと奥行き情報の両方を用いて新たな画像を生成、オリジナルとは全く異なる画像でありながら、その画像の一貫性と自然な奥行きを維持した変換を実現し、構造保存型の画像間合成や、形状条件付きの画像合成にも活用できるなど、多様な創造的アプリケーションを提供できるようになっている。

さらに、新しいテキストガイド型インペイントモデルを含むものともなった。これは生成画像に適切な微調整を施すもので、画像の一部をインテリジェントかつ迅速に切り替え変更するといったことがごく簡単にできる仕組みを実現している。
こうした強力な新機能を付加するとともに、昨今広がる社会的な懸念点にも対応した。開発チームの作成したデータセット学習とフィルターにより、成人向けコンテンツを除去、AIによる不適切なポルノ生成を困難にしているという。
なお、こうした多くの点における改善・変更が加えられたが、シングルGPUでの動作に最適化した仕様であるという特徴は最新版でも維持された。Stability AIでは、この特徴により、保有するリソースの水準を問わず、アクセスできるものとすること、何百万人もの才能ある人々の膨大な潜在能力を活かせるようなものとすることを目指したとしている。
加えて同社はこのリリースに続き、同モデルを数日以内に自社のAPIプラットフォームや画像生成サービスの「DreamStudio」にも適用させ、リリースすることもアナウンスした。
(画像はプレスリリースより)
▼外部リンク
Stability AI プレスリリース
https://stability.ai/blog/
▼会社概要
Stability AIは、世界初のコミュニティ主導型オープンソースAIツールを開発・提供することを謳うテクノロジースタートアップ企業。画像、言語、音声、映像、3Dなど多岐にわたる領域の最先端オープンAIモデル開発を推進する。大学研究者らと共同開発した画像生成AI「Stable Diffusion」によってにわかに注目を集める存在となった。Webデザイン界に革命を起こすと指摘する声もあり、まとまった資金調達を成功させてきている。
社名:Stability AI, Inc.
CEO:Emad Mostaque
所在地:英国・Notting Hill, London
関連記事
-
海外
2023.01.23
丸紅と公文教育研究会がインドネシアの小学校にデジタル式の公文式学習プログラムを試験導入 基礎学力向上や都市と地方の教育格差解消へ
-
海外
2022.12.08
AWSで開発環境一式を提供する「Amazon CodeCatalyst」誕生、ソフト開発の効率改善へ
-
海外
2022.12.07
オリンパスが総務省プロジェクトに参画 ベトナムで内視鏡AI診断の普及実証へ
-
海外
2022.11.23
Intelが96%精度でディープフェイクを見破る検出技術を製品化、ネットデマ対策に期待
-
海外
2022.11.22
Research Nester Private Limitedが電子顕微鏡市場のレポートを発刊、成長率9%に
-
海外
2022.11.09
GoogleがAIに関する最新の取り組み3つを発表、責任ある開発で社会をより良く