Stability AIがStable Diffusion 3 Mediumをリリース、生成されたコンテンツの手と顔を改善

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

キーノート

  • Stability AI は、オープンソースのテキストから画像への AI モデルである Stable Diffusion 3 Medium をリリースしました。
  • SD3 Medium は高品質の画像を生成し、テキスト要素を適切に処理し、標準的なコンシューマー GPU で実行されます。
安定性.ai

Stability AIは、Stable Diffusion 3 Medium(SD3 Medium)をリリースしました。同社はSD3 Mediumをこれまでで最も先進的なオープンソースモデルと位置付けています。 Midjourney 6 を上回る。

Stability AIによると、SD3 Mediumはテキストの説明からフォトリアリスティックな画像を生成することができる。このモデルは、これまでほぼすべてのAI画像生成器が直面していた課題に対処するために設計されている。 生成されたコンテンツに手と顔が表示されます。

SD3 Medium は、基盤となる Diffusion Transformer アーキテクチャのおかげで、テキスト要素も高精度に組み込んでいます。

SD3 Mediumの主な特徴は、そのアクセシビリティです。一部のリソース集約型AIモデルとは異なり、SD3 Mediumは標準的なコンシューマー向けグラフィックカードで実行できるように作られています。これにより、より幅広いユーザーへの導入が可能になります。このモデルは、小規模なデータセットを使用することでカスタマイズ機能も提供します。 安定性AI。

Stability AIは、将来的にはビデオやオーディオの生成にもサービスを拡大する計画があることも明らかにした。 次のWeb。

Stability AI は、SD3 Medium を非商用ライセンスで無料で提供しています。商用アプリケーションの場合、アーティスト、デザイナー、開発者向けの Creator ライセンスをご利用いただけます。

大規模な商用ユーザーの場合は、ライセンスの詳細についてStability AIに直接問い合わせることができます。これは、開発者が受け取った後に行われます。 安定拡散 3 の API アクセス 数か月前。

要約すると、Stable Diffusion 3 Medium は、特に手や顔の生成に関しては、アクセスしやすく強力なテキストから画像への AI 生成における一歩前進を表しています。