SynthID とは: YouTube の AI 生成音楽の聞こえない透かし

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

SynthID は、AI が生成した音楽や画像に対して検出不可能な電子透かしを生成する技術です。 このツールを使用すると、AI が生成した画像や音声に電子透かしを直接埋め込むことができます。これは人間には認識できませんが、識別目的に使用できます。

このテクノロジーは Google DeepMind によって開発され、Google Research との提携によりさらに改良されました。 シンセID 他の AI モデル全体で使用できる可能性があり、すぐにさらに多くの製品に統合される予定です。 これにより、人々や組織は AI によって生成されたコンテンツを責任を持って扱うことができるようになります。

この透かしはどのように機能するのでしょうか?
電子透かしを埋め込むには、音声波形をスペクトログラムに変換し、電子透かしを付加した後、音声波形形式に戻します。 このプロセスにより、透かしが人間には聞こえず、改変されにくいことが保証されます。

AI が生成した画像の場合、画像のピクセルに肉眼では見えない電子透かしが埋め込まれます。 ウォーターマークは、フィルターの追加、色の変更、JPEG 圧縮などの非可逆圧縮スキームの使用などの変更に耐えるように設計されています。 画像が変更された場合でも、透かしは画像の品質に影響を与えることなく検出可能です。

透かしを埋め込んだ後、SynthID はオーディオ トラックまたは画像をスキャンして電子透かしの存在を検出できます。 結果には、ユーザーがコンテンツが次のような特定の AI モデルを使用して生成されたかどうかを判断するのに役立つ信頼レベルが提供されます。 リリア 音楽の場合はImagen、画像の場合はImagen。

SynthID は、誤った情報を軽減するための包括的なソリューションとしては機能しませんが、AI が生成したコンテンツのトレーサビリティと識別を可能にすることで、そのコンテンツの信頼性を高めるための初期の技術的アプローチを表していると言っても過言ではありません。 これにより、YouTube は動画に次のようなラベルを付けるようになりました。 警告 AI によって生成されたコンテンツが含まれている場合。