現行犯逮捕:AIトレーニングに関するGoogleの偽善が暴露される
2分。 読んだ
上で公開
MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む
キーノート
- YouTube CEOは、OpenAIがYouTubeビデオでAIをトレーニングすることで規約に違反する可能性があると非難した。
- OpenAI は、AI ビデオ ジェネレーターである Sora の特定のデータ ソースについては沈黙を保っています。
- Googleはクリエイターとの契約を尊重しており、自社のAI「Gemini」については許可を得て公開されているデータのみを使用していると主張している。
YouTube CEO のニール・モハン氏は OpenAI を非難し、同社の AI ビデオ ジェネレーターである Sora のトレーニングに YouTube 動画を使用することは利用規約に違反する可能性があると非難した。 発売まであと数か月。モハン氏は具体的な証拠がないことを認めているものの、そのような使用は明らかにYouTubeのルールに違反することになると強調している。
この告発は、AIモデルをトレーニングするためのデータの倫理的な調達に関する議論が高まる中で出た。 OpenAIはSoraの特定のトレーニングデータソースについては口を閉ざし続けているが、企業はAIの進歩を促進するために可能な限り多くのコンテンツを収集するために競争している。両氏は現在、AI の分野でトップに立っている。
クリエイターの観点から見ると、クリエイターが一生懸命作った作品を私たちのプラットフォームにアップロードするとき、彼らは一定の期待を持っています。その期待の 1 つは、利用規約が遵守されることです。トランスクリプトやビデオビットなどのダウンロードは許可されておらず、これは明らかな利用規約違反です。これらは、当社のプラットフォーム上のコンテンツに関する交通ルールです。
モハン氏は、Google が独自の AI モデル Gemini をトレーニングする際には、YouTube 動画を使用する前にクリエイターとの個別の契約を遵守すると公衆に保証します。それはまったく偽善的ですよね?これは、データ使用に関する Google の姿勢に疑問を生じさせます。Google は競合他社に関してはクリエイターを保護していますが、自社の利益のために同様の戦術を利用しています。
Barry Schwartz はそれを正しく要約しています:
これは、Google が Gemini のように LLM をトレーニングする方法です。 Web サイト、記事、書籍、その他のコンテンツからデータを収集します。複雑なアルゴリズムがデータを分析して、言語の理解を向上させます。これにより、AI モデルは言語のより正確な翻訳、クリエイティブなテキストの生成、質問への回答などのタスクを実行できます。
OpenAIが本当にYouTubeコンテンツをスクレイピングしていたのかどうかはまだ分からないが、この状況はGoogleのエコシステム内の潜在的な二重基準を露呈している。
その他 こちら.
ユーザーフォーラム
0メッセージ