Lernen Sie Sora kennen, das neue Text-zu-Video-Modell von OpenAI, das atemberaubende HD-Videos basierend auf Textaufforderungen erstellt

Es geht nicht um die Frage: „Können wir es schaffen?“, sondern um die Frage: „Sollten wir es tun?“

Startseite » News

2 Minute. lesen

Veröffentlicht am 16. Februar 2024

by Rafly Gilang

Veröffentlicht am 16. Februar 2024

Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen.

Wichtige Hinweise

OpenAI hat gerade ein neues Text-zu-Video-KI-Modell namens Sora angekündigt, das beeindruckend und gleichzeitig beängstigend aussieht.
Die Menschen sind nun besorgt, ob dieses Modell ihre Jobs übernehmen wird.
Das Modell wird C2PA-Metadaten übertragen, sobald es in Zukunft in einem OpenAI-Produkt implementiert wird.

OpenAI hat gerade ein neues Text-zu-Video-KI-Modell angekündigt. Sora, und es sieht beeindruckend aus. Die Prämisse sieht ziemlich einfach und dennoch bemerkenswert aus: Sie können beliebige Wortaufforderungen eintippen, so detailliert Sie möchten, und dann kommt das KI-Modell mit einem 60 Sekunden langen, sehr detaillierten Video zurück.

Schauen Sie sich einige der Ergebnisse an, die Sora erzielen konnte:

Aufforderung: „Mehrere riesige Wollhaarmammuts nähern sich durch eine verschneite Wiese, ihr langes Wollfell weht beim Gehen leicht im Wind, schneebedeckte Bäume und dramatische schneebedeckte Berge in der Ferne, Nachmittagslicht mit dünnen Wolken und einer hohen Sonne die Distanz… pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) 15. Februar 2024

Aufforderung: „Ein Filmtrailer mit den Abenteuern des 30-jährigen Weltraummanns, der einen gestrickten Motorradhelm aus roter Wolle trägt, blauer Himmel, Salzwüste, filmischer Stil, aufgenommen auf 35-mm-Film, lebendige Farben.“ pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) 15. Februar 2024

Aufforderung: „Eine wunderschön gestaltete Papierwelt eines Korallenriffs voller bunter Fische und Meeresbewohner.“ pic.twitter.com/gzEE8SwP81
- OpenAI (@OpenAI) 15. Februar 2024

Eingabeaufforderung: „Die animierte Szene zeigt eine Nahaufnahme eines kleinen, flauschigen Monsters, das neben einer schmelzenden roten Kerze kniet. Der Kunststil ist dreidimensional und realistisch, wobei der Schwerpunkt auf Beleuchtung und Textur liegt. Die Stimmung des Gemäldes ist von Staunen und Neugier geprägt, während das Monster mit ... auf die Flamme blickt. pic.twitter.com/aLMgJPI0y6
- OpenAI (@OpenAI) 15. Februar 2024

Das ist ehrlich gesagt beängstigend und beeindruckend zugleich. Die öffentliche Reaktion darauf ist eine Mischung aus Ehrfurcht und Besorgnis, vor allem wenn man bedenkt Die Vergangenheit von OpenAI ist legal Streitigkeiten mit journalistischen Unternehmen wegen angeblicher Verwendung ihrer Artikel zum Trainieren des Models ohne deren Zustimmung.

Und wir müssen auch über potenzielle Arbeitsplätze reden, die ersetzt werden könnten. Sogar OpenAI-Chef Sam Altman selbst, der einst seines Amtes enthoben wurde, sagte, dass das Tempo unserer KI-Forschung gewesen sei geht viel zu schnell voran und das Ausmaß der Anpassung, die die Menschheit vornehmen muss, ist alarmierend.

Dieses Modell baut auf früheren DALL-E- und GPT-Forschungen auf und nutzt die einzigartige Recaptioning-Methode von DALL-E 3, um äußerst aussagekräftige Beschriftungen für die visuellen Trainingsdaten zu generieren. Jedoch, es steht immer noch vor Herausforderungen darin, komplexe Szenen realistisch zu simulieren, Ursache-Wirkungs-Beziehungen zu verstehen und räumliche Details einer Aufforderung nicht zu verwechseln.

Bei der Implementierung in einem OpenAI-Produkt in der Zukunft, sei es ChatGPT, ein neues Angebot oder Copilot, wird das Modell C2PA-Metadaten übertragen, ähnlich wie es Microsoft bisher getan hat Bildersteller von Designer. Text- und Bildprüfungen schützen OpenAI-Produkte vor schädlichen Inhalten wie Gewalt, Hassreden und Urheberrechtsverletzungen.

„Wir gewähren außerdem Zugang zu einer Reihe von bildenden Künstlern, Designern und Filmemachern, um Feedback zu erhalten, wie wir das Modell so weiterentwickeln können, dass es für Kreativprofis am hilfreichsten ist“, sagt OpenAI.

Rafly Gilang

Tech-Reporter

Rafly ist ein Reporter mit langjähriger journalistischer Erfahrung in den Bereichen Technologie, Wirtschaft, Soziales und Kultur. Wir berichten derzeit über Neuigkeiten zu Microsoft-bezogenen Produkten, Technologien und KI auf Windows Report und MSPowerUser. Hast du einen Tipp? Sende es zu [E-Mail geschützt] .