הכירו את Sora, מודל הטקסט לווידאו החדש של OpenAI שיוצר סרטוני HD מדהימים המבוססים על הנחיות טקסט

זו לא שאלה של "האם אנחנו יכולים לעשות את זה", אלא "האם עלינו לעשות את זה".

סמל זמן קריאה 2 דקות לקרוא


קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו. סמל טיפים

קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קראו עוד

הערות עיקריות

  • OpenAI הכריזה זה עתה על דגם AI חדש של טקסט לווידאו, Sora, והוא נראה מרשים אך מפחיד בו זמנית.
  • אנשים מודאגים כעת אם המודל הזה ישתלט על מקום עבודתם.
  • המודל ישא מטא נתונים של C2PA לאחר יישום במוצר OpenAI בעתיד.

OpenAI הכריזה זה עתה על מודל AI חדש של טקסט לווידאו, סורה, וזה נראה מרשים. הנחת היסוד של זה נראית די פשוטה, אך יוצאת דופן: אתה יכול להקליד כל הנחיה למילה, מפורטת ככל שתרצה, ואז מודל הבינה המלאכותית יחזור עם סרטון מפורט מאוד של 60 שניות. 

תסתכל על כמה מהתוצאות שסורה יכולה לעשות:

זה באמת מפחיד ומרשים בו זמנית. התגובה הציבורית אליו היא שילוב של יראת כבוד ואזעקה, במיוחד בהתחשב חוקי העבר של OpenAI מחלוקות עם חברות עיתונאיות בגין שימוש לכאורה בכתבות שלהן כדי להכשיר את הדוגמנית ללא הסכמתן.

וצריך לדבר גם על משרות פוטנציאליות שאפשר להחליף. אפילו הבוס של OpenAI, סם אלטמן עצמו, שפעם הודח מהתפקיד, אמר שהקצב של מחקר הבינה המלאכותית שלנו היה מתקדם מהר מדי וכמות ההסתגלות שהמין האנושי צריך לעשות היא מדאיגה.

מודל זה מתבסס על מחקר DALL-E ו-GPT בעבר, תוך שימוש בשיטת ה-Recaption הייחודית של DALL-E 3 ליצירת כיתובים תיאוריים במיוחד עבור נתוני האימון החזותי. למרות זאת, הוא עדיין מתמודד עם אתגרים בסימולציה ריאלית של סצנות מורכבות, הבנת קשרי סיבה ותוצאה, ולא בלבול פרטים מרחביים של הנחיה.

כאשר מיושם במוצר OpenAI בעתיד, יהיה זה ChatGPT, הצעה חדשה או Copilot, המודל ישא מטא נתונים של C2PA, בדומה למה שמיקרוסופט עשתה על Image Creator מבית Designer. בדיקות טקסט ותמונה שומרות על מוצרי OpenAI מפני תוכן מזיק כמו אלימות, דברי שטנה והפרת IP.

"אנחנו גם מעניקים גישה למספר אמנים חזותיים, מעצבים ויוצרי סרטים כדי לקבל משוב כיצד לקדם את המודל כדי להיות מועיל ביותר לאנשי מקצוע יצירתיים", אומר OpenAI.