הכירו את Sora, מודל הטקסט לווידאו החדש של OpenAI שיוצר סרטוני HD מדהימים המבוססים על הנחיות טקסט

זו לא שאלה של "האם אנחנו יכולים לעשות את זה", אלא "האם עלינו לעשות את זה".

עמוד הבית » חֲדָשׁוֹת

2 דקות לקרוא

פורסם ב פברואר 16, 2024

by רפלי גילנג

פורסם ב פברואר 16, 2024

קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו.

הערות עיקריות

OpenAI הכריזה זה עתה על דגם AI חדש של טקסט לווידאו, Sora, והוא נראה מרשים אך מפחיד בו זמנית.
אנשים מודאגים כעת אם המודל הזה ישתלט על מקום עבודתם.
המודל ישא מטא נתונים של C2PA לאחר יישום במוצר OpenAI בעתיד.

OpenAI הכריזה זה עתה על מודל AI חדש של טקסט לווידאו, סורה, וזה נראה מרשים. הנחת היסוד של זה נראית די פשוטה, אך יוצאת דופן: אתה יכול להקליד כל הנחיה למילה, מפורטת ככל שתרצה, ואז מודל הבינה המלאכותית יחזור עם סרטון מפורט מאוד של 60 שניות.

תסתכל על כמה מהתוצאות שסורה יכולה לעשות:

הנחיה: "כמה ממותות צמר ענקיות מתקרבות לדרוך באחו מושלג, פרוותן הצמרית הארוכה נושבת קלות ברוח בזמן שהן הולכות, עצים מכוסי שלג והרים מכוסי שלג דרמטיים מרחוק, אור אמצע אחר הצהריים עם עננים צמריריים ושמש גבוהה בפנים המרחק… pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) פברואר 15, 2024

הנחיה: "טריילר לסרט המציג את הרפתקאותיו של איש החלל בן ה-30, חובש קסדת אופנוע סרוגה מצמר אדום, שמיים כחולים, מדבר מלח, סגנון קולנועי, צולם על סרט 35 מ"מ, צבעים חיים." pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) פברואר 15, 2024

הנחיה: "עולם נייר מעובד להפליא של שונית אלמוגים, משופע בדגים ויצורי ים צבעוניים." pic.twitter.com/gzEE8SwP81
- OpenAI (@OpenAI) פברואר 15, 2024

הנחיה: "סצינת אנימציה כוללת תקריב של מפלצת קצרה ורכה כורעת ליד נר אדום נמס. סגנון האמנות הוא תלת מימדי ומציאותי, עם דגש על תאורה ומרקם. מצב הרוח של הציור הוא של פליאה וסקרנות, כשהמפלצת מביטה בלהבה עם... pic.twitter.com/aLMgJPI0y6
- OpenAI (@OpenAI) פברואר 15, 2024

זה באמת מפחיד ומרשים בו זמנית. התגובה הציבורית אליו היא שילוב של יראת כבוד ואזעקה, במיוחד בהתחשב חוקי העבר של OpenAI מחלוקות עם חברות עיתונאיות בגין שימוש לכאורה בכתבות שלהן כדי להכשיר את הדוגמנית ללא הסכמתן.

וצריך לדבר גם על משרות פוטנציאליות שאפשר להחליף. אפילו הבוס של OpenAI, סם אלטמן עצמו, שפעם הודח מהתפקיד, אמר שהקצב של מחקר הבינה המלאכותית שלנו היה מתקדם מהר מדי וכמות ההסתגלות שהמין האנושי צריך לעשות היא מדאיגה.

מודל זה מתבסס על מחקר DALL-E ו-GPT בעבר, תוך שימוש בשיטת ה-Recaption הייחודית של DALL-E 3 ליצירת כיתובים תיאוריים במיוחד עבור נתוני האימון החזותי. למרות זאת, הוא עדיין מתמודד עם אתגרים בסימולציה ריאלית של סצנות מורכבות, הבנת קשרי סיבה ותוצאה, ולא בלבול פרטים מרחביים של הנחיה.

כאשר מיושם במוצר OpenAI בעתיד, יהיה זה ChatGPT, הצעה חדשה או Copilot, המודל ישא מטא נתונים של C2PA, בדומה למה שמיקרוסופט עשתה על Image Creator מבית Designer. בדיקות טקסט ותמונה שומרות על מוצרי OpenAI מפני תוכן מזיק כמו אלימות, דברי שטנה והפרת IP.

"אנחנו גם מעניקים גישה למספר אמנים חזותיים, מעצבים ויוצרי סרטים כדי לקבל משוב כיצד לקדם את המודל כדי להיות מועיל ביותר לאנשי מקצוע יצירתיים", אומר OpenAI.

רפלי גילנג

כתב טכנולוגיה

רפלי הוא כתב בעל ניסיון עיתונאי של שנים, החל מטכנולוגיה, עסקים, חברתי ותרבות. כרגע מדווח על חדשות על מוצרים הקשורים למיקרוסופט, טכנולוגיה ובינה מלאכותית ב-Windows Report ו-MSPowerUser. יש לך טיפ? שלח את זה ל [מוגן בדוא"ל].