באפריל, סטארט-אפ מניו יורק בשם Runway AI חשף טכנולוגיה שמאפשרת לאנשים לייצר סרטוני וידאו על ידי הקלדת משפט אחד, למשל פרה במסיבת יום הולדת או כלב שמפטפט בסמארטפון.
הסרטונים בני ארבע השניות היו מטושטשים, מקוטעים, מעוותים ומטרידים, אך הם היו איתות ברור לכך שטכנולוגיות בינה מלאכותית (AI) הולכות לייצר סרטונים יותר ויותר משכנעים בחודשים ובשנים הבאים.
כעבור 10 חודשים בלבד, הסטראט אפ OpenAI מסן פרנסיסקו חשף מערכת דומה, שיוצרת סרטונים שנראים כאילו נלקחו הישר מתוך סרט הוליוודי. ההדגמה כללה סרטונים קצרים שנוצרו בתוך דקות ספורות של ממותות שעירות מתהלכות בשלג, מפלצת מביטה בנר שנמס ורחובות טוקיו שנדמה כי צולמו על ידי רחפן.
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024
OpenAI, החברה שמאחורי הצ'אטבוט ChatGPT ומחולל התמונות DALL-E, היא אחת מבין חברות רבות שמתחרות בשיפור מחוללי סרטונים מיידיים מסוג זה, בהן Runway וענקיות הייטק כמו גוגל ומטא, החברה האם של פייסבוק ואינסטגרם. הטכנולוגיה עשויה לזרז את תהליך העבודה של קולנוענים ולתפוס את מקומם של אמנים דיגיטליים פחות מנוסים.
היא גם עשויה להפוך לדרך מהירה וזולה ליצירת מידע מסולף המופץ ברשת, ובכך להקשות עוד יותר על ההבדלה בין אמיתי לבין לא-אמיתי באינטרנט.
"אני מבועת לחלוטין מכך שדבר כזה יוכל להטות תוצאות של בחירות צמודות", אומר פרופ' אורן עציוני מאוניברסיטת וושינגטון, אשר מתמחה בבינה מלאכותית. הוא גם המייסד של True Media, ארגון שלא למטרות רווח שמנסה לזהות מידע כוזב המופץ ברשת במסגרת קמפיינים פוליטיים.
OpenAI מכנה את המערכת החדשה בשם סורה (Sora), המילה היפנית ל"שמיים". הצוות שעומד מאחורי הטכנולוגיה, הכולל את החוקרים טים ברוקס וביל פיבלס, בחרו בשם זה בגלל שהוא "מעורר רעיון של פוטנציאל יצירתי ללא גבול".
הם אמרו כי החברה עדיין לא פותחת את סורה בפני הציבור הרחב, מכיוון שהיא עמלה על הבנת הסיכונים הטמונים במערכת. במקום זאת, OpenAI חולקת את הטכנולוגיה עם קבוצה מצומצמת של אנשי אקדמיה וחוקרים חיצוניים אחרים, שתפקידם יהיה לבחון באלו דרכים עלול להיעשות בה שימוש לא ראוי.
"הכוונה היא לתת תצוגה מקדימה של מה שנמצא באופק, כדי שאנשים יוכלו לראות את היכולות של טכנולוגיה זו – ואנחנו נוכל לקבל משוב", אמר ד"ר ברוקס.
OpenAI מתייגת סרטונים שנוצרו על ידי המערכת עם סימני מים שמזהים אותם ככאלה שנוצרו על ידי בינה מלאכותית, אך החברה מודה כי ניתן להסיר אותם, ולעתים קשה לראות אותם.
המערכת היא דוגמה של בינה מלאכותית יוצרת (Generative AI), אשר יכולה לייצר באופן מיידי טקסטים, תמונות וקולות. כמו טכנולוגיות בינה מלאכותית יוצרת אחרות, המערכת של OpenAI לומדת על ידי ניתוח מידע דיגיטלי – במקרה זה, סרטונים והסברים כתובים של מה הסרטונים הללו כוללים.
OpenAI סירבה לומר מה מספר הסרטים שמהם למדה המערכת או מה המקור שלהם, ורק ציינה כי הלימוד כלל הן סרטים הזמינים לציבור הרחב והן סרטים שבהם נעשה שימוש באישור בעלי זכויות היוצרים. החברה חשפה מעט מאוד פרטים על המידע ששימש לאימון הטכנולוגיות שלה, ככל הנראה מכיוון שהיא רוצה לשמור על יתרון על פני המתחרות – וגם כי כבר נתבעה מספר פעמים בגין שימוש בחומרים המוגנים הזכויות יוצרים.
סורה יוצרת סרטונים בתגובה לתיאורים קצרים, כמו "דגמי נייר של שונית אלמוגים שופעת דגים ויצורי ים ססגוניים". הסרטונים יכולים להיות מרשימים, אך הם לא תמיד מושלמים ועשויים לכלול תמונות מוזרות ובלתי הגיוניות. כך למשל, המערכת יצרה לאחרונה סרטון של מישהו אוכל עוגייה – אבל העוגייה נשארה באותו הגודל.
מחוללי תמונות כמו DALL-E, מידג'רני (Midjourney) ואחרים השתפרו כל כך מהר בשנים האחרונות עד שהם יוצרים כיום תמונות שכמעט בלתי ניתן להבדיל בינן לבין צילומים. דבר זה מקשה על זיהוי מידע כוזב באינטרנט, ואמנים דיגיטליים רבים מתלוננים על כך שהם מתקשים יותר למצוא עבודה.
"כולנו צחקנו ב-2022 כשמידג'רני יצא בפעם הראשונה ואמרנו, 'הו, זה חמוד'," אמר ריד סאותן, אמן קונספט ממדינת מישיגן. "עכשיו אנשים מאבדים את המשרות שלהם למידג'רני".


