KI-Videogenerator

OpenAI Sora: KI-Videogenerator soll bald verfügbar sein

Nach ChatGPT und Dall-E erscheint demnächst Sora - ein Text-zu-Video-Werk­zeug, das Daten unter anderem aus sozialen Netz­werken bezieht.
Von

Vergan­genen Monat hat OpenAI, die Firma hinter ChatGPT, seinen Text-zu-Video-Gene­rator Sora vorge­stellt, nun wurde eine Verfüg­bar­keit in naher Zukunft kommu­niziert. Es handelt sich um den nächsten logi­schen Schritt gene­rativer Künst­lichen Intel­ligenz, der auf den Text-zu-Bild-Gene­rator Dall-E vom selben Entwick­lers­tudio folgt.

Einen genauen Veröf­fent­lichungs­termin wollte die tech­nische Direk­torin zwar nicht nennen, sie grenzte den Zeit­raum aber auf ein paar Monate ein. Die Inhalte werden durch Mate­rial von Part­nern und öffent­lich verfüg­barem Mate­rial, beispiels­weise aus sozialen Netz­werken, kreiert.

OpenAI Sora wird noch dieses Jahr starten

Sora soll eine hohe Qualität haben Sora soll eine hohe Qualität haben
Bild: OpenAI
Mit der gene­rativen KI ChatGPT legte OpenAI den Grund­stein für den aktu­ellen Hype um Künst­liche Intel­ligenz. Vor drei Jahren erwei­terte das nord­ame­rika­nische Unter­nehmen sein Port­folio um Dall-E. Das ist ein Tool, das über die Eingabe von Begriffen Bilder erstellen kann. Es folgten diverse Wett­bewerber mit ähnli­chen Konzepten. Aus Texten Videos kreieren zu lassen ist der nächste große Schritt. Manche Anbieter werben bereits mit solch einer Lösung. Ausge­reift wirken diese Produkte aller­dings noch nicht. Sora, wie OpenAI sein Text-zu-Video-Werk­zeug nennt, könnte einen höheren Quali­täts­stan­dard einführen.

Bei xda-deve­lopers wurden wir auf einen Artikel des Wall Street Journal aufmerksam. In jenem äußert sich Mira Murati, die tech­nische Direk­torin (CTO) von OpenAI, über das kommende Projekt. In ein paar Monaten soll Sora zur Verfü­gung stehen. Derzeit sei das Tool noch sehr teuer in der Ausfüh­rung, man möchte die Anwen­dung aber so weit opti­mieren, dass sich Preise ähnlich jenen von Dall-E 3 reali­sieren lassen. Ein Bild in Dall-E 3 kostet in Stan­dard­qua­lität mindes­tens vier US-Cent und in HD-Qualität mindes­tens acht US-Cent.

Mit diesen Daten wird Sora trai­niert

Um best­mög­liche Ergeb­nisse zu erzielen, muss eine gene­rative KI mit umfas­senden Daten gefüt­tert werden. Woher stammen jene von Sora? Murati erklärt, dass man das Mate­rial von Part­nern wie Shut­ter­stock entnimmt. Des Weiteren bediene sich Sora aus öffent­lich verfüg­baren Inhalten. Dazu zählen auch Beiträge aus sozialen Netz­werken.

Die Führungs­kraft wollte sich nicht weiter dazu äußern, ob und in welchem Umfang Videos aus Face­book, Insta­gram und Co. als Infor­mati­ons­quelle für das Text-zu-Video-Verfahren Verwen­dung finden. Neue Features wie eine Verto­nung werden Sora in Zukunft ergänzen.

Mitt­ler­weile soll KI Tests durch Menschen bereits erkennen können.

Mehr zum Thema ChatGPT