OpenAI Sora: KI-Videogenerator soll bald verfügbar sein
Vergangenen Monat hat OpenAI, die Firma hinter ChatGPT, seinen Text-zu-Video-Generator Sora vorgestellt, nun wurde eine Verfügbarkeit in naher Zukunft kommuniziert. Es handelt sich um den nächsten logischen Schritt generativer Künstlichen Intelligenz, der auf den Text-zu-Bild-Generator Dall-E vom selben Entwicklerstudio folgt.
Einen genauen Veröffentlichungstermin wollte die technische Direktorin zwar nicht nennen, sie grenzte den Zeitraum aber auf ein paar Monate ein. Die Inhalte werden durch Material von Partnern und öffentlich verfügbarem Material, beispielsweise aus sozialen Netzwerken, kreiert.
OpenAI Sora wird noch dieses Jahr starten
Sora soll eine hohe Qualität haben
Bild: OpenAI
Mit der generativen KI ChatGPT legte OpenAI den Grundstein für den aktuellen Hype um Künstliche Intelligenz. Vor drei Jahren erweiterte das nordamerikanische Unternehmen sein Portfolio um Dall-E. Das ist ein Tool, das über die Eingabe von Begriffen Bilder erstellen kann. Es folgten diverse Wettbewerber mit ähnlichen Konzepten. Aus Texten Videos kreieren zu lassen ist der nächste große Schritt. Manche Anbieter werben bereits mit solch einer Lösung. Ausgereift wirken diese Produkte allerdings noch nicht. Sora, wie OpenAI sein Text-zu-Video-Werkzeug nennt, könnte einen höheren Qualitätsstandard einführen.
Bei xda-developers wurden wir auf einen Artikel des Wall Street Journal aufmerksam. In jenem äußert sich Mira Murati, die technische Direktorin (CTO) von OpenAI, über das kommende Projekt. In ein paar Monaten soll Sora zur Verfügung stehen. Derzeit sei das Tool noch sehr teuer in der Ausführung, man möchte die Anwendung aber so weit optimieren, dass sich Preise ähnlich jenen von Dall-E 3 realisieren lassen. Ein Bild in Dall-E 3 kostet in Standardqualität mindestens vier US-Cent und in HD-Qualität mindestens acht US-Cent.
Mit diesen Daten wird Sora trainiert
Um bestmögliche Ergebnisse zu erzielen, muss eine generative KI mit umfassenden Daten gefüttert werden. Woher stammen jene von Sora? Murati erklärt, dass man das Material von Partnern wie Shutterstock entnimmt. Des Weiteren bediene sich Sora aus öffentlich verfügbaren Inhalten. Dazu zählen auch Beiträge aus sozialen Netzwerken.
Die Führungskraft wollte sich nicht weiter dazu äußern, ob und in welchem Umfang Videos aus Facebook, Instagram und Co. als Informationsquelle für das Text-zu-Video-Verfahren Verwendung finden. Neue Features wie eine Vertonung werden Sora in Zukunft ergänzen.
Mittlerweile soll KI Tests durch Menschen bereits erkennen können.