KI-Videogenerator Sora

Überrumpelt von träumenden Maschinen

Sora, erschaffe ein Video eines Rundgangs durch ein Museum mit vielen schönen Kunstwerken in verschiedenen Stilrichtungen!
Screenshot: Open AI

Sora, erschaffe ein Video eines Rundgangs durch ein Museum mit vielen schönen Kunstwerken in verschiedenen Stilrichtungen!

Das Unternehmen Open AI hat die generative Text-to-Video-KI Sora vorgestellt. Die Ergebnisse sind verblüffend und geben einen Vorgeschmack auf Umwälzungen, die wir nur in den Griff bekommen, wenn wir die Welt neu denken

Fangen wir mit einem vermeintlich sperrigen Vergleich an. Die Entwicklung von Künstlicher Intelligenz (KI) wird von der Menschheit ähnlich wahrgenommen wie der Klimawandel. Man hangelt sich von Hochwasser zu Hurrikan – aber das große Ganze im Blick zu behalten, sich über die eigentlichen Implikationen Gedanken zu machen, scheint oft unmöglich. Nachdem vor einem Jahr ChatGPT für einen großen Medienrummel sorgte, wurde es vermeintlich still um das Thema. Zum einen, weil es im Alltag vieler noch immer nicht integriert ist und zum anderen, weil viele das Thema nach ein paar Wochen auch einfach satt hatten. Manchmal oder zu oft hat die Gesellschaft die Aufmerksamkeitsspanne von Goldfischen.

Nun hat das Unternehmen Open AI, das auch die KIs DallE und ChatGPT veröffentlicht hat, einen neuen Coup gelandet, der wie ein Taifun in einigen Branchen für regelrechte Panik sorgt. Sora nennt sich die Video-KI, die beeindruckende Ergebnisse liefert und nicht nur mit Text-Prompts, sondern auch mit Bildern und Videos gefüttert werden kann.

Um kurz einzuordnen, wie schnell die Entwicklung von KI im Sektor Videoerstellung verlaufen ist, hier zwei Beispiele, die vor weniger als einem Jahr entstanden sind. Wir sehen einmal den Schauspieler Will Smith, der ein offenbar manisches Verhältnis zu Pasta pflegt und dann den Harry-Potter-Darsteller Daniel Radcliffe mit sehr viel Gras.

 


Sich diese psychedelischen, ja, alles andere als realistischen Videos anzugucken, ist unterhaltsam. Und ganz ähnlich wie in der Bildproduktion (Midjourney, Stable Diffusion), wo die Anfänge noch recht bescheiden waren, wähnten sich viele kreative Gewerke in Sicherheit. Was soll damit schon passieren? Wer braucht so etwas? Wie soll so etwas jemals gut werden?

Das ist in etwa so, wie wenn der Sommer verhältnismäßig kühl und verregnet ist und dafür der Februar 13 Grad hat. Klimawandel? Ist doch praktisch, wenn ich den Daunenparka zeitiger einmotten kann. Nun hat vergangene Woche Open AI erste Ergebnisse mit Sora präsentiert. Wie gesagt, kein Jahr liegt zwischen diesen KI-Videos. Dabei muss fairerweise gesagt werden, dass Sora noch nicht kommerziell verfügbar ist und auch noch nicht klar ist, in welcher Form die Plattform der Masse zugänglich gemacht wird. Auch weil man sich intern ganz offenbar über mögliche Gefahren und Missbrauchsszenarien bewusst ist.


Bislang sind die Längen der Clips auf eine Minute limitiert. Für einen Spielfilm reichen die Kapazitäten noch nicht aus. Darin liegt auch der Grund, wieso der CEO von Open AI, Sam Altman, derzeit versucht, Investoren zu finden, die ihm sieben Billionen (!) Dollar geben, um für diese Tasks ausgelegte Prozessorfarmen bauen zu können. Derart detaillierte Animationen zu erstellen, ist rechenintensiv.

Anders als in den ersten Beispielen, muss man aber nun die Fehler genau suchen. Manchmal verschwinden Details in den Filmen, und ein Problem bei Menschen sind die Hände, die oft verformt und unnatürlich aussehen. Es ist indes fast unmöglich geworden, auf den ersten Blick eindeutig zu bestimmen: Das ist KI. Und bisherige Sicherheitsvorkehrungen wie Wasserzeichen am unteren Rand lassen sich einfach umgehen, indem man nur ein bisschen in das Videomaterial reinzoomt oder die Ränder beschneidet. Es wundert nicht, dass in Fach-Communitys oder auf Plattformen wie Reddit eine Stimmung wie auf der Titanic herrscht. Ob Expert:innen für CGI, Drohnen, Kamera, 3D-Grafik, VFX, Animationen für Filme und Computerspiele, all diese Berufszweige stehen vorm Bankrott, so die einhellige Einschätzung. Geht es noch schlimmer als arbeitslos? Ja, wertlos.

Bereits beim "Writer’s Strike" im vergangenen Jahr in Hollywood ging es um den zersetzenden Einfluss von KI für Autorinnen und Autoren von Filmen und Serien. Kreative Stellen wurden massiv bei Netflix abgebaut und durch Machine-Learning-Fachkräfte ersetzt. Algorithmen erstellen akribische Formeln, welches Format, wann und wie erfolgreich sein kann. Die immensen Datenmassen hierfür produzieren wir mit jedem Stream selbst. Raum für positive Überraschungen bleibt hier kaum noch. Und nicht erst seit kurzem finden viele, dass die große Zeit epischer Serien wie "Breaking Bad", "Mad Men", "Sopranos" und "The Wire" ins popkulturelle Museum gewandert ist.

Die Welt neu denken

Wie in den Bereichen Text und Fotografie wird die Kunst zunächst weniger von diesen Entwicklungen affiziert sein. Es sind (mächtige) Wirtschaftszweige wie Stock-Videos und Werbung, die von KIs wie Sora - je nach Perspektive - profitieren oder betroffen sind. Wie aufwendig war bislang ein gut ausgeleuchteter Drohnen-Shot von der Amalfiküste und wie einfach ist es nun, mit wenigen Textbefehlen ein gleichwertiges Ergebnis zu bekommen! Und es dauert nur wenige Jahre wenn nicht Monate, bis fehlerhafte Hände oder seltsam anmutende Glitches ausgemerzt sein werden.

Die Fragen, die es zu stellen gilt, sind daher nicht: Wie können wir Arbeitsplätze retten? Oder: Wie können wir sicherstellen, dass Klausuren nicht mit ChatGPT geschrieben wurden? Womit wir zurück zum Vergleich mit dem Klimawandel kommen. Um diese Herausforderungen zu meistern, müssen wir die Welt neu denken. Dazu gehören Wirtschaft, Bildung, Medien, Rechtssprechung, Politik und Gesellschaft. 

Das ist überkomplex und überfordernd. Um zukünftig gefakte (Propaganda-)Videos in Presse und sozialen Medien zu entlarven, reichen keine Software-Programme, die darauf ausgelegt sind, Merkmale einer Fälschung zu finden. Das ist in etwa so, als würde man mit einer Fliegenklatsche eine hungrige Löwenherde verjagen. Oder, wie die FDP, den Klimawandel mit Wasserstoff-Luxuslimousinen bekämpfen. Die Zeiten, in denen Bilder und Videos für Authentizität und Wahrheit standen, sind schon lange vorbei. Sätze wie: "Ein Bild sagt mehr als tausend Worte" oder "Du warst nur da, wenn du ein TikTok davon gemacht hast" besitzen keine Aussagekraft.

Antworten müssen gefunden werden

Inwiefern KI-Videos von Sora auch Einfluss auf die zahlreichen Wahlen in diesem Jahr haben werden, ist ungewiss. Nicht nur, dass AfD und Donald Trump manipulative Filme für ihre populistischen Zwecke erstellen können. Auch lassen sich in Zeiten der Politik der Leugnung immer alle Vorwürfe von sich weisen. Eine Correctiv-Recherche in Potsdam wird zur gefälschten Lügenkampagne. Trump hat nie "Grab’em by the p …" gesagt. Der Ibiza-Skandal in Österreich, Überwachungskameras, die jemanden des Raubs, Vergewaltigung oder Mordes überführen, Handyvideos aus Kriegsgebieten – das alles wird ab jetzt eine KI gewesen sein, bis man das Gegenteil bewiesen hat. 

Aber wie soll das gehen? Antworten gibt es kaum, aber es muss klar sein, dass genau diese schnell gefunden werden müssen, sonst werden verlorene Arbeitsplätze und sterbende Wirtschaftszweige das kleinste Problem sein.