KI-Entwicklungen im vergangenen Jahr

Rohrkrepierer und neue Freunde

Wer braucht da noch Freunde und Kinder? KI hat 2023 das Kommunizieren auf menschlichem Level gelernt
Foto: Pexels / ThisIsEngineering

Wer braucht da noch Freunde und Kinder? KI hat 2023 das Kommunizieren auf menschlichem Level gelernt

2023 hat generative KI riesige Fortschritte gemacht, andere Technik-Versprechen haben dagegen eine Bruchlandung erlebt. Wo geht die Entwicklung hin - und welche politischen Fragen wirft das auf? Unser Kolumnist wagt eine Prognose

Das Jahr 2023 ging direkt mit dem dominanten Thema los: Generative KI wie ChatGPT, Midjourney und Stable Diffusion bestimmten die Diskurse der ersten Monate, und das Thema spukte wie ein Schreckgespenst durch die Straßen. Viele Berufszweige fragen sich gar nicht mehr, ob sie durch Algorithmen ersetzt werden können, sondern nur noch wann. 

In vielen Medien gibt es immer mehr maschinell generierte Bilder zu sehen. Zeitungen, Magazine und Blogs nutzen KI-Illustrationen häufig als Artikelteaser. Aber es werden auch Musikvideos und andere Videoformate mit bewegten KI-Visuals bebildert. Sogar bei einem Konzert des Wu-Tang Clan habe ich zappelig-psychedelische Gangster-Clips gesehen. 

Viele haben diese überzeichnete und glossy Ästhetik von Midjourney mittlerweile schon wieder über. So wie bei Diddl und Terrakottawandfarbe mit Schwammtechnik habe ich mich an den "typischen", polierten und doch fehlerhaften KI-Bildern satt gesehen. Es ist halt nicht alles sofort Kunst, nur weil eine Maschine perfekt malen kann. Eine nicht ganz unwichtige Erkenntnis, wie ich finde. 

Ein Job, der sich selber abschafft

Kürzlich sah ich eine Stellenanzeige der Funke Mediengruppe für einen Job mit der Bezeichnung "Redakteur:in KI". Man hätte meinen können, dass das Medienhaus ein Ressort für das Themengebiet aufbaut. Es wurde indes eine Person gesucht, die redaktionellen Content und Texte mit Hilfe von ChatGPT und Ähnlichem erstellt. Ein Job, der sich quasi selber abschafft – könnte nicht so einfach werden mit den neuen Kolleginnen und Kollegen in der Redaktion. 

Die Beatles haben dank KI den allerletzten Song ihrer Bandgeschichte veröffentlicht. "Now and Then" basiert auf einer Demo-Aufnahme von John Lennon am Klavier. Erst jetzt, 50 Jahre nach der ursprünglichen Aufnahme, konnte mithilfe von KI-Software die Stimme vom Piano so sauber getrennt werden, dass die restlichen Spuren dazu aufnehmbar wurden. Eine musikalisch wirklich berührende und großartige Produktion, die zeigt, wie KI besonders schön in der Kunst zum Einsatz kommt: als Werkzeug. 

In der Zwischenzeit ist viel passiert. Wie wir in Zukunft mit KI interagieren sollen, hat vor wenigen Wochen Google vorgestellt. Gemini ist der Name der multimodalen KI, die nicht nur mit Text, sondern auch mit Bildern, Sprache, Code und Sound interagieren kann. Gemini erkennt unter anderem Zeichnungen, ist humorvoll und kann sogar Brettspiele erfinden. Google hegt große Ambitionen, Marktführer im Sektor KI zu werden. Vorteil für den Konzern sind die zahlreichen hauseigenen Angebote wie Maps, Mail, Browser, YouTube, Google Docs und Drive, die allesamt durch Gemini verknüpft werden können.


Natürlich handelt es sich um ein Promo-Video, und man wird abwarten müssen, wie so ein System im Alltag läuft, vor allem auf welcher Hardware. Mich hat das Video dennoch staunend zurückgelassen. Man möchte fragen: Wer braucht da in 30 Jahren noch Freunde oder Kinder? Eine seltsame Vorstellung. 

Apropos Dystopie: Teslas gruseliger Cybertruck wurde vier Jahre nach seiner Vorstellung dieses Jahr ausgeliefert. Allerdings 20.000 Dollar teurer als noch 2019 angekündigt, und auch die versprochene Reichweite von 800 Kilometern wurde auf 550 nach unten korrigiert. Dafür kann der Truck seine 3,1 Tonnen in 2,7 Sekunden von 0 auf 100 km/h beschleunigen. Rette sich, wer kann. Die Tesla-Webseite bewirbt den Cybertruck mit dem Slogan "Für jeden Planeten gebaut". Da weiß Elon Musk doch schon wieder mehr als wir. Eröffnet Tesla demnächst eine Niederlassung auf dem Mars? Wie schon gesagt, ziemlich dystopisch. 

Die Mobilität der Zukunft versprach einige Jahre lang Hyperloop, das Hochgeschwindigkeitsverkehrssystem, das Elon Musk 2013 der Öffentlichkeit vorstellte. Nicht so gut lief es dieses Jahr für das führende Unternehmen in diesem Segment. Die Firma Hyperloop One wird zum Jahresende geschlossen. Ist die Idee ein Rohrkrepierer? Das Unternehmen wechselte einige Male den Besitzer. Zwischen 2017 und 2022 fungierte es als Virgin Hyperloop One unter der Leitung von Richard Branson. Der jetzige Hauptinvestor heißt DP World und ist Betreiber des Hafens in Dubai. Zuletzt konzentrierte man sich ohnehin nur noch auf den Frachttransport, da es für den Personentransport zu große Sicherheitsbedenken gab. 

Deutschlandtakt im Jahr 2070

Der Traum, unterirdisch knapp unter Schallgeschwindigkeit zu reisen (Berlin-Hamburg in 20 Minuten), hat sich also vorerst ausgeträumt. Das Konzept ist zwar nicht vom Tisch, aber wie bei der Magnetschwebebahn dürfte ein Revival eher unwahrscheinlich sein. So gesehen könnte der Deutschlandtakt, geplant für 2070, wohl doch noch zum wohlverdienten Einsatz kommen. 

Nicht zuletzt dürfte 2023 ein gutes Jahr für das Dauerbrenner-Thema VR/AR/XR gewesen sein. Dafür verantwortlich sind zum einen das Virtual-Reality-Set PlayStation VR2 für die Konsole PS5 und zum anderen Apples Vision Pro. PlayStation VR2 dürfte langfristig virtuelle Realität für Spiele endlich salonfähig machen. Vision Pro wird 2024 erhältlich sein und von Entwickler:innen und Apple-Fans sehnlichst erwartet. Schon rudimentäre Funktionen wie das Aufnehmen von Spatial Video auf dem Smartphone und Abspielen auf dem 3500 Euro teuren Device sollen ziemlich beeindruckend sein. 

Welche generativen Künstlichen Intelligenzen werden uns nächstes Jahr überraschen? Es gibt heute bereits smartes Kinderspielzeug, das KI-generierte Geschichten vorliest, nachdem man Stichpunkte wie "Martha, Einhorn, Triceratops, Pokémon" eingegeben hat. Personalisiert und immer wieder neu. Demnächst vielleicht auch mit der Stimme von Mama und Papa. 

Wie viel dürfen Microsoft und Google denn noch über uns wissen?

Es werden immer mehr Plattformen, Produktkategorien und Ebenen von generativer KI beeinflusst und gesteuert werden. Die kommenden Fragen sind daher vor allem politischer und gesellschaftlicher Natur. Wie viel dürfen Microsoft und Google denn noch über uns wissen? Wem gehört das Wissen auf den Datenbanken? Aktuell verklagt die "New York Times" Microsoft und Open AI. Für das Training von ChatGPT sollen Millionen von "NYT"-Artikeln benutzt worden sein. 

Welche Rolle werden generative KI bei den großen Wahlkämpfen in den USA spielen? Nächstes Jahr stehen Landtagswahlen in Sachsen, Thüringen und Brandenburg an. Auch die AfD hetzte dieses Jahr schon mit KI-Bildern gegen Geflüchtete. Zu Deepfakes und anderen Tricks ist es dann nicht mehr weit.