KI Video Tools – Sora, Runway & Co.

Im Februar hat die ChatGPT-Firma OpenAI einen KI Video Generator vorgestellt, der viele sprachlos macht: Sora. Längst hatten wir uns alle daran gewöhnt, dass wir einer Text-KI einen Prompt (Anweisung) liefern und sie uns in Sekundenschnelle Social Media Texte, Bewerbungsschreiben oder glutenfreie Rezepte ausspuckt. Mit Sora soll das Gleiche nun mit Videos möglich sein.  

Runway ML bietet all das bereits für kürzere Videosequenzen. Und schon Ende des Jahres will Bild-AI-Generator Midjourney mit einem ähnlich viel versprechenden Tool wie Sora herauskommen. AI-Begeisterte und Skeptiker sind gleichermaßen aus dem Häuschen: Was bedeuten die KI Video Tools  für Video Marketing? Was bedeuten sie für Kreative und Filmschaffende? Und: Was bedeuten sie für die Glaubwürdigkeit von Nachrichten? 

SORA - WAS HEUTE ÜBER DAS KI VIDEO TOOL VON OPENAI BEKANNT IST

Video-Snippets von wenigen Sekunden und mittlerer Qualität kennen wir bereits von verschiedenen KI Video Tools, am vielversprechendsten sind dabei die 16-sekündigen Videos von Runway ML, wobei diese eine weniger starke mediale Welle verursachten. 

Die Vorschauvideos des KI Video Generator Sora jedoch haben seit Februar in Rekordgeschwindigkeit das Staunen der ganzen Welt auf sich gezogen. Sora kreiert realistisch wirkende Videos von einer Maximallänge von einer Minute und überzeugt in den bisher veröffentlichten Videos durch eine hohe visuelle Qualität und eine Umsetzung, die sehr nah an der Nutzer-Anweisung liegt.  

Die Videos zeigen fotorealistische Mammuts, die durch eine Schneelandschaft stampfen, Astronauten auf Entdeckungstour, eine amerikanische Goldgräberstadt aus dem 19. Jahrhundert oder einfach eine schlafende Frau, die von ihrer Katze genervt wird. All diese Szenen sehen so echt aus, als wären sie real gedreht worden, aufwendig in Studios inszeniert oder mit dem Know-how der besten VFX-Artists erzeugt worden. Doch die Quelle ist: Eine künstliche Intelligenz. All das, wofür früher Millionen-Budgets nötig gewesen wären, also bald im Handumdrehen mit KI Video Tools erzeugt? 

Sora wurde beigebracht, nicht nur die Prompts der Nutzer fehlerfrei zu verstehen, sondern sie auch mit dem abzugleichen, wie diese Anweisungen in der realen Welt existieren und filmisch umgesetzt werden. Mithilfe einer Diffusionsmodell-Technologie und Transformer-Architektur kann das KI Video Tool aus kleinen Datenpaketen Bewegtbilder erzeugen. 

Wann genau Sora für die breite Öffentlichkeit released werden wird, ist noch unklar. Aktuell hat OpenAI eine Sora Test-Version zu Optimierungszwecken für eine Auswahl von Sicherheitsforschern und Kunstschaffenden wie Motion Artists, Designer, Kameraleute oder Cutter freigegeben. Auch von Midjourney hört man, dass sie an einem ähnlich bahnbrechenden KI Video Generator arbeiten.  

Es gibt bereits spannende Sora Alternativen, die kürzere Videosequenzen ebenfalls in beeindruckender Qualität generieren. 

 

Diese SORA ALTERNATIVEN KI Video Tools sollten Sie im Blick behalten

  • Runway ML (Gen-2): Große Konkurrenz zu Sora, aktuell nur 16-sekündige Videos 
  • Stable Video Diffusion: Ebenfalls hochwertige Realbild-Videos, max. 5 Sekunden 
  • Morph Studio AI: Soll Clips von Stable Video Diffusion zu ganzen Filmen zusammenfügen können 

Auch im Bereich Video Tutorial, Erklärvideo und Schulungsvideo gibt es inzwischen diverse KI-Anbieter. Keiner von Ihnen bietet bisher eine Alternative zu professionell konzipierten und produzierten Videos, die wir weiterempfehlen würden.

Für interne Zwecke und bei niedrigem Budget können sie eingesetzt werden, jedoch sollte man gerade bei Produktvideos immer bedenken, dass ein schlechtes Video dem Produktimage eher Schaden zufügen kann, als dass es nutzt.

Dennoch listen wir ein paar Tools hier auf, da sie spannend sind, im Auge zu behalten. Wir gehen auch hier davon aus, dass sich in den nächsten Jahren einiges tun wird:

  • Synthesia: Animierte Avatare für Schulungsvideos, Qualität noch mittelmäßig, aber Wert im Auge zu behalten 
  • Weymark: Simple Erklärvideos/Animationen, für das niedrige Budget, noch keine hochwertige Umsetzung möglich 
  • Oxomo: Ähnlich wie Synthesia, 65 Sprachen verfügbar, Qualität für Werbezwecke nicht empfehlenswert
  • Kapwing: KI Video Editor mit Smart Cut Function und Subtitle Generator

KI Video Tool Beispiel: Synthesia

KI Video Tool Beispiel: Weymark

sora - noch fehleranfällig und teuer?

Durch das Testing durch Verständige aus der Forschung und der kreativen Branche sollen Sicherheitslücken erkannt werden sowie qualitative Schwächen behoben werden: Denn OpenAI räumt ein, dass es immer wieder Schwachstellen gibt, wo die Artificial Intelligence das Ursache-Wirkungs-Prinzip nicht so ganz begreift, so dass beispielsweise „eine Person in einen Keks beißt, aber der Keks danach keine Bisspuren hat“. Solche Patzer sind natürlich in den atemberaubenden Vorzeige-Videos nicht zu sehen. 

Und wir, die wir alle schon Bild-erzeugende KI-Tools getestet haben und immer wieder geflucht haben, wenn es „fast“ richtig war, aber eben nur fast, vermuten, dass auch Sora da (noch) kein gottgleiches Wunder-Tool ist. Neue, von den Test-Usern releasde Videos zeigen unter anderen eine Wasserschildkröte, die etwas unförmige Schwimmbewegungen macht oder eine Katze mit Selfie-Stick, die ihren Stick aber verkehrt herum hält – mit der Kamera von sich weg. Knapp daneben ist eben auch vorbei! Trotzdem stellen wir uns darauf ein, dass die KI schnell auch derartige Fehler vermeiden lernt und solche Schwächen daher zu vernachlässigen sind, wenn man das Potential, was da auf uns zukommt, beschreiben will. 

Fraglich ist noch die tatsächliche Nutzbarkeit von Sora in den nächsten Jahren für „jedermann“. Es ist zu erwarten, dass OpenAI sich die Erzeugung eines 60-sekündiges Videos mit enormer Rechenleistung teuer entlohnen lassen wird. Schon von Tools wie Midjourney oder Runway wissen wir, dass sehr schnell eine hohe Anzahl an Credits verbraucht ist. Für mehrere Minuten Video Content können da schnell Beträge zusammen kommen, die zumindest Privatleute sich nicht zur reinen Spielerei leisten können. Für Filmschaffende, Videoagenturen und Unternehmen könnte es schon interessanter werden – je nachdem wie viele Videoproduktionskosten man sich vergleichsweise sparen kann. 

Wie KI Video Tools die Film- und Werbeindustrie revolutionieren werden

Auf längere Sicht haben KI-Video-Tools wie Sora definitiv das Potential Film- und Videoproduktion komplett zu revolutionieren. Experten sehen Sora in der heutigen Version erst als den Anfang von etwas, das sich in den nächsten Jahrzehnten rasant weiterentwickeln wird. Bis es die ersten komplett KI-generierten Spielfilme und Serien geben wird, ist wahrscheinlich noch eine Weile hin, aber es ist eher eine Frage der Zeit als ob es überhaupt je passieren wird. 

Spannend könnte es für Filmschaffende schon in den nächsten Jahren werden, wenn Sora kostenmäßig so erschwinglich ist, dass man damit im Handumdrehen Bewegtbild-Storyboards umsetzen kann: Also Drehbücher, die bis heute eher als gezeichnete Sketches umgesetzt sind und dann eine skizzenhafte, animierte kleine Schwester des finalen Films sein könnten. 

KI-generierte Szenen und von den Toten auferstehende Schauspieler?

Eine weitere Vision besteht darin, dass Sora früher oder später Dateien bereitstellen kann, die die Videoinhalte mit offenen Ebenen und Compositions abspeichern, ähnlich wie heutige Rohdateien aus Animationstools wie Adobe After Effects. Auch die Möglichkeit Inhalte von Sora, Runway & Co. als 3D-Bewegtbild-Modelle zu exportieren, könnte ein enormer Vorteil für Filmemacher sein.  

Dies würde dann die spannende Möglichkeit ergeben, künstlich erzeugte Inhalte zu bearbeiten und mit selbst-kreierten Inhalten wie zum Beispiel gedrehten Schauspielern zu kombinieren. Denkbar wäre auch, dass man der künstlichen Intelligenz Gegenstände oder Charaktere, zum Beispiel einen bestimmten Schauspieler, „beibringt“, und diese dann auf Basis dessen selbst Szenen mit diesem Schauspieler erstellen kann. Ein Schauspieler müsste so nur wenige Szenen performen und wäre dann für viele weitere Rollen einsetzbar. 

Sogar bereits verstorbene Schauspieler könnten wieder zum Leben erweckt werden. Dass dies bereits mit Stimmen funktioniert, haben uns beispielsweise die neuen Pumuckl-Folgen gezeigt, in denen der rothaarige Kobold mit der KI-erzeugten Stimme von Pumuckl-Sprecher Hans Clarin spricht, der bereits vor 20 Jahren gestorben ist.  

Genau so etwas könnte dann auch mit Film- und Serien-Darstellern selbst denkbar werden. Deep Fake Technologie machte das heute schon erstaunlich gut szenenweise möglich, mit KI könnte es spielend einfach werden: Farbfilm-Komödien mit Charlie Chaplin? Sean Connery als neuer alter James Bond? Oder Neues vom Joker mit Heath Ledger? In wenigen Jahren keine Spinnerei mehr! Was die Rechtslage dazu sagt und wo ethische Grenzen liegen, steht da selbstverständlich nochmal auf einem anderen Blatt.  

KI Video Tools: Steht das Aus für Werbe- und Videoagenturen bevor?

Für uns als Videoagentur how2 natürlich eine brisante Frage und schwer neutral zu beantworten: Wird man aus Besorgnis zu schnell schwarzmalerisch? Tendiert man dazu, sich die Fakten schön zu reden? „Herausforderung als Chance“ und so weiter…? 

Realistisch gesehen gehen wir nicht davon aus, dass in den nächsten Jahren bereits sämtliche Unternehmensvideos mit künstlicher Intelligenz erstellt werden: Dazu werden Sora oder andere KI Video Tools zunächst auch für Unternehmen noch nicht attraktiv genug sein (zu fehleranfällig, zu teuer, zu wenig CD-konform, unklare Rechtslage usw). Nach und nach werden vielleicht hier und da häufiger kurze Social Media Videos damit erstellt, aber bis die meisten Unternehmen ihre Imagefilme damit produziert werden, werden noch ein paar Jahre vergehen. 

Dennoch wird sich der Markt verändern und wir stellen uns darauf ein, uns diesen Veränderungen anzupassen – und zwar so geschickt, dass wir davon profitieren, anstatt darunter zu leiden. 

 

ki video tools videoproduktion
Werden Studiodrehs mit Green Screen bald der Vergangenheit angehören? Foto: MotionArray/ gnepphoto

Häufig nutzen wir beispielsweise für Imagefilme heute Stockmaterial von diversen Anbietern. Genau diesen Anbietern könnten die KI Video Tools Sora, Runway ML, Stable Video Diffusion und Midjourney voraussichtlich am schnellsten den Garaus machen. Denn es könnte bald möglich sein, dass wir kohärente Charaktere in fiktiven Szenen einfach selbst generieren können ohne diese bei Stock-Anbietern teuer kaufen zu müssen (fraglich für uns ist natürlich dann noch, wer uns weniger Credits kostet: KI oder Stockanbieter?). Für Foto-Strecken hat Midjourney aktuell gerade erst ein Feature released, das kohärente Charaktere in den unterschiedlichsten Szenen generieren kann. 


KI unterstützt, aber ersetzt noch nicht

Auch gehen wir davon aus, dass wir nicht nur durch Sora, sondern auch durch den Fortschritt anderer KI-Tools Prozesse in unserer Video- und E-Learning-Produktion immer effizienter gestalten können. Schon heute nutzen wir in Absprache mit unseren Kunden KI-Tools für internationale Sprachversionen und sparen so enorm Zeit und Kosten, wo wir früher fremdsprachige Sprecher beauftragen mussten. Im Rat- & Tat-Bereich funktionieren Videos mit solchen KI-generierten Sprecherstimmen gut, bei emotionalen Clips oder wo darstellerische Kompetenz gefragt ist, sind wir sehr froh noch auf menschliche Sprecher zurückgreifen zu können. 

Auch mit Text-Kreation durch KI (wie ChatGPT oder CoPilot) haben wir bisher die Erfahrung gemacht, dass unseren kreativen Autoren so schnell niemand das Wasser reichen kann. Dennoch kann man die KI Text Tools natürlich für die Vorrecherche oder Text-Rohfassungen schon heute einsetzen. 

Die Medienwelt ist durch die Künstliche Intelligenz definitiv im Wandel: Und so wie sich heute vielleicht schon Stock-Anbieter oder professionelle Sprecher anpassen müssen, so stellen wir uns darauf ein, dass auch wir es nach und nach müssen. Flexibilität, Agilität und Kreativität sind gefragt auf der Suche, wie wir Menschen künstliche Intelligenz für unsere Zwecke so nutzen, dass wir neue, spannende Produkte und Lösungen damit anbieten können.  

Wir raten allen Kreativschaffenden, sich mit KI und insbesondere KI Video Generatoren zu beschäftigen, anstatt sie zu verteufeln. Wer lernt, sie für die eigenen Zwecke kreativ einzusetzen, wird auch noch in 10 Jahren davon leben können. 

Wir können unseren Augen nicht mehr trauen – was machen KI Video Tools mit (Fake) News?

Natürlich gibt es viele Bedenken, was frei zugängliche KI Video Tools für Auswirkungen haben werden auf die Glaubwürdigkeit von Nachrichten. Kritiker schreien auf, dass sie der Verbreitung von Fake News und Propaganda-Videos und dadurch der Beeinflussung von Wahlen, Finanzmärkten und Meinungsbild Tür und Tor öffnen. Es heißt, um sicherzustellen, dass Sora-Videos auch als solche erkannt werden, sollen sie entsprechend gekennzeichnet sein. Die Frage bleibt, ob eine solche Kennzeichnung nicht mit geringem Aufwand von jedem, der gängige Video Tools nutzt, wieder entfernt werden kann.  

Ein von einer KI generiertes Foto, das Trump bei seiner Verhaftung zeigt, war neulich bereits ein kleiner Vorgeschmack darauf, wie KI-Content wie ein Lauffeuer Fake News verbreiten kann. Trifft das gleiche nun auf Bewegtbild zu, ist der Effekt noch verstärkt.  

Was dürfen wir noch glauben? Dies kann auch zusätzlich den gesellschaftlichen Graben verbreitern zu denen, die den „Mainstream“-Medien abschwören und sich auf Telegram-Kanäle zurückziehen. Man muss kein paranoider Verschwörungstheoretiker sein, um bald jedem Video, das man irgendwo sieht, skeptisch gegenüberzustehen und sich zu fragen, ob es nur von einem KI Video Generator erstellt wurde. Wenn man also bereits heute derartige Tendenzen hat, werden die dann mit Sicherheit nicht besser werden. 

ki video tools rechtssprechung gesetzgebung
Je mehr künstliche Intelligenz uns im Alltag unterstützt, desto mehr Gesetze wird sie brauchen. Foto: MotionArray/ francescogura

KI auf dem vormarsch - politik und journalismus sind gefragt

Die Antwort darauf kann wahrscheinlich nur eine Reformation von Journalismus und Nachrichten-Medien sein, so dass weiterhin seriöse, vertrauensvolle, verantwortungsbewusste und (finanziell) unabhängige Berichterstattung möglich bleibt. Es braucht Möglichkeiten, die den Konsumenten erlauben, News von Fake News und gefilmte Videos von KI Videos klar unterscheiden zu können. Es muss weiterhin unabhängige Kanäle geben, denen man zu 100% vertrauen kann. 

Je mächtiger Künstliche Intelligenz wird, desto mehr wird sie zum Politikum werden. Wir Menschen müssen uns klar dazu positionieren, was wir möchten und was wir nicht möchten. Es wird Gesetze und Regulatorien brauchen auf verschiedenen Ebenen ebenso wie Ethikkommissionen, die Grundsatzfragen beleuchten und beraten. Gerne glauben wir, dass wir einem Fortschritt bedingungslos ausgeliefert sind, wenn er erst einmal vorangeht, doch tatsächlich haben wir – insofern wir es wollen – die Möglichkeit, ihn sozial mitzugestalten: In welchen Bereichen möchten wir uns von künstlicher Intelligenz künftig unterstützen lassen und wo nicht? Wo macht sie für uns Sinn und wo richtet sie Schaden an? Wer sollte von den wirtschaftlichen Gewinnen, die KI erzielt, profitieren und wer nicht? 

Durch eine Eiswüste rennende Mammuts sind erst der Anfang dessen, was Künstliche Intelligenz alles für uns bereit hält. Manchmal brauchen wir aber genau solche plastischen Wow-Effekte um das Potenzial ansatzweise zu begreifen. Wir sehen mit Spannung und Zuversicht in diese sich rasant wandelnde Zukunft

Newsletter abonnieren!

Freuen Sie sich jeden Monat über News zu Video Marketing, E-Learning oder virtuelle Eventgestaltung! Mit spannenden Use Cases, Blogbeiträgen, Studien & Aktionen halten wir Sie up-to-date!

Frau  Herr 

Ich bin damit einverstanden, dass die how2 AG mich regelmäßig per Mail über News zu Video Marketing und E-Learning Themen informiert. Ich kann diese Einwilligung jederzeit widerrufen. 


Ich akzeptiere die Datenschutzbestimmungen der how2 AG.