News

OpenAI präsentiert „Sora“: Eine neue Ära der Text-zu-Video-KI

OpenAI, bekannt als Entwickler von ChatGPT, hat sein neuestes Modell namens „Sora“ vorgestellt. Sora ist ein fortschrittliches Text-zu-Video-Modell, das auf der Grundlage textueller Anweisungen realistische und imaginative Videosequenzen generieren kann.

Sora baut auf den Erfahrungen aus früheren OpenAI-Projekten wie DALL·E und GPT-Modellen auf und verwendet die Recaptions-Technik von DALL-E 3, um hochdeskriptive Bildunterschriften für die Trainingsdaten zu generieren. Das Modell kann komplexe Szenen mit mehreren Charakteren, spezifischen Bewegungsarten und detaillierten Darstellungen von Motiven und Hintergründen erschaffen. Es versteht, wie Objekte in der physischen Welt existieren, und kann Charaktere mit ausdrucksstarken Emotionen erzeugen.

Anwendungsbereiche und Demonstrationen

Sora erlaubt es Nutzer:innen, Videos von bis zu einer Minute Länge zu erstellen, die auf ihren geschriebenen Anweisungen basieren. Zu den Demos, die OpenAI veröffentlicht hat, gehören beeindruckende Szenen wie eine Luftaufnahme Kaliforniens während des Goldrausches und eine vermeintliche Zugfahrt durch Tokio. Obwohl einige Demos verräterische Zeichen künstlicher Intelligenz aufweisen, wie beispielsweise sich eigenartig bewegende Objekte, sind die Ergebnisse insgesamt beeindruckend.

Trotz der beeindruckenden Fähigkeiten von Sora gibt OpenAI zu, dass das Modell Schwierigkeiten haben kann, die Physik komplexer Szenen genau zu simulieren. Dies kann zu Fehlinterpretationen bestimmter Ursache-Wirkungs-Zusammenhänge führen. Das Modell ist derzeit nur einer ausgewählten Gruppe von „Red Teamern“ zugänglich, die es auf potenzielle Risiken und Schäden prüfen. Einige Künstler:innen, Designer:innen und Filmemacher:innen erhalten ebenfalls Zugang, um Feedback zu sammeln.

Zukünftige Entwicklungen und Sicherheitsbedenken

Die rasante Entwicklung der Videotechnologie stellt die KI-Branche vor neue Herausforderungen, insbesondere im Hinblick auf die Erstellung fotorealistischer, KI-generierter Videos, die mit echten Aufnahmen verwechselt werden könnten. OpenAI hat bereits Maßnahmen ergriffen, um die Authentizität seiner KI-Produkte zu gewährleisten, wie die Einführung von Wasserzeichen bei DALL-E 3, obwohl diese leicht entfernt werden können.

Via Anbieter

Tags: Text-zu-Video-KIGPT-ModelleKI-generierte Videosfotorealistische VideosOpenAIDALL-E 3KI-SicherheitDigitale Innovationdigitale KreativitätSora

16. Februar 2024 14:00

Jan Gruber

Chefredakteur Magazin und Podcasts

Nächster Google stellt Gemini 1.5 vor »

Vorheriger « Peloton revidiert Entscheidung: Apple GymKit-Unterstützung bleibt

Neueste Artikel

News

Apple Feedback Assistant: Training für Apple Intelligence durch Fehlerberichte

Apple hat angekündigt, lokale Nutzerdaten zur Verbesserung von KI-Modellen wie Apple Intelligence zu verwenden. (mehr …)

21. April 2025

News

Apple TV 4K: Größtes Hardware-Upgrade seit Jahren erwartet

Apple arbeitet offenbar an einem umfassenden Upgrade für das Apple TV 4K. Seit dem letzten großen Update im Jahr 2022…

21. April 2025

News

Beats veröffentlicht weitere Spots für die neuen USB-C Kabel

Beats hat vor Kurzem neue USB-C Kabel auf den Markt gebracht. Ergänzend dazu wurden zusätzliche Werbespots veröffentlicht, die die Kabel…

21. April 2025

News

Apple verliert Marktanteile in China: Smartphone-Auslieferungen sinken im ersten Quartal um 9 Prozent

Apples Smartphone-Geschäft in China hat im ersten Quartal 2025 erneut nachgelassen. Nach Daten des Marktforschungsunternehmens IDC verzeichnete das Unternehmen einen…

21. April 2025

News

iPhone 17 Pro: Kamera-Bar könnte neue Personalisierungsmöglichkeiten bieten

Mit dem iPhone 17 Pro steht ein markantes Designupdate bevor. Statt des bekannten Kameramoduls auf der Rückseite erwartet Nutzer:innen eine…

21. April 2025

News

Nintendo-Emulation auf dem iPhone: AltStore ermöglicht Switch-Spiele in voller Geschwindigkeit

Der europäische Digital Markets Act (DMA) hat den Weg für alternative App-Stores auf dem iPhone geebnet. Eine dieser Plattformen, AltStore…

20. April 2025

Diese Website benutzt Cookies um Ihr Nutzererlebnis zu verbessern. Wenn Sie diese Website weiter nutzen, gehen wir von Ihrem Einverständnis aus.

OpenAI präsentiert „Sora“: Eine neue Ära der Text-zu-Video-KI

Anwendungsbereiche und Demonstrationen

Zukünftige Entwicklungen und Sicherheitsbedenken

Ähnliche Artikel

Neueste Artikel

Apple Feedback Assistant: Training für Apple Intelligence durch Fehlerberichte

Apple TV 4K: Größtes Hardware-Upgrade seit Jahren erwartet

Beats veröffentlicht weitere Spots für die neuen USB-C Kabel

Apple verliert Marktanteile in China: Smartphone-Auslieferungen sinken im ersten Quartal um 9 Prozent

iPhone 17 Pro: Kamera-Bar könnte neue Personalisierungsmöglichkeiten bieten

Nintendo-Emulation auf dem iPhone: AltStore ermöglicht Switch-Spiele in voller Geschwindigkeit