News

OpenAI präsentiert „Sora“: Eine neue Ära der Text-zu-Video-KI

OpenAI, bekannt als Entwickler von ChatGPT, hat sein neuestes Modell namens „Sora“ vorgestellt. Sora ist ein fortschrittliches Text-zu-Video-Modell, das auf der Grundlage textueller Anweisungen realistische und imaginative Videosequenzen generieren kann.

Sora baut auf den Erfahrungen aus früheren OpenAI-Projekten wie DALL·E und GPT-Modellen auf und verwendet die Recaptions-Technik von DALL-E 3, um hochdeskriptive Bildunterschriften für die Trainingsdaten zu generieren. Das Modell kann komplexe Szenen mit mehreren Charakteren, spezifischen Bewegungsarten und detaillierten Darstellungen von Motiven und Hintergründen erschaffen. Es versteht, wie Objekte in der physischen Welt existieren, und kann Charaktere mit ausdrucksstarken Emotionen erzeugen.

Anwendungsbereiche und Demonstrationen

Sora erlaubt es Nutzer:innen, Videos von bis zu einer Minute Länge zu erstellen, die auf ihren geschriebenen Anweisungen basieren. Zu den Demos, die OpenAI veröffentlicht hat, gehören beeindruckende Szenen wie eine Luftaufnahme Kaliforniens während des Goldrausches und eine vermeintliche Zugfahrt durch Tokio. Obwohl einige Demos verräterische Zeichen künstlicher Intelligenz aufweisen, wie beispielsweise sich eigenartig bewegende Objekte, sind die Ergebnisse insgesamt beeindruckend.

Trotz der beeindruckenden Fähigkeiten von Sora gibt OpenAI zu, dass das Modell Schwierigkeiten haben kann, die Physik komplexer Szenen genau zu simulieren. Dies kann zu Fehlinterpretationen bestimmter Ursache-Wirkungs-Zusammenhänge führen. Das Modell ist derzeit nur einer ausgewählten Gruppe von „Red Teamern“ zugänglich, die es auf potenzielle Risiken und Schäden prüfen. Einige Künstler:innen, Designer:innen und Filmemacher:innen erhalten ebenfalls Zugang, um Feedback zu sammeln.

Zukünftige Entwicklungen und Sicherheitsbedenken

Die rasante Entwicklung der Videotechnologie stellt die KI-Branche vor neue Herausforderungen, insbesondere im Hinblick auf die Erstellung fotorealistischer, KI-generierter Videos, die mit echten Aufnahmen verwechselt werden könnten. OpenAI hat bereits Maßnahmen ergriffen, um die Authentizität seiner KI-Produkte zu gewährleisten, wie die Einführung von Wasserzeichen bei DALL-E 3, obwohl diese leicht entfernt werden können.

Via Anbieter

Jan Gruber

Chefredakteur Magazin und Podcasts

Neueste Artikel

Microsoft Majorana 1: Neuer Quantenchip für die Zukunft

Microsoft hat mit dem Majorana 1 einen neuen Quantenchip präsentiert, der die Entwicklung von Quantencomputern maßgeblich vorantreiben soll. (mehr …)

22. Februar 2025

iPhone 16e: Verkaufsstart mit sofortigem iOS-Update

Apple bringt das neue Apple, iPhone 16e, iOS 18.3.1, Apple C1, A18-Chip, Fusion-Kamera, Satelliten-Features, Datenschutz, Verkaufsstart auf den Markt –…

22. Februar 2025

HP übernimmt Humane: Das Ende des Ai Pin

Die Übernahme des KI-Start-ups Humane durch HP sorgt für Schlagzeilen. Gleichzeitig markiert sie das endgültige Aus für den ambitionierten, aber…

22. Februar 2025

iOS 18.4 Beta 1 ist da – mit Apple Intelligence in der EU

Apple hat ungewöhnlicherweise am Freitagabend iOS 18.4 Beta 1, macOS 15.4 und weitere veröffentlicht. Die Betas enthalten das erste mal…

21. Februar 2025

Apple: C1-Modem nicht verantwortlich für das Fehlen von MagSafe im iPhone 16e

Das kürzlich veröffentlichte iPhone 16e hat einige beeindruckende Neuerungen zu bieten – nicht zuletzt das selbst entwickelte C1-Modem für 5G. Allerdings sorgte das Fehlen von…

21. Februar 2025

Visual Intelligence: Apples KI-Feature kommt aufs iPhone 15 Pro

Apple bringt mit einem kommenden Update die Visual Intelligence-Funktion – bisher exklusiv für die iPhone 16-Serie – nun auch auf das ältere iPhone 15…

21. Februar 2025

Diese Website benutzt Cookies um Ihr Nutzererlebnis zu verbessern. Wenn Sie diese Website weiter nutzen, gehen wir von Ihrem Einverständnis aus.

Mehr lesen