OpenAI, der Hersteller von ChatGPT, hat angekündigt, die Einführung der neuen „Voice Mode“-Funktion um einen Monat auf Juli zu verschieben. Ursprünglich sollte das realistische Sprachkonversationserlebnis Ende Juni für eine kleine Gruppe von ChatGPT Plus-Nutzer:innen bereitgestellt werden. Technische Probleme führten jedoch zu dieser Verzögerung.
Gründe für die Verzögerung
OpenAI erklärte, dass zusätzliche Zeit benötigt wird, um den Launch-Standard zu erreichen. Ein Schwerpunkt liegt dabei auf der Verbesserung der Fähigkeit des Modells, bestimmte Inhalte zu erkennen und abzulehnen. Zudem wird an der Verbesserung der Benutzererfahrung gearbeitet und die Infrastruktur vorbereitet, um Millionen von Nutzer:innen in Echtzeit bedienen zu können.
„Wir verbessern beispielsweise die Fähigkeit des Modells, bestimmte Inhalte zu erkennen und abzulehnen. Wir arbeiten auch daran, die Benutzererfahrung zu verbessern und unsere Infrastruktur darauf vorzubereiten, Millionen von Nutzern in Echtzeit zu bedienen,“ erklärte OpenAI in einem Beitrag auf der Social-Media-Plattform X.
Stufenweise Einführung und zukünftige Funktionen
Die Funktion wird zunächst einer kleinen Gruppe von Nutzer:innen zur Verfügung gestellt, um Feedback zu sammeln. Geplant ist, die Funktion im Herbst allen Plus-Nutzer:innen nach Sicherheits- und Zuverlässigkeitsprüfungen zugänglich zu machen.
Darüber hinaus arbeitet OpenAI an neuen Video- und Bildschirmfreigabefunktionen. Im Mai kündigte das Unternehmen die Veröffentlichung eines neuen KI-Modells namens GPT-4o an, das realistische Sprachkonversationen ermöglichen und sowohl Text- als auch Bildinteraktionen beherrschen soll. Dies ist Teil der Bemühungen, im Wettlauf um die Vorherrschaft in der aufstrebenden KI-Technologie an der Spitze zu bleiben.
Verbesserte Audiofunktionen
Die neuen Audiofunktionen sollen es den Nutzer:innen ermöglichen, in Echtzeit mit ChatGPT zu sprechen und sofortige Antworten zu erhalten. Zudem wird es möglich sein, ChatGPT zu unterbrechen, während es spricht – ein Merkmal realistischer Konversationen, das für KI-Sprachassistenten bisher eine Herausforderung darstellte.
Quelle: Reuters
Titelbild: KI (Dall-e)