Die KI von ChatGPT lässt sich seit einiger Zeit schon mit der Stimme benutzen. Der Sprachchat ist seit einiger Zeit verfügbar. Nun hat OpenAI auch den Advanced Voice Mode in der EU freigegeben.
Dieser Modus hebt die Konversationen mit dem Sprachmodell auf ein neues Level. Im Gegensatz zum bisherigen Verfahren wird die Sprache nicht erst in einen Text umgewandelt, verarbeitet und dann wieder in Sprache umgesetzt. Das Modell versteht die gesprochene Stimme unmittelbar. Ein Text (ein Transkript) wir aber dennoch erstellt.
Durch die neue Methode verkürzt sich die Latenz zwischen Frage des Nutzenden und der Antwort von ChatGPT. Die KI lässt sich auch unterbrechen und korrigieren, oder es sind Nachfragen möglich. Der Dialog geht deutlich mehr in die Richtung eines echten Gesprächs. Dabei wird LLM 4o verwendet.
Eine Einschränkung gibt es aber noch. Derzeit ist die Zeit, die der Mode genutzt werden kann noch begrenzt. Wenn noch 15 Minuten Rest-Sprach-Zeit übrig sind, bekommt man in der ChatGPT-App eine Benachrichtigung. Die Nutzungszeit wird jetzt Tag wieder aufgefüllt.
Für die Nutzung des Advanced Voice Mode ist die neueste Version von ChatGPT für iOS nötig. Zum Zeitpunkt dieses Artikels ist das 1.2024.289. Außerdem ist derzeit für die Nutzung ein bezahlter Account nötig.
Deutsch und Dialekte
ChatGPT spricht viele Sprachen, darunter auch Deutsch und einige seiner Dialekte. Wobei diese manchmal etwas merkwürdig klingen. Es stehen verschiedene Stimmen zur Verfügung. Auch die Betonung hat sich beim Advanced Voice Mode verbessert. Probleme mit der Aussprache hat das System allerdings immer noch bei Zahlen und Maßangaben. Diese sind zu Teil sehr „verwuschelt“. Seine amerikanische Herkunft kann ChatGPT auch nicht immer verbergen. Die leicht amerikanische Aussprache von Worten fällt schon manchmal auf.
Dennoch zeigt OpenAI an dieser Stelle, dass es sehr wohl möglich ist, KI-Funktionen auch in der EU anzubieten. Apple hat in dieser Hinsicht noch einen weiten Weg vor sich.
Via: OpenAI