Skip to main content
Allgemein

OpenAI enthüllt GPT-4o: Ein Sprachmodell, das singt und Gespräche natürlich gestaltet

OpenAI hat mit GPT-4o eine erweiterte Version seines Sprachmodells vorgestellt, das nicht nur Texte verarbeitet, sondern auch Audio und Bilder einbezieht und in Echtzeit kommunizieren kann. Das Modell, betitelt mit ‚omni‘ für seine umfassenden Fähigkeiten, kann in über 50 Sprachen wechseln und verschiedene Stimmungen und Tonarten imitieren. Diese Verbesserungen sollen Gespräche mit ChatGPT flüssiger und natürlicher machen. Die Ankündigung erfolgte strategisch kurz vor großen Branchenereignissen wie Googles I/O und einer neuen Siri-Version von Apple, möglicherweise um die Aufmerksamkeit auf OpenAIs fortschrittliche Technologien zu lenken. Die neuen Funktionen von ChatGPT, wie das Erzählen von Geschichten mit unterschiedlichen Stimmlagen oder das Lösen von mathematischen Problemen, wurden in Live-Demonstrationen präsentiert. Trotz kleinerer Pannen zeigt OpenAI mit GPT-4o, dass es die Interaktion zwischen Mensch und Maschine auf ein neues Niveau heben möchte. Diese Technologie wird schrittweise eingeführt und soll letztendlich allen Nutzern kostenlos zur Verfügung stehen, wobei zahlende Kunden früheren Zugang erhalten.

Quelle: Spiegel Online+

Leave a Reply

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

Verified by MonsterInsights