Artificial Teams
Willkommen zur neuesten Ausgabe von Artificial Teams! Diese Woche werfen wir einen Blick auf den gestern erfolgten Launch von GPT-4.5 – OpenAIs neuestes Sprachmodell, das einen interessanten Kurswechsel darstellt und überraschend anders ist als viele erwartet haben.
‍
GPT-4.5 ist da: Der emotionale Begleiter statt der Benchmark-Brecher
‍
OpenAI hat gestern mit GPT-4.5 ihr neuestes Modell in einer Research Preview veröffentlicht. Überraschenderweise geht OpenAI einen anderen Weg als mit den jüngsten o1 und o3-mini Modellen – statt auf Reasoning zu setzen, fokussiert sich GPT-4.5 auf emotionale Intelligenz, kreatives Schreiben und menschenähnlichere Interaktionen.
‍
»It is the first model that feels like talking to a thoughtful person to me. I have had several moments where I've sat back in my chair and been astonished at getting actually good advice from an AI.« – Sam Altman, CEO OpenAI
‍
Was macht GPT-4.5 so besonders? Während andere aktuelle Modelle wie Claude 3.7 Sonnet oder o1 auf technische Exzellenz und Reasoning-Fähigkeiten setzen, bietet GPT-4.5 einen anderen Mehrwert: Es fühlt sich tatsächlich an, als würde man mit einem echten Menschen sprechen.
‍
Die wichtigsten Facts zu GPT-4.5
🚀 Stärken und Schwächen
Besonders stark bei kreativen Aufgaben und Texterstellung
Hohe emotionale Intelligenz und natĂĽrlichere Konversation
Starke Bildverständnisfähigkeiten und Datenextraktion
Weniger beeindruckend bei CodingÂ
Höherer Compute-Bedarf und damit höhere Kosten als GPT-4o
‍
Nach intensiven Tests für kreatives Schreiben direkt nach dem Release kann ich bestätigen: Obwohl GPT-4.5 aufholt, scheint mir Claude 3.7 Sonnet weiterhin das Modell mit der besten kreativen Intelligenz zu sein. OpenAI macht definitiv Fortschritte im Bereich kreativer Texterstellung, aber für anspruchsvolle Content-Creation-Aufgaben bleibt Claude 3.7 Sonnet meine erste Wahl.
‍
🔍 Technischer Hintergrund
Fokus auf Skalierung von unsupervised learning statt Reasoning
Breitere Wissensbasis und verbessertes Verständnis der Welt
Trainiert auf Microsoft Azure AI Supercomputern
Nicht für Benchmarks optimiert, sondern für menschenähnlichere Interaktionen
‍
Besonders interessant ist die Performance beim SimpleQA Benchmark, der die Faktentreue von Sprachmodellen bei kurzen, faktensuchenden Fragen misst. Mit 4.326 Fragen über verschiedene Themenbereiche ist dieser Benchmark eine echte Herausforderung für KI-Modelle. Während ältere Modelle wie GPT-4o mit 38,2% Genauigkeit und moderne Reasoning-Modelle wie o1 mit 47% abschneiden, erreicht GPT-4.5 beeindruckende 62,5% - ein deutlicher Hinweis auf die verbesserte Wissensbasis.
‍
SimpleQA
‍
🎯 Verfügbarkeit
Aktuell für ChatGPT Pro-Nutzer zugänglich
Rollout für Plus und Team-Nutzer nächste Woche
Enterprise und Edu-Nutzer folgen in der übernächsten Woche
Auch ĂĽber API fĂĽr Entwickler verfĂĽgbarÂ
‍
Erste Nutzerberichte: Mehr Freund als Assistent
Die ersten Erfahrungsberichte zeigen ein interessantes Bild: GPT-4.5 ist kein revolutionärer Sprung in der KI-Intelligenz, sondern eher eine Entwicklung in Richtung eines angenehmeren, menschlicheren Gesprächspartners.
‍
Laut Nutzern wie Dan Shipper (Every) und Ethan Mollick zeigt sich GPT-4.5 als:
‍
Weniger sycophantisch und mehr eine eigene Persönlichkeit
Extrovertierter und weniger neurotisch als GPT-4o
Besser im Verständnis von Nuancen und impliziten Absichten
Herausragend im Schreiben und kreativen Aufgaben
‍
Interessanterweise scheint das Modell laut Persönlichkeitstests weniger narzisstisch und manipulativ, aber etwas mehr »psychopathisch« zu sein als GPT-4o – was darauf hindeutet, dass es direkter und weniger unterwürfig in seinen Antworten ist.
‍
OpenAIs strategischer Schachzug
Der Launch von GPT-4.5 erscheint vor allem im Kontext des kürzlich veröffentlichten Claude 3.7 Sonnet besonders interessant. Während Anthropic mit dem technisch brillanten Claude 3.7 punktet, besetzt OpenAI mit GPT-4.5 bewusst eine andere Nische: die des emotionalen Begleiters.
‍
Diese Positionierung deutet auf eine breitere Strategie hin:
‍
OpenAI differenziert sein Portfolio mit verschiedenen Modell-Typen
Die o-Serie (o1, o3-mini) deckt Reasoning und technische Exzellenz ab
GPT-4.5 bedient die menschliche, soziale und kreative Seite
GPT-4o bleibt als vielseitiger Allrounder positioniert
‍
Wann lohnt sich GPT-4.5 fĂĽr dich?
Basierend auf den ersten Berichten scheint GPT-4.5 besonders wertvoll fĂĽr:
‍
Kreatives Schreiben und Content-Erstellung
Brainstorming und Ideenfindung
Coaching und persönliche Beratung
Komplexe Bildanalyse und DatenauszĂĽge
NatĂĽrlichere Interaktionen
‍
Weniger geeignet erscheint es fĂĽr:
‍
Komplexe Coding-Aufgaben (hier bleibt Claude 3.7 Sonnet ĂĽberlegen)
Hochpräzise technische oder wissenschaftliche Aufgaben (hier punkten die o-Modelle)
Anwendungsfälle mit strengen Budgetbeschränkungen (höhere Kosten)
‍
Fazit: Ein interessanter neuer Weg
Mit GPT-4.5 geht OpenAI einen spannenden alternativen Weg in der KI-Entwicklung. Statt nur auf rohe Intelligenz und Reasoning zu setzen, fokussiert sich das Unternehmen auf die zwischenmenschlichen Aspekte der KI-Interaktion. Das Modell mag nicht in allen Benchmarks glänzen, aber es könnte sich als der angenehmere Gesprächspartner erweisen – und damit für viele Nutzer wertvoller sein als technisch überlegene Alternativen.
‍
0 Comments
Login or Register to Join the Conversation
Create an AccountLog in