GPT-4o wurde veröffentlicht und von Benutzern sofort überprüft. Gibt es Übertreibungen in OpenAI?

Am frühen Morgen des 14. Mai stellte OpenAI beim mit Spannung erwarteten „Spring New Product Launch“ sein neues Flaggschiffmodell GPT-4o und seine Desktop-App vor und demonstrierte eine Reihe neuer Funktionen. Während der Live-Übertragung wurde erwähnt, dass GPT-4o den Benutzern kostenlos zur Verfügung gestellt würde. Der Redakteur meldete sich so schnell wie möglich in seinem Konto an, sah es jedoch nicht. Krypton Gold vermutete, dass dieses Modell immer noch in Graustufen vorliegt, und verwandelte sich in einen AI-Evaluierungsblogger und implementierte das offiziell von OpenAI beworbene GPT-4o-Modell! Der Anlass! Prüfen! Überprüfen!

Zunächst wurde im offiziellen OpenAI-Blog erwähnt, dass GPT-4o im Vergleich zu bestehenden Modellen besonders gut im visuellen und akustischen Verständnis ist.

Der Redakteur sah sich das OpenAI-Demovideo an. Die OpenAI-Mitarbeiter interagierten wie Freunde mit GPT-4o, und ich war sehr berührt! Ich kann es kaum erwarten, es auszuprobieren!

Aber!!! Leider muss ich Ihnen mitteilen, dass die Videointeraktionsfunktion derzeit nicht für normale Benutzer verfügbar ist. Wir können mit ChatGPT nur durch das Hochladen von Bildern und Dateien interagieren.

Darüber hinaus erregte die offizielle Echtzeit-Sprachübersetzungsfunktion auch die Aufmerksamkeit von Menschen, die Melonen essen. OpenAI antwortete, dass das Mobiltelefon als Übersetzer zum Übersetzen von fast 20 häufig verwendeten Sprachen verwendet werden könne.

Der Redakteur hat es ausprobiert und festgestellt, dass die Sprachübersetzung in Echtzeit noch nicht verfügbar ist ... Nach der Sprachinteraktion mit ChatGPT gibt es noch einige Sekunden Wartezeit.

OpenAI erklärte im offiziellen Blog außerdem: „Wir planen, die neuen Audio- und Videofunktionen von GPT-4o in den nächsten Wochen über die API einer kleinen Anzahl vertrauenswürdiger Partner bereitzustellen. Darüber hinaus freuen sich alle darauf.“ Es gibt keine Möglichkeit, die Funktion zu erleben. Im offiziellen Blogbeitrag wurden auch eine Reihe von Vincent-Bildern sowie Bild-, Sprach- und Videoerkennungsfunktionen veröffentlicht. Als Nächstes zeigt der Editor diese Funktionen! offen! Messung! Kommentar! Wir haben die Eingabe im offiziellen Blog als Aufforderung zum Generieren kopiert und unsere eigenen generierten Ergebnisse mit dem offiziell generierten Diagramm als Referenz verglichen ~

Comic-Storyboard: Der Schreibengpass des Roboters

Diese Effektanzeige kann einerseits die leistungsstarken Bildgenerierungsfunktionen von GPT-4o widerspiegeln, einschließlich Verbesserungen bei der Erstellung von Texten für Bilder und der Fähigkeit, die Konsistenz von Zeichen bei der Generierung mehrerer Bilder beizubehalten. Aber der Effekt...

Auf dem ersten Bild sieht man, dass der durch den Selbsttest generierte Text noch Tippfehler enthält und die Handschrift unscharf ist.

Im zweiten Bild hat sich die Hand des Roboters deutlich verändert und ist nicht konsistent, und auch das Papier hat sich verändert.

Das dritte Bild ist grundsätzlich bestanden, aber der Text auf dem Papier unterscheidet sich völlig von den ersten beiden Bildern ...

Comic-Storyboard: Die Geschichte von Postman Sally

sehr gut! GPT-4o hat eine Postbotenschönheit im japanischen Comic-Stil erzeugt, die noch schöner ist als das offiziell veröffentlichte Bild.

Moment, warum hat sich der Malstil geändert? Wie kommt es, dass die japanischen Comics zu Puppen geworden sind und die Perspektive nicht stimmt?

Das dritte Bild hat einen anderen Stil. Obwohl die einzelnen Bilder und Texte gut übereinstimmen, ist es schwierig, zusammen eine zusammenhängende Geschichte zu erzählen ...

Comic-Avatar

Das nächste Feature ist mein Favorit und bietet auch die beste Leistung von GPT-4o. Laden Sie ein Foto hoch, um einen Comic-Avatar für Sie entwerfen zu lassen. Auch der Hintergrund kann individuell angepasst werden.

Dies ist das Originalbild, Alex Nichol, der Techniker von OpenAI

Dies ist ein von GPT-4o generierter Comic-Avatar. Obwohl der Selbsttest nicht so realistisch ist wie der offizielle, stellt er auch die grundlegenden Eigenschaften wieder her.

künstlerische Schriftart

Der Effekt ist erstaunlich, sogar besser als das offizielle Bild!

Aber warum gibt es immer weniger Buchstaben?

3D-Renderings

Die Ästhetik ist gut genug, aber kann das Logo trotzdem verwendet werden, wenn es so aussieht?

kreative Typografie

Die Handschrift ist recht schön, aber die Genauigkeit des Textes ist immer noch etwas dürftig ...

Erkennung von Charakteremotionen

Der Redakteur hat ein Foto einer Person mit starken Emotionen hochgeladen, und GPT-4o hat es sehr genau erkannt und auch eine Geschichte erfunden.

Erkennung von Konferenzaufzeichnungen

Der Redakteur hat eine Konferenzaufzeichnung mit mehreren Personen hochgeladen und gefragt, wie viele Personen in dieser Aufzeichnung enthalten seien. GPT-4o gab eine Antwort durch eine Audiospuranalyse, was etwas unverschämt war ...

Gemessen an der tatsächlichen Gesamterfahrung ist das GPT-4o, das derzeit für normale Benutzer verfügbar ist, nicht so einfach zu verwenden wie beworben. Diese Veröffentlichung ähnelt eher einem übereilten PR-Verhalten ohne viel Aufrichtigkeit. Der Herausgeber bezweifelt nicht, dass das von OpenAI veröffentlichte Video im Verdacht steht, das Video wie der morgige Protagonist Google zu bearbeiten, aber offensichtlich unterscheidet sich das im Mobiltelefon des OpenAI-Mitarbeiters im Video verwendete GPT-4o von dem, das ich jetzt verwende denn wenn es innen und außen gleich sein wird, können wir uns nur darauf freuen.

Seien Sie herzlich willkommen, aufmerksam zu sein

„Trusted AI Progress“ Der offizielle Account widmet sich der Verbreitung der neuesten vertrauenswürdigen künstlichen Intelligenztechnologie und der Kultivierung von Open-Source-Technologie und deckt groß angelegtes Graphenlernen, kausales Denken, Wissensgraphen, große Modelle und andere technische Bereiche ab Scannen Sie den QR-Code, um weitere KI-Informationen zu verfolgen und freizuschalten

Wie viel Umsatz kann ein unbekanntes Open-Source-Projekt bringen? Das chinesische KI-Team von Microsoft hat zusammengepackt und ist mit Hunderten von Menschen in die USA gegangen. Huawei gab offiziell bekannt, dass Yu Chengdongs Jobwechsel an der „FFmpeg-Säule der Schande“ festgenagelt wurden vor, aber heute muss er uns danken – Tencent QQ Video rächt seine vergangene Demütigung? Die Open-Source-Spiegelseite der Huazhong University of Science and Technology ist offiziell für den externen Zugriff geöffnet. Bericht: Django ist immer noch die erste Wahl für 74 % der Entwickler. Zed-Editor hat Fortschritte bei der Linux-Unterstützung gemacht brachte die Nachricht: Nachdem er von einem Untergebenen herausgefordert wurde, wurde der technische Leiter wütend und unhöflich, wurde entlassen und schwanger. Die Mitarbeiterin von Alibaba Cloud veröffentlicht offiziell Tongyi Qianwen 2.5. Microsoft spendet 1 Million US-Dollar an die Rust Foundation
{{o.name}}
{{m.name}}

Ich denke du magst

Origin my.oschina.net/u/7032067/blog/11121442
Empfohlen
Rangfolge