OpenAI Luncurkan GPT-5.5 untuk Tantang Claude Opus 4.7 dari Anthropic

  • OpenAI merilis GPT-5.5 hari ini, mengklaim keunggulan benchmark dibandingkan Claude Opus 4.7.
  • Model ini menargetkan agentic coding, penggunaan alat, dan penyelesaian tugas secara otonom.
  • Harga API mulai dari US$5 per satu juta token input, setara dengan tarif Anthropic.
Promo

OpenAI merilis GPT-5.5 pada 23 April, dengan nama kode “Spud”, yang memperkenalkan model ini sebagai sistem paling andal untuk pekerjaan otonom yang membutuhkan banyak langkah.

Peluncuran ini terjadi satu minggu setelah Anthropic meluncurkan Claude Opus 4.7, sehingga kedua model terdepan ini langsung bersaing ketat.

Disponsori
Disponsori

GPT-5.5 Fokus pada Pekerjaan Agentic dan Coding

GPT-5.5 dirancang untuk melakukan perencanaan, eksekusi, verifikasi, dan perulangan tugas melalui berbagai alat tanpa perlu pengawasan manusia secara terus-menerus. OpenAI menjelaskan model ini sebagai “kelas kecerdasan baru untuk pekerjaan nyata dan memperkuat agen.”

Ikuti kami di X untuk mendapatkan berita terbaru secara langsung

“Kami percaya pada penerapan bertahap; meskipun GPT-5.5 sudah merupakan model yang cerdas, kami memperkirakan perkembangan pesat. Penerapan bertahap adalah bagian besar dari strategi keamanan kami; kami yakin dunia akan lebih siap untuk menang dalam kerja sama tim membangun ketahanan AI dengan cara ini,” ujar Sam Altman dalam sebuah posting.

Model ini sudah tersedia untuk pengguna ChatGPT Plus, Pro, Business, dan Enterprise. Tersedia juga varian Pro yang lebih kuat. Biaya API mulai dari US$5 per satu juta token input dan US$30 per satu juta token output, dengan context window sebanyak satu juta token.

Disponsori
Disponsori

Benchmark internal OpenAI menunjukkan GPT-5.5 melampaui Claude Opus 4.7 dalam berbagai tugas agentic. GPT-5.5 mencatat skor 82,7% di Terminal-Bench 2.0, dibandingkan 69,4% untuk Opus 4.7.

Pada FrontierMath Tiers 1 sampai 3, model ini meraih 51,7%, sementara Opus 4.7 hanya mendapatkan 43,8%. Pengujian independen awal juga menunjukkan tren serupa dalam evaluasi coding dan pekerjaan berbasis pengetahuan.

Di Mana Claude Opus 4.7 Masih Unggul

Model Anthropic tetap unggul dalam penulisan riset, penalaran hukum dan keuangan, serta konsistensi mengikuti instruksi, menurut penilai independen.

Opus 4.7 juga mendukung penglihatan beresolusi tinggi hingga 3,75 megapiksel, lebih dari tiga kali lipat dibanding pendahulunya.

Dalam penggunaan komputer, jaraknya semakin dekat. GPT-5.5 mencatat skor 78,7% di OSWorld-Verified, sementara Opus 4.7 memperoleh skor 78,0%.

Kedua model ini juga bersaing pada benchmark browsing, di mana GPT-5.5 Pro unggul dengan 90,1% dibanding Opus 4.7 yang meraih 79,3%.

Persaingan AI Makin Cepat pada 2026

Peluncuran yang berdekatan ini mencerminkan pola yang lebih luas. OpenAI telah menghadirkan beberapa varian GPT-5.x tahun ini, sementara Anthropic konsisten mengupgrade Claude melalui beberapa rilisan.

Gemini 3.1 Pro dari Google juga bersaing di pasar enterprise yang sama.

Bagi pengembang yang ingin memilih di antara kedua model, keputusan utamanya mungkin tergantung pada kebutuhan penggunaan. GPT-5.5 nampaknya lebih kuat untuk otomatisasi agentic dan coding jangka panjang.

Claude Opus 4.7 mungkin lebih cocok untuk alur kerja analitik yang memerlukan presisi tinggi. Apakah benchmark independen nantinya bisa mengonfirmasi angka yang dipublikasikan OpenAI akan terlihat dalam beberapa hari ke depan.

Langganan channel YouTube kami untuk menyaksikan pemimpin dan jurnalis berbagi wawasan ahli


Untuk membaca analisis pasar kripto terbaru dari BeInCrypto, klik di sini.

Penyangkalan

Seluruh informasi yang terkandung dalam situs kami dipublikasikan dengan niat baik dan bertujuan memberikan informasi umum semata. Tindakan apa pun yang dilakukan oleh para pembaca atas informasi dari situs kami merupakan tanggung jawab mereka pribadi. Selain itu, sebagian artikel di situs ini merupakan hasil terjemahan AI dari versi asli BeInCrypto yang berbahasa Inggris.

Disponsori
Disponsori