Anthropic dan OpenAI Bawa Perang AI Mereka ke Riset Ilmiah

  • Anthropic meluncurkan Claude Science, sebuah workbench AI yang terhubung ke lebih dari 60 database ilmiah.
  • OpenAI merilis GeneBench-Pro, sebuah benchmark untuk penilaian AI dalam biologi komputasi.
  • Model terbaik OpenAI hanya berhasil melewati 28,7% masalah biologi GeneBench-Pro.
Promo

Anthropic dan OpenAI membuka babak baru dalam persaingan mereka pada hari Selasa, keduanya menargetkan riset ilmiah. Anthropic meluncurkan Claude Science, sebuah workbench AI untuk peneliti, sedangkan OpenAI merilis GeneBench-Pro, tolok ukur untuk biologi komputasional.

Peluncuran di hari yang sama ini mendorong persaingan AI melampaui chatbot dan pemrograman ke arah pekerjaan laboratorium. Salah satu perusahaan menghadirkan alat yang bisa langsung digunakan ilmuwan hari ini, sedangkan yang lainnya membangun tolok ukur untuk melihat seberapa jauh teknologi ini harus berkembang.

Disponsori
Disponsori

Apa yang Dilakukan Claude Science dari Anthropic

Claude Science menggabungkan database, kode, dan kemampuan komputasi yang biasa digunakan ilmuwan ke dalam satu aplikasi. Aplikasi ini terhubung ke lebih dari 60 database ilmiah yang mencakup genomik, proteomik, dan kemoinformatika.

Claude Science merupakan aplikasi, bukan model baru. Aplikasi ini dirilis saat model Anthropic yang paling kuat, Fable 5 dan Mythos 5, masih terbatas karena peraturan ekspor AS. Setiap hasil bisa diaudit dan dapat dilacak kembali ke kode yang menghasilkan hasil tersebut.

Workbench ini melanjutkan dorongan Anthropic di ranah life sciences yang dimulai pada Oktober 2025. Saat fase beta, Jérôme Lecoq dari Allen Institute menggunakan aplikasi ini untuk mempercepat ulasan yang sebelumnya bisa memakan waktu hingga dua tahun.

Anthropic juga akan mendanai hingga 50 proyek riset, masing-masing dengan kredit senilai hingga US$30.000.

OpenAI GeneBench-Pro Mengangkat Standar Baru

Tidak lama setelah Anthropic meluncurkan Claude Science, OpenAI merilis GeneBench-Pro. Benchmark ini menguji apakah AI bisa mengambil keputusan seperti yang dibutuhkan dalam riset biologi asli.

Disponsori
Disponsori

Benchmark ini berisi 129 permasalahan yang mencakup genomik, biologi kuantitatif, dan pengobatan translasional.

Model terkuat OpenAI, GPT-5.6 Sol, berhasil memecahkan 28,7% masalah pada level penalaran tertinggi. Angka ini naik menjadi 31,5% pada mode Pro. Peluncuran bertahap GPT-5.6 sebelumnya dilakukan atas permintaan Washington.

GPT-5 hanya mendapat skor di bawah 5% pada GeneBench versi asli, sedangkan Opus 4.8 milik Anthropic mencatat 16% pada tes yang lebih sulit.

Ikuti kami di X untuk mendapatkan berita terbaru secara real-time

Dua Strategi, Satu Perlombaan

Pembagian ini memperlihatkan dua jalur menuju tujuan yang sama. Anthropic menghadirkan produk untuk penggunaan laboratorium sehari-hari, sedangkan OpenAI mengukur seberapa handal model dalam mengolah data yang kompleks.

Kedua peluncuran ini juga terjadi saat model AI dari Cina semakin maju di dunia riset. Angka dari OpenAI sendiri membuat ekspektasi lebih realistis karena model terbaik mereka masih gagal di sebagian besar tugas GeneBench-Pro.

Tekanan ini berasal dari sisi geopolitik dan ilmiah. Batasan ekspor AS sudah mendorong Anthropic untuk mempertimbangkan negara penyedia host baru untuk model mereka.

Reviewer memperkirakan bahwa tiap soal GeneBench-Pro akan memakan waktu hingga 20 sampai 40 jam oleh ahli manusia, dengan biaya ribuan US$. OpenAI menuturkan bahwa model mereka bisa menyelesaikan analisis yang sama hanya dengan beberapa US$ saja.

Aubrey de Grey, seorang gerontolog biomedis, melihat AI bisa menghilangkan hambatan penting dalam riset walaupun pencapaian lebih luas butuh waktu lebih panjang.

“Apa yang akan segera kita lihat adalah AI akan membuat beberapa bagian dari proses, khususnya pengembangan obat, tidak lagi menjadi faktor pembatas,” ujar Aubrey de Grey, Presiden dan Chief Science Officer di Longevity Escape Velocity Foundation, saat berbicara di podcast BeInCrypto.

De Grey memperingatkan bahwa transformasi riset cepat menjadi pengobatan yang disetujui masih sangat bergantung pada regulasi dan tingkat toleransi publik terhadap risiko.

Peneliti Memperkirakan Adopsi Akan Semakin Cepat

Beberapa spesialis berpendapat bahwa pergeseran ini sudah berlangsung. Dr. Derya Unutmaz, Profesor Imunologi, memaparkan di panel yang sama di BeInCrypto bahwa AI kini bahkan bisa mengungguli penilaiannya sendiri.

“Secara pribadi saya lebih percaya pada AI daripada ide saya sendiri setelah 35 tahun berkecimpung di bidang ini.”

Ia meyakini ketergantungan ini akan segera menyebar ke dunia praktik klinis.

“Menurut saya, tidak etis dan saya percaya dalam waktu dekat akan menjadi malpraktik jika tidak menggunakan AI dalam dunia kedokteran.”

Optimisme ini tetap mendahului capaian pada benchmark. Beberapa bulan ke depan akan membuktikan apakah ilmuwan mulai mengadopsi alat ini dan apakah skor GeneBench-Pro juga mulai naik.


Untuk membaca analisis pasar kripto terbaru dari BeInCrypto, klik di sini.

Penyangkalan

Seluruh informasi yang terkandung dalam situs kami dipublikasikan dengan niat baik dan bertujuan memberikan informasi umum semata. Tindakan apa pun yang dilakukan oleh para pembaca atas informasi dari situs kami merupakan tanggung jawab mereka pribadi. Selain itu, sebagian artikel di situs ini merupakan hasil terjemahan AI dari versi asli BeInCrypto yang berbahasa Inggris.

Disponsori
Disponsori