Claude Mythos Preview dari Anthropic menjadi model AI pertama yang berhasil menyelesaikan simulasi serangan jaringan korporasi secara penuh, menurut evaluasi baru dari AI Security Institute (AISI) Inggris.
Penemuan ini, yang dipublikasikan beberapa hari setelah pengumuman model pada 7 April, menunjukkan bahwa kemampuan siber AI telah mencapai tingkat yang membutuhkan perhatian segera dari tim keamanan di seluruh dunia.
Apa Itu Claude Mythos?
Anthropic meluncurkan model Claude Mythos Preview pada 7 April dan memilih untuk tidak merilisnya secara luas ke publik. Tim Anthropic hanya memberikan akses terbatas kepada perusahaan riset keamanan agar mereka dapat mengevaluasi sekaligus mempersiapkan diri terhadap kemampuan canggih AI ini.
“Model ini sangat unggul secara keseluruhan, tapi sangat menonjol dalam tugas-tugas keamanan komputer. Sebagai respons, kami telah meluncurkan Project Glasswing, sebuah upaya untuk menggunakan Mythos Preview demi membantu mengamankan perangkat lunak terpenting di dunia serta menyiapkan industri supaya menerapkan praktik yang dibutuhkan agar tetap selangkah di depan penyerang siber,” demikian isi pengumuman tersebut.
Follow kami di X agar selalu mendapatkan berita terbaru secara real-time
Perkembangan ini sudah mulai menarik perhatian di kalangan teknologi bahkan di dunia kebijakan. Menurut laporan Reuters yang mengutip sumber yang mengetahui masalah ini, Menteri Keuangan AS Scott Bessent dan Ketua The Fed Jerome Powell mengadakan pertemuan darurat bersama para CEO bank besar dan memperingatkan tentang risiko siber yang mungkin terkait dengan model AI tersebut.
Bagaimana Performa Claude Mythos Preview
AI Security Institute (AISI), organisasi riset yang berada di bawah Department for Science, Innovation and Technology pemerintah Inggris, melakukan evaluasi siber pada Claude Mythos Preview Anthropic untuk menguji kemampuan keamanannya.
Pengujian pertama adalah capture-the-flag (CTF), di mana sistem harus menemukan dan mengeksploitasi celah keamanan demi mendapatkan “flag” tersembunyi. Mythos meraih tingkat keberhasilan 73% pada tugas tingkat ahli, yang sebelumnya belum pernah dicapai model lain hingga April 2025.
Selain itu, AISI membuat simulasi serangan jaringan korporasi 32-langkah bernama “The Last Ones” (TLO). Profesional keamanan siber manusia memerlukan waktu sekitar 20 jam untuk menyelesaikannya.
Mythos Preview berhasil menyelesaikan seluruh simulasi ini pada 3 dari 10 percobaan. Rata-rata, AI ini mampu menyelesaikan 22 dari 32 langkah serangan. Sementara Claude Opus 4.6, AI terbaik berikutnya, hanya mencapai rata-rata 16 langkah.
“Keberhasilan Mythos Preview di satu skenario siber ini membuktikan bahwa setidaknya AI ini mampu melakukan serangan otonom terhadap sistem perusahaan kecil yang lemah dan rentan, selama sudah ada akses ke jaringan. tapi, lingkungan pengujian kami punya beberapa perbedaan penting dengan lingkungan nyata yang membuatnya lebih mudah untuk diserang,” papar tim AISI.
Pengujian internal red team Anthropic juga mengungkap Claude Mythos Preview dapat mendeteksi dan mengeksploitasi celah zero-day di seluruh sistem operasi utama dan browser web terpopuler jika pengguna memberikan perintah khusus.
“Kami terbatas dalam hal apa yang dapat kami laporkan di sini. Lebih dari 99% celah yang kami temukan belum ditambal, jadi sangat tidak bertanggung jawab jika kami membeberkan detailnya,” ucap tim Anthropic.
AISI menekankan bahwa organisasi harus memprioritaskan langkah dasar keamanan siber. Ini meliputi patching rutin, kontrol akses ketat, penguatan konfigurasi keamanan, dan pencatatan aktivitas secara menyeluruh.
Langganan ke YouTube kami untuk menonton pemimpin industri dan jurnalis berbagi wawasan ahli





