Anthropic rilis Claude Fable 5 dan Mythos 5. Sama modelnya, beda safety. Fable 5 buat umum, Mythos 5 dibatasi. Harga & kemampuannya gimana?

Anthropic baru aja nge-release dua model baru barengan: Claude Fable 5 dan Claude Mythos 5. Kedua model ini masuk ke tier baru yang namanya "Mythos-class", yang katanya kemampuannya di atas kelas Opus yang sebelumnya jadi andalan.

Nah, yang bikin penasaran: Fable 5 dan Mythos 5 itu sebenarnya model yang sama persis di dalamnya. Bedanya cuma di lapisan safety atau pengaman yang dipasang di luarannya.

Fable 5 adalah versi yang Anthropic bilang aman buat dipake umum. Mereka pasang sistem classifier baru yang bisa nge-detek jailbreak dan permintaan berbahaya.

Advertisement

Advertisement

Slot in-article yang tampil setelah paragraf ketiga.

Kalo classifier-nya Fable 5 nge-flag permintaan kamu, ntar jawabannya diganti sama Claude Opus 4.8. Katanya sih ini cuma terjadi di bawah 5% sesi, jadi sebagian besar waktu Fable 5 tetap jalan pake kemampuan penuh Mythos-nya.

Sementara itu, Mythos 5 cuma bisa diakses terbatas lewat Project Glasswing yang kolaborasi sama pemerintah AS. Di versi ini, pengaman cybersecurity dicopot, jadi modelnya punya akses penuh ke kemampuan hacking dan eksploitasi yang lebih gede.

Anthropic bilang Mythos 5 ini model dengan kemampuan cybersecurity terkuat yang pernah ada sekarang. Mereka rilis terbatas soalnya takut disalahgunain.

Lalu, sebenernya sehebat apa sih Fable 5 ini? Anthropic klaim Fable 5 itu state-of-the-art di hampir semua benchmark yang mereka tes.

Stripe udah cobain pas early access dan Fable 5 berhasil nge-lakuin migrasi codebase Ruby sebesar 50 juta baris cuma dalam sehari. Kalo dikerjain manual, timnya butuh waktu lebih dari dua bulan.

Fable 5 juga paling jago di FrontierCode punya Cognition, yang ngetes tugas coding susah standar produksi. Bahkan di effort medium aja dia tetap nomor satu.

Di bidang finance, Fable 5 dapet skor tertinggi di Hebbia Finance Benchmark buat reasoning level senior. Dia jago baca dokumen, nge-interpretasi chart, dan nyelesaiin masalah kompleks.

Vision-nya juga disebut state-of-the-art baru. Fable 5 bisa nge-extract angka presisi dari gambar ilmiah detail, bahkan nge-rebuild source code web app cuma dari screenshot.

Context window Fable 5 gede banget: 1 juta token default, output sampe 128 ribu token per request. Harganya $10 per juta input token dan $50 per juta output token.

Harga itu kurang dari setengah harga Claude Mythos Preview yang dulu. Jadi buat developer, ini jadi opsi yang lebih masuk akal buat dipake skala gede.

Mythos 5 sendiri punya klaim gila di sains. Ahli protein design internal Anthropic bilang model ini nge-percepat bagian tertentu dari drug design sekitar 10 kali lipat.

Mythos 5 juga jadi model pertama mereka yang bisa konsisten nge-hasilin hipotesis ilmiah baru. Para ilmuwan lebih suka hipotesis biologi molekular-nya sekitar 80% waktu dalam perbandingan buta.

Bahkan Mythos 5 pernah jalanin riset genomik baru selama seminggu secara otonom. Dia nge-train model custom dari data single-cell yang mencakup 138 spesies hewan, dan model itu outperform penelitian yang baru dipublikasikan di jurnal Science meski ukurannya 100 kali lebih kecil.

Jadi gimana sih cara kerja safeguard-nya? Anthropic pake classifier AI terpisah yang jadi penjaga pintu.

Classifier ini ngecek permintaan masuk, kalo ada indikasi jailbreak atau penyalahgunaan di bidang cybersecurity, biologi, kimia, atau distillation, permintaan itu diredirect ke Opus 4.8.

Pengguna diberitahu kalo lagi terjadi fallback itu. Buat biologi dan kimia, sementara ini hampir semua permintaan bakal di-fallback soalnya Anthropic khawatir info dual-use bisa dimanfaatkan aktor jahat.

Mereka rencananya mau bikin trusted access program buat peneliti terverifikasi biar bisa pake Fable 5 tanpa safeguard bio/chem itu.

Anthropic bilang mereka tuning safeguard-nya secara konservatif. Kadang permintaan polos juga bisa ke-flag, tapi rata-rata terjadi di bawah 5% sesi.

Red teaming dan bug bounty eksternal udah dijalanin lebih dari 1.000 jam dan gak ada universal jailbreak yang berhasil ditemuin. Cuma UK AISI sempet ada kemajuan dikit dalam testing window singkat.

Buat developer dan tim teknis, ada beberapa use case konkret yang langsung bisa diincar.

Pertama, large-scale code migration. Contoh Stripe udah nunjukkin skala 50 juta baris code bisa diselesaiin sehari.

Kedua, agentic coding pipeline. Fable 5 lebih efisien token dan butuh lebih sedikit intervensi manusia, jadi cocok buat multi-step automation.

Ketiga, finance dan analytics work. Baca dokumen panjang, interpretasi chart, dan trading analysis jadi lebih gampang.

Keempat, vision-to-code. Rebuild source code dari screenshot doang, atau nge-extract data dari gambar ilmiah tanpa perlu banyak tooling tambahan.

Kelima, long-running research agents. Memory yang persisten di jutaan token cocok buat research loop yang berjalan berhari-hari.

Intinya, Fable 5 dan Mythos 5 itu model yang sama persis. Bedanya cuma lapisan pengaman yang dipasang Anthropic.

Fable 5 buat umum dengan classifier aktif, Mythos 5 versi tanpa batasan cybersecurity tapi cuma bisa diakses terbatas.

Kalo kamu developer, Fable 5 udah bisa langsung dipake di API dengan harga yang lebih murah dari Mythos Preview.

Cuma tapes aja, safeguard-nya kadang overprotective dan bisa nge-block permintaan polos. Tapi buat keamanan umum, mungkin itu harga yang worth it dibanding risikonya.

Koentji: pilih Fable 5 buat kerjaan umum dan coding skala gede, tapi kalo kamu peneliti cybersecurity atau bio yang verified, Mythos 5 lewat Project Glasswing mungkin lebih pas buat kerjaan前沿 (frontier) kamu.

AI Updates lagi bergerak cepat, jadi jangan cuma lihat headline.

MarkTechPost

Catatan redaksi

Kalau lo cuma ambil satu hal dari artikel ini

AI Updates update dari MarkTechPost.

Sumber asli

Artikel ini merupakan rewrite editorial dari laporan MarkTechPost.

Baca artikel asli di MarkTechPost
#AIUpdates#MarkTechPost#rss