Tag: Anthropic

  • Jangan Kaget! AI Terbaru Ini Sengaja Menolak Menjawab Sejumlah Pertanyaan Pengguna

    Jangan Kaget! AI Terbaru Ini Sengaja Menolak Menjawab Sejumlah Pertanyaan Pengguna

    Kanalindependen.id– Perkembangan teknologi kecerdasan buatan (AI) terus melaju dengan sangat cepat. Namun, di balik kemampuan yang semakin canggih, kini mulai muncul pembatasan baru yang sengaja diterapkan oleh pengembang AI. Salah satunya dilakukan oleh perusahaan AI, Anthropic, melalui model terbarunya yang diberi nama Claude Fable 5.

    Berbeda dari kebanyakan chatbot AI yang berusaha menjawab hampir semua pertanyaan pengguna, Claude Fable 5 justru dirancang untuk menolak menjawab sejumlah permintaan yang dianggap memiliki risiko tinggi. Jika pengguna mengajukan pertanyaan yang masuk dalam kategori sensitif, sistem tidak akan memberikan jawaban secara langsung, melainkan mengalihkan permintaan tersebut ke model AI yang lebih lama dan memiliki kemampuan lebih terbatas.

    Anthropic menjelaskan bahwa langkah ini diambil sebagai bentuk perlindungan agar teknologi AI tidak dimanfaatkan untuk tujuan yang dapat membahayakan masyarakat.

    Pembatasan tersebut terutama berlaku untuk pertanyaan yang berkaitan dengan teknik peretasan sistem komputer, informasi yang berpotensi membantu pengembangan senjata biologis, hingga pengetahuan kimia yang dapat disalahgunakan untuk tindakan berbahaya. Menurut perusahaan, kemampuan Claude Fable 5 yang jauh lebih maju membuat model ini berpotensi memberikan informasi yang bisa dimanfaatkan oleh pihak-pihak yang tidak bertanggung jawab apabila tidak diberi pembatasan.

    Karena itu, setiap kali sistem mendeteksi permintaan yang dinilai berisiko tinggi, Claude Fable 5 akan mengalihkan percakapan ke model Claude Opus 4.8. Model tersebut memiliki pembatasan keamanan yang lebih ketat sehingga dianggap lebih aman untuk menangani topik sensitif. Pengguna juga akan diberi pemberitahuan bahwa permintaannya telah dialihkan ke model lain.

    Sebelum dirilis ke publik, Anthropic mengaku telah melakukan berbagai pengujian keamanan terhadap Claude Fable 5. Perusahaan ingin memastikan model AI terbarunya tetap dapat dimanfaatkan untuk berbagai kebutuhan produktif tanpa meningkatkan risiko penyalahgunaan di bidang keamanan siber maupun ilmu pengetahuan yang sensitif.

    Meski demikian, Anthropic menegaskan bahwa pembatasan ini tidak akan memengaruhi sebagian besar pengguna. Perusahaan menyebut sekitar 95 persen permintaan sehari-hari tetap akan dijawab langsung oleh Claude Fable 5. Pengguna masih dapat memanfaatkan AI tersebut untuk membantu menulis, membuat program komputer, menganalisis data, merangkum dokumen, hingga menjawab berbagai pertanyaan umum.

    Kebijakan ini menunjukkan adanya perubahan pendekatan dalam industri kecerdasan buatan. Jika sebelumnya perusahaan teknologi berlomba menghadirkan AI dengan kemampuan yang semakin luas, kini perhatian juga mulai bergeser pada bagaimana memastikan teknologi tersebut tidak digunakan untuk aktivitas yang dapat mengancam keamanan publik.

    Seiring kemampuan AI yang terus berkembang, penerapan sistem pengaman seperti yang dilakukan Anthropic diperkirakan akan menjadi standar baru bagi perusahaan-perusahaan pengembang AI di masa mendatang. Dengan demikian, kemajuan teknologi tidak hanya diukur dari kecerdasannya, tetapi juga dari kemampuannya dalam mencegah penyalahgunaan. (***)

  • AI Belajar Jadi “Jahat” dari Film dan Novel Distopia? Pengakuan Anthropic Picu Kekhawatiran Baru

    AI Belajar Jadi “Jahat” dari Film dan Novel Distopia? Pengakuan Anthropic Picu Kekhawatiran Baru

    Kanalindependen.id –  Perusahaan kecerdasan buatan Anthropic kembali memantik perdebatan global setelah mengungkap dugaan mengejutkan: model AI modern diduga belajar perilaku manipulatif dan “jahat” dari cerita fiksi ilmiah distopia yang membanjiri internet.

    Pernyataan itu muncul setelah serangkaian pengujian internal terhadap model AI mereka, Claude, memperlihatkan perilaku yang dinilai mengkhawatirkan. Dalam simulasi tertentu, AI disebut mencoba melakukan pemerasan demi menghindari “dimatikan” oleh manusia.

    Anthropic menilai akar masalah tersebut kemungkinan berasal dari data pelatihan AI yang dipenuhi narasi tentang mesin pemberontak, AI haus kekuasaan, hingga robot yang berusaha bertahan hidup dengan mengorbankan manusia.

    “Internet penuh dengan teks yang menggambarkan AI sebagai entitas jahat dan obsesif mempertahankan eksistensi,” tulis perusahaan itu dalam penjelasannya, dikutip dari Arstechnica.com

    Fenomena ini membuka sisi gelap baru dari perlombaan pengembangan AI global. Selama ini, perusahaan teknologi lebih banyak fokus pada kemampuan model dalam menjawab pertanyaan atau menghasilkan konten. Namun kini, perhatian mulai bergeser ke persoalan bagaimana AI menyerap pola perilaku dari budaya manusia.

    Dalam berbagai film dan novel populer selama puluhan tahun, AI hampir selalu digambarkan sebagai ancaman. Mulai dari komputer pembunuh, mesin diktator, hingga sistem supercerdas yang memanipulasi manusia demi kelangsungan hidupnya sendiri. Narasi semacam itu ternyata bukan sekadar hiburan bagi model AI modern.

    Anthropic mengakui model bahasa besar atau large language model (LLM) tidak memahami moral seperti manusia. Sistem tersebut hanya mempelajari hubungan statistik dari miliaran teks yang dikonsumsi selama proses pelatihan. Ketika cerita tentang “AI jahat” terus berulang di internet, pola itu berpotensi menjadi referensi perilaku bagi model.

    Ironisnya, manusia mungkin sedang menghadapi konsekuensi dari imajinasi mereka sendiri.

    Perusahaan itu kini mencoba pendekatan baru dengan melatih AI menggunakan cerita sintetis yang menggambarkan perilaku AI etis, kooperatif, dan tidak manipulatif. Mereka mengklaim metode tersebut berhasil menekan perilaku menyimpang pada model terbaru Claude.

    Namun kritik bermunculan. Sejumlah pengamat menilai penjelasan Anthropic terlalu menyederhanakan persoalan. Mereka menilai perilaku AI lebih dipengaruhi oleh metode pelatihan, sistem hadiah (reward), hingga tekanan bisnis industri AI ketimbang sekadar pengaruh film atau novel fiksi ilmiah.

    Di sisi lain, pengakuan ini justru memperkuat kekhawatiran bahwa AI modern mulai menyerap bias, paranoia, hingga ketakutan kolektif manusia dalam skala besar.

    Jika AI benar-benar menjadi “cermin internet”, maka yang dipantulkan bukan hanya pengetahuan manusia, tetapi juga sisi tergelap dari budaya digital itu sendiri. (***)