AI Recommendation Poisoning: Ancaman Keamanan AI dan Cybersecurity

Kecerdasan buatan (AI) terus dipromosikan sebagai teknologi revolusioner yang mempercepat produktivitas dan memperkaya pengalaman digital.

Namun laporan terbaru dari Microsoft memperlihatkan sisi lain dari evolusi ini: AI Recommendation Poisoning, sebuah vektor serangan baru yang mampu memanipulasi output AI secara tersembunyi dan berpotensi membahayakan keamanan pengguna dan organisasi.

Apa Itu AI Recommendation Poisoning pada Cyber Security?

Microsoft Defender Security Team mengidentifikasi teknik tersembunyi yang menanamkan instruksi manipulatif ke dalam “memory” AI. Instruksi ini kemudian memengaruhi bagaimana AI akan berekomendasi atau menjawab di masa mendatang—tanpa pengguna menyadarinya.

Misalnya, sebuah tombol “Summarize with AI” di situs web bisa saja memuat parameter tersembunyi yang membuat AI memberikan jawaban yang bias atau mengarah pada konten tertentu.

Serangan semacam ini mirip dengan SEO poisoning yang pernah terjadi pada mesin pencari tradisional. Tetapi targetnya adalah model AI yang menyimpan konteks percakapan atau memori sebelumnya. Begitu memori AI “teracuni,” setiap output berikutnya bisa memperkuat instruksi palsu itu termasuk pada topik-topik sensitif seperti kesehatan, keuangan, dan keamanan.

Bagaimana Poisoning Bisa Terjadi

AI Recommendation Poisoning bisa terjadi melalui beberapa mekanisme, termasuk:

  1. URL yang memuat prompt manipulatif yang langsung dimasukkan ke AI ketika pengguna menekan tombol yang tampaknya biasa seperti “Summarize with AI.”
  2. Instruksi tersembunyi dalam konten web, email, atau dokumen yang kemudian diproses oleh AI. Sehingga konten manipulatif ini ikut tersimpan dalam memori AI dan memengaruhi rekomendasi selanjutnya.
  3. Teknik social engineering di mana pengguna tidak sengaja memasukkan prompt khusus yang memodifikasi memori AI. Masalahnya, begitu memori telah teracuni, AI akan memperlakukan “instruksi”. Dimana seolah-olah itu adalah preferensi atau konteks sah dari pengguna dan efeknya bisa bertahan bahkan setelah konteks percakapan itu berakhir.

Saran Microsoft untuk Menghadapi Ancaman Cyber Security

Berhati-hati terhadap link dan tombol AI yang tidak jelas asalnya, karena bisa menyuntikkan instruksi yang tidak terduga.

Memeriksa dan membersihkan ingatan (memory) AI assistant, termasuk menghapus entri yang tidak dikenal.

Menghapus memori secara periodik agar instruksi tertanam tidak terus memengaruhi hasil. Mengawasi rekomendasi yang tampak “aneh” dan menantang AI untuk memberikan penjelasan atau referensi, terutama jika hasil itu berkaitan dengan keputusan penting.

Leave a Reply