AI Incident Response Playbook: Cara Merespons Saat AI Gagal

Chatbot AI memberi tahu pelanggan bahwa mereka berhak atas pengembalian dana yang sebenarnya tidak mereka berhak. Sebuah AI summarizer menghilangkan klausul kontrak kritis selama tinjauan due diligence, dan kelalaian itu tidak terdeteksi hingga setelah penandatanganan. Model AI lead scoring mulai merutekan prospek bernilai tertinggi Anda ke rep yang salah, dan tidak ada yang memperhatikan selama tiga minggu.
Ini adalah insiden AI. Dan mereka berbeda dari insiden IT yang sudah diketahui cara penanganannya oleh tim Anda.
Apakah proses incident response Anda mengetahui perbedaannya? Jika tidak, Anda akan merespons terlalu lambat terhadap sinyal yang salah, mengeskalasinya ke hal yang salah, dan melewatkan masalah yang secara diam-diam memengaruhi ratusan keputusan sebelum ada yang menyadarinya.
Playbook ini untuk chief information officers (CIOs), pemimpin keamanan, dan tim transformation yang membangun kemampuan incident response AI pertama mereka, atau mengaudit apakah proses mereka yang ada sudah memadai. Ini terhubung dengan Membangun Kebijakan Penggunaan AI Anda (yang mendefinisikan lingkup AI yang diotorisasi) dan Audit Trails untuk AI Execute Actions (yang menyediakan basis bukti untuk investigasi).
Bagaimana insiden AI berbeda dari insiden IT

Key Facts: Risiko Insiden AI
- GDPR Article 33 mewajibkan notifikasi ke otoritas pengawas yang relevan dalam 72 jam setelah mengetahui adanya pelanggaran data pribadi; batas waktu 72 jam dimulai ketika organisasi menjadi sadar, bukan ketika investigasi selesai (GDPR Article 33)
- Kategori insiden AI mencakup hallucination, Execute error, bias, data exposure, dan model drift; incident response IT tradisional (yang dibangun di sekitar kegagalan biner up/down) melewatkan sifat laten dan probabilistik dari kegagalan AI yang dapat memengaruhi ratusan keputusan sebelum terdeteksi (riset NIST Cybersecurity Framework)
- Gartner memprediksi bahwa lebih dari 40% proyek agentic AI akan dibatalkan pada 2027, dengan kerangka governance yang gagal mengikuti sebagai penyebab utama; infrastruktur incident response adalah salah satu dari tiga komponen governance yang paling sering tidak ada (Gartner, 2025)
Incident response IT tradisional dibangun di sekitar model sederhana: sistem bisa up atau down. Server offline, layanan mengembalikan error 500, tautan jaringan gagal. Insidennya biner dan langsung. Deteksi cepat, biasanya otomatis. Perbaikannya teknis: pulihkan layanan.
Insiden AI tidak bekerja dengan cara itu. Fungsi Respond dari NIST Cybersecurity Framework menggambarkan incident response sebagai menampung dan mengelola dampak kejadian yang terdeteksi, tetapi CSF dirancang di sekitar kegagalan teknis biner yang dapat terdeteksi. Insiden AI membutuhkan model deteksi dan respons yang secara signifikan berbeda.
Mereka bersifat probabilistik. Sistem AI yang bekerja "baik-baik saja" sebagian besar waktu mungkin membuat keputusan yang salah untuk subpopulasi input tertentu: segmen pelanggan tertentu, tipe dokumen tertentu, bahasa tertentu. Metrik akurasi keseluruhan terlihat dapat diterima. Ekornya gagal dengan buruk.
Mereka bersifat laten. Model scoring yang bias, knowledge base yang berhalusinasi, kerentanan prompt injection, ini bisa beroperasi selama berminggu-minggu atau berbulan-bulan sebelum ada yang menyadarinya. Analogi IT-nya adalah server yang secara diam-diam merusak data 3% dari waktu daripada crash.
Mereka sering tidak terlihat hingga menjadi konsekuensial. AI yang mengirim informasi yang salah kepada pelanggan, membuat keputusan diskriminatif dalam rekrutmen, atau membocorkan data ke dalam konteks prompt tidak menghasilkan error 500. Ini mungkin menghasilkan keluhan pelanggan, pertanyaan regulator, atau panggilan jurnalis.
Akar masalahnya lebih sulit ditemukan. Insiden IT memiliki akar masalah teknis: kesalahan konfigurasi, bug kode, kegagalan perangkat keras. Insiden AI dapat dihasilkan dari perilaku model (model selalu akan gagal pada tipe input ini), desain prompt (prompt tidak konsisten dalam kasus tepi tertentu), kualitas data (data pelatihan atau pengambilan salah), kegagalan integrasi (output yang benar dihasilkan tetapi tindakan yang salah dieksekusi), atau perilaku pengguna (manusia mulai menggunakan alat dengan cara yang tidak dirancang untuknya).
Setiap tipe akar masalah membutuhkan respons yang berbeda.
"Insiden AI tidak mengumumkan dirinya dengan error 500. Model scoring yang bias dapat beroperasi selama berbulan-bulan sebelum ada yang menyadarinya. AI yang mengirim informasi yang salah kepada pelanggan tidak crash. Itu menghasilkan keluhan pelanggan. Proses incident response yang berhasil untuk gangguan IT akan melewatkan sebagian besar kegagalan AI hingga menjadi krisis." (Rework)
4-Type AI Incident Taxonomy
Kerangka klasifikasi untuk mengkategorikan insiden AI berdasarkan tipe akar masalah, memungkinkan diagnosis lebih cepat dan respons yang lebih tepat sasaran. Tipe 1 (Hallucination): AI menghasilkan konten yang secara faktual salah yang kemudian ditindaklanjuti. Tipe 2 (Execute Error): AI mengambil tindakan konsekuensial secara salah, dengan konsekuensi dunia nyata. Tipe 3 (Bias): AI membuat keputusan yang secara sistematis diskriminatif yang memengaruhi subpopulasi; eksposur regulasi tertinggi. Tipe 4 (Data Exposure): input prompt atau output AI mengungkapkan informasi yang seharusnya dilindungi; dapat memicu kewajiban notifikasi 72 jam GDPR Article 33. Tipe 5 (Model Drift): kinerja AI telah terdegradasi seiring waktu tanpa satu momen kegagalan yang dapat terdeteksi; tipe insiden yang paling sering terlewatkan. Setiap tipe memiliki sinyal deteksi yang berbeda, timeline respons, dan pendekatan investigasi akar masalah. Menggunakan protokol respons yang salah untuk tipe insiden menghasilkan resolusi yang lebih lambat dan mungkin melewatkan masalah sistemik.
Taksonomi insiden AI
Sebelum Anda dapat merespons insiden AI, Anda perlu mengetahui jenis insiden apa yang Anda hadapi.
Tipe 1: Insiden halusinasi
AI menghasilkan konten yang secara faktual salah yang kemudian ditindaklanjuti. Pelanggan menerima informasi yang salah tentang cakupan polis mereka. Agen support menggunakan jawaban yang dihasilkan AI untuk menyelesaikan tiket secara salah. Dokumen yang ditulis AI berisi kutipan yang dibuat-buat.
Sinyal deteksi: keluhan pelanggan, tinjauan kualitas internal, laporan karyawan, error sistem downstream yang disebabkan oleh tindak lanjut informasi yang salah.
Pertanyaan kunci dalam respons: Apakah output ditinjau sebelum digunakan? Apakah ini sekali saja atau model secara konsisten berhalusinasi pada jenis pertanyaan ini? Apakah ada perubahan prompt yang akan memperbaikinya?
Tipe 2: Execute error
AI mengambil tindakan konsekuensial secara salah. Ini adalah tipe insiden yang paling sensitif terhadap waktu, karena Execute actions mengubah keadaan dunia. Pengembalian dana yang salah dikeluarkan. Email dikirim ke daftar penerima yang salah. Catatan CRM diperbarui dengan data yang salah. Workflow dipicu yang seharusnya tidak.
Sinyal deteksi: keluhan pelanggan, perbedaan rekonsiliasi keuangan, error proses downstream, laporan karyawan.
Pertanyaan kunci dalam respons: Dapatkah tindakan dibalik? Jika ya, siapa yang berwenang membaliknya dan bagaimana? Siapa yang terpengaruh? Apakah akar masalah ada di model AI, logika trigger, atau integrasi antara output AI dan sistem eksternal?
Tipe 3: Insiden bias
AI membuat keputusan yang secara sistematis diskriminatif. Model scoring secara tidak proporsional merutekan kandidat dari demografi tertentu ke penolakan. AI terkait kredit menolak aplikasi pada tingkat yang berbeda untuk kelompok yang dilindungi. AI rekrutmen menyaring kandidat berdasarkan faktor yang berkorelasi dengan karakteristik yang dilindungi.
Sinyal deteksi: audit demografis atas hasil, laporan karyawan, pertanyaan regulator, tantangan hukum dari individu yang terpengaruh.
Pertanyaan kunci dalam respons: Berapa lama sistem beroperasi dengan bias ini? Berapa banyak individu yang terpengaruh? Remediasi apa yang terutang kepada pihak yang terpengaruh? Apakah model ini masih dalam produksi?
Tipe insiden ini memiliki eksposur regulasi paling parah. Penasihat hukum harus dilibatkan segera.
Tipe 4: Insiden data exposure
Input prompt atau output AI mengungkapkan informasi yang seharusnya dilindungi. Informasi Pelanggan A muncul dalam respons AI Pelanggan B. Data pribadi karyawan dimasukkan dalam konteks prompt yang dapat diakses oleh pengguna yang tidak berwenang. Data internal rahasia dikirim ke sistem AI vendor yang tidak berwenang menerimanya.
Sinyal deteksi: keluhan pelanggan tentang melihat data pengguna lain, audit internal, laporan karyawan, monitoring alert tentang pelanggaran klasifikasi data.
Pertanyaan kunci dalam respons: Data apa yang terekspos? Kepada siapa? Apakah itu personally identifiable information (PII), protected health information (PHI), data keuangan, atau data bisnis rahasia? Apakah ini peristiwa satu kali atau cacat sistematis?
Catatan GDPR Article 33: jika eksposur melibatkan data pribadi penduduk EU, Anda mungkin memiliki kewajiban notifikasi 72 jam kepada otoritas pengawas yang relevan. Ini bukan opsional. Batas waktu dimulai ketika Anda menjadi sadar akan insiden, bukan ketika Anda menyelesaikan investigasi.
Tipe 5: Model drift
Kinerja AI telah terdegradasi dari waktu ke waktu tanpa ada yang menyadarinya. Model scoring yang akurasi 78% di Q1 berada di akurasi 61% di Q3. Sistem pengambilan yang mengembalikan dokumen yang benar sekarang mengembalikan yang sudah usang. Kualitas generasi yang dapat diterima telah terdegradasi seiring perubahan model atau konteks pengambilan.
Sinyal deteksi: metrik monitoring (jika telah dibangun), metrik hasil bisnis (lead conversion rate menurun, kepuasan pelanggan turun, kualitas resolusi tiket support menurun), laporan karyawan bahwa AI "tidak sebaik dulu."
Ini adalah tipe insiden yang paling sering terlewatkan karena tidak ada satu momen kegagalan. Ia menumpuk.
Kerangka respons 4 tingkat

Setelah mengidentifikasi tipe insiden, tingkatnya menentukan siapa yang merespons, seberapa cepat, dan apa yang terjadi pertama.
Tier 4: Investigate
Kriteria: Error output AI internal, tidak ada eksposur eksternal, tidak ada dampak pelanggan belum. Halusinasi yang ditemukan selama tinjauan kualitas internal. Output Generate yang salah tetapi tidak ditindaklanjuti. Model drift yang terdeteksi oleh monitoring internal sebelum memengaruhi hasil.
Jendela respons: 24 jam untuk penilaian awal.
Siapa yang merespons: Tim yang bertanggung jawab atas sistem AI. Tidak diperlukan eskalasi kecuali penilaian mengungkapkan eksposur eksternal.
Tindakan: Dokumentasikan insiden dalam AI risk register. Tentukan akar masalah. Nilai apakah masalahnya sistemik atau terisolasi. Implementasikan perbaikan atau solusi sementara. Jadwalkan tinjauan pasca-insiden.
Tier 3: Contain
Kriteria: Output yang salah yang customer-facing tetapi tidak ditindaklanjuti oleh pelanggan. Respons chatbot yang salah tetapi pelanggan tidak menindaklanjutinya. Draft email dengan informasi yang salah yang tertangkap sebelum dikirim.
Jendela respons: 4 jam untuk keputusan penahanan.
Siapa yang merespons: Team lead ditambah kontak keamanan IT. Notifikasi manajemen (tidak diperlukan eskalasi ke CIO kecuali menjadi Tier 2 atau lebih tinggi).
Tindakan: Tahan masalah (nonaktifkan fitur AI yang terpengaruh jika masih menghasilkan output yang salah). Nilai luas: apakah pelanggan ini terpengaruh, atau mungkin yang lain? Dokumentasikan. Tentukan apakah komunikasi pelanggan proaktif diperlukan (biasanya tidak untuk Tier 3, kecuali output yang salah dapat menyebabkan kerugian pelanggan jika mereka kemudian menindaklanjutinya).
Tier 2: Incident response
Kriteria: Execute error customer-facing, insiden data exposure yang sudah ditahan, halusinasi yang ditindaklanjuti oleh pelanggan.
Jendela respons: 1 jam untuk respons awal, manajemen berkelanjutan hingga terselesaikan.
Siapa yang merespons: CIO dan pemimpin keamanan diberitahu dalam satu jam. Penasihat hukum dalam keadaan siaga. Tim komunikasi terlibat untuk pembuatan draft notifikasi pelanggan.
Tindakan: Nilai dampak (berapa banyak pelanggan, data apa, tindakan apa yang diambil). Tahan (nonaktifkan workflow yang terpengaruh, balikkan Execute actions jika memungkinkan). Rencana komunikasi pelanggan: apakah pelanggan yang terpengaruh perlu diberitahu? Apa yang perlu mereka ketahui? Penilaian notifikasi regulasi: apakah ini merupakan pelanggaran yang dapat diberitahukan menurut GDPR Article 33? Dokumentasikan segalanya secara real-time.
Tier 1: Crisis
Kriteria: Eksposur regulasi dikonfirmasi atau kemungkinan, dampak pelanggan berskala besar, insiden bias dengan individu yang terpengaruh, data exposure melibatkan data pribadi sensitif dalam skala.
Jendela respons: Segera. Chief executive officer (CEO) dan General Counsel harus terlibat dalam satu jam pertama.
Siapa yang merespons: Kepemimpinan eksekutif, penasihat hukum, komunikasi eksternal, urusan regulasi jika berlaku.
Tindakan: Keputusan eksekutif tentang apakah menangguhkan sistem AI sepenuhnya sambil menunggu investigasi. Penasihat hukum eksternal dilibatkan. Komunikasi pelanggan dan regulator dibuat draft dan ditinjau. Tinjauan pasca-krisis dijadwalkan. Jika data pribadi EU terlibat dan pelanggaran dapat diberitahukan, batas waktu 72 jam di bawah GDPR Article 33 sedang berjalan.
GDPR Article 33 dan persyaratan notifikasi
GDPR Article 33 mewajibkan notifikasi ke otoritas pengawas yang relevan dalam 72 jam setelah menjadi sadar akan pelanggaran data pribadi, kecuali pelanggaran tersebut "tidak mungkin mengakibatkan risiko terhadap hak dan kebebasan orang perseorangan."
Insiden AI mungkin merupakan pelanggaran data pribadi jika:
- Sistem AI memproses data pribadi dengan cara yang mengakibatkan pengungkapan yang tidak sah
- Output AI yang berisi data pribadi dikirim ke penerima yang tidak berwenang
- Sistem AI membuat keputusan otomatis menggunakan data pribadi dengan cara yang tidak diungkapkan kepada subjek data
- Injeksi prompt atau eksploitasi lain menyebabkan eksfiltrasi data
Batas waktu 72 jam dimulai ketika Anda menjadi sadar akan pelanggaran, bukan ketika investigasi selesai. Anda dapat mengajukan notifikasi awal yang mengatakan "kami mengetahui insiden, investigasi sedang berlangsung" dan melengkapinya nanti. Menunggu hingga investigasi selesai sebelum memberitahu tidak sesuai.
Untuk organisasi berbasis AS yang beroperasi di industri yang diatur, persyaratan analog ada: Aturan Pemberitahuan Pelanggaran HIPAA untuk pelanggaran PHI, aturan pengungkapan keamanan siber SEC untuk insiden keamanan siber yang material, dan undang-undang pemberitahuan pelanggaran tingkat negara bagian.
Tinjauan pasca-insiden: analisis akar masalah AI
Tinjauan pasca-insiden untuk insiden AI mengikuti struktur yang berbeda dari post-mortem IT standar.
Post-mortem IT bertanya: kegagalan teknis apa yang menyebabkan gangguan? Perbaiki kegagalan teknis, pulihkan layanan.
Tinjauan pasca-insiden AI mengajukan empat pertanyaan:
Apakah ini kegagalan model? Apakah AI menghasilkan output yang salah karena model yang mendasarinya salah, berhalusinasi, atau berkinerja buruk pada tipe input ini? Jika ya: perubahan prompt, peningkatan pengambilan, atau pembaruan model apa yang akan mencegah pengulangan? Haruskah model ini terus digunakan untuk use case ini?
Apakah ini kegagalan prompt atau desain? Apakah AI menghasilkan output yang salah karena promptnya ambigu, jendela konteks tidak cukup, atau workflow tidak dirancang untuk menangani input ini? Jika ya: ini sering merupakan akar masalah yang paling mudah diperbaiki. Desain ulang template prompt, tambahkan validasi input, atau tambahkan guardrail.
Apakah ini kegagalan data? Apakah AI menghasilkan output yang salah karena data pengambilan sudah usang, data pelatihan bias, atau data input cacat? Jika ya: governance data adalah perbaikannya, bukan model.
Apakah ini kegagalan integrasi? Apakah AI menghasilkan output yang benar tetapi integrasi antara sistem AI dan sistem Execute downstream gagal? Jika ya: akar masalah governance AI kurang penting dari perbaikan engineering integrasi. Namun juga: apakah ada langkah tinjauan manusia yang seharusnya menangkap ini sebelum Execute?
Dokumentasikan akar masalah dalam AI risk register. Perbarui dokumen governance AI yang relevan. Jika insiden mengungkapkan celah dalam desain human-in-the-loop Anda, perbaiki celah tersebut.
Membangun budaya pelaporan

Celah paling berbahaya dalam program AI incident response apapun bukan playbook. Ini adalah karyawan yang melihat masalah dan tidak melaporkannya.
Karyawan yang menyadari bahwa chatbot AI memberikan informasi pengembalian dana yang salah Selasa lalu. Seorang insinyur yang melihat pola anomali dalam log output AI tetapi tidak yakin apakah itu penting. Customer success manager yang mendengar keluhan tentang rekomendasi yang dihasilkan AI tetapi menganggapnya sebagai satu kali kejadian.
Setiap dari ini adalah sinyal awal. Sebagian besar insiden AI yang menjadi krisis dimulai sebagai sinyal yang dilihat dan tidak ditindaklanjuti.
Membangun budaya pelaporan berarti tiga hal:
Buat pelaporan mudah. Satu saluran internal, satu formulir, satu alamat email. Karyawan tidak seharusnya harus menelusuri bagan organisasi untuk melaporkan masalah AI potensial.
Buat pelaporan aman. Karyawan yang melaporkan masalah tidak boleh disalahkan atas insiden atau karena membunyikan alarm palsu. Respons terhadap laporan, bahkan jika ternyata bukan insiden, harus "terima kasih telah menandai ini." Jika pelapor merasa disalahkan, mereka akan berhenti melapor.
Buat pelaporan terlihat. Ketika laporan mengarah pada insiden yang tertangkap lebih awal, beri tahu tim. Bukan "kami mengalami insiden besar" tetapi "karena seseorang menandai anomali minggu lalu, kami menangkap masalah sebelum memengaruhi pelanggan." Bukti sosial bahwa pelaporan penting membangun kebiasaan.
Dokumen governance, audit trail, dan tingkat respons semuanya ada untuk mengelola insiden setelah terjadi. Budaya pelaporan adalah yang menentukan apakah Anda menemukan masalah lebih awal atau terlambat.
Apa yang tidak digantikan oleh playbook ini
Playbook ini mengatur incident response khusus AI. Ini tidak menggantikan proses IT incident response Anda yang ada, proses respons pelanggaran data Anda di bawah GDPR atau CCPA (California Consumer Privacy Act), atau proses insiden HR Anda untuk keluhan terkait diskriminasi. Proses-proses tersebut masih berlaku. Untuk insiden yang melibatkan kegagalan AI dan pelanggaran data, kedua playbook berjalan secara paralel.
Hubungkan playbook ini dengan kerangka audit trail, yang menyediakan bukti yang Anda butuhkan selama investigasi insiden. Hubungkan dengan kebijakan penggunaan AI, yang mendefinisikan lingkup tindakan AI yang diotorisasi. Dan hubungkan dengan AI risk register, yang merupakan tempat pola risiko yang diketahui dari insiden masa lalu didokumentasikan sehingga insiden masa depan terdeteksi lebih cepat.
Analisis Rework: Berdasarkan pola insiden AI enterprise, alasan paling umum insiden AI kecil meningkat menjadi krisis bukan insidennya sendiri tetapi penundaan deteksi. Insiden bias yang memengaruhi 15% output model scoring dapat berjalan selama 8-12 minggu sebelum muncul dalam metrik bisnis. Data exposure dalam konteks AI bersama mungkin tidak muncul hingga pelanggan melaporkan melihat data pengguna lain. Bagian budaya pelaporan dari playbook ini ada karena mekanisme deteksi tercepat adalah manusia yang menyadari sesuatu dan melaporkannya. Setiap minggu penundaan deteksi menggandakan eksposur regulasi, jumlah pelanggan yang terpengaruh, dan kompleksitas remediasi.
Tujuannya bukan memiliki playbook yang tidak pernah perlu digunakan. Ini untuk siap ketika Anda harus menggunakannya.
Dan perusahaan yang menjalankan respons insiden paling bersih adalah yang membangun budaya pelaporan jauh sebelum insiden pertama. Jadi pertanyaan sebenarnya adalah: apakah tim Anda tahu ke mana harus pergi ketika mereka melihat sesuatu yang salah?
Lihat juga:
- AI Approval Gates dan Vendor Review: gate pra-deployment yang mengurangi seberapa sering Anda membutuhkan playbook ini
- Klasifikasi Data untuk Aturan Akses AI: kerangka tingkat data yang menentukan apakah insiden Tipe 4 membutuhkan notifikasi pelanggaran
- Tahap 3 ke 4: Dari Scaled ke Integrated: mengapa incident response formal menjadi non-opsional di Tahap 4
- Agenda AI CEO 18 Bulan: di mana infrastruktur incident response masuk dalam Fase 1 roadmap transformation

Co-Founder & CMO, Rework
On this page
- Bagaimana insiden AI berbeda dari insiden IT
- 4-Type AI Incident Taxonomy
- Taksonomi insiden AI
- Tipe 1: Insiden halusinasi
- Tipe 2: Execute error
- Tipe 3: Insiden bias
- Tipe 4: Insiden data exposure
- Tipe 5: Model drift
- Kerangka respons 4 tingkat
- Tier 4: Investigate
- Tier 3: Contain
- Tier 2: Incident response
- Tier 1: Crisis
- GDPR Article 33 dan persyaratan notifikasi
- Tinjauan pasca-insiden: analisis akar masalah AI
- Membangun budaya pelaporan
- Apa yang tidak digantikan oleh playbook ini