Tahapan ketiga adalah Triage & Notify yang dijelaskan oleh Danish Jatmiko (Engineering Manager – Order & Campaign Tokopedia).
Tahapan ini menjelaskan tentang apa yang perlu dilakukan saat insiden datang. Jika sebelumnya Alerting & Monitoring sudah disiapkan dengan baik, maka kita akan memiliki sistem yang bagus.
Melalui Alerting & Monitoring, kita dapat mengetahui keadaan atau kesehatan sistem kita. Lalu, apa yang harus dilakukan jika ternyata terjadi suatu insiden terhadap sistem?
Danish menjelaskan bahwa hal pertama yang perlu dilakukan adalah menjaga agar kita tidak panik. Terlebih, sebagai pemimpin kita perlu mengendalikan dan mengatur situasi yang terjadi.
“Kita perlu menenangkan pikiran agar dapat mengambil keputusan dan membaca kondisi dengan maksimal. Selanjutnya, kita juga perlu mengetahui kondisi sistem kita seperti apa agar dapat mengenali dan mengidentifikasi musuh kita. Hal ini dapat membantu kita untuk mengetahui kelemahan dan kelebihan yang kita miliki,” kata Danish.
Sebagai contoh, ketika traffic sedang mengalami down, kita perlu tahu apa penyebabnya, apakah karena koneksi, PPN, atau servis lainnya. Dengan Alerting & Monitoring, kita dapat langsung mengetahui penyebabnya serta bagaimana kita dapat mengatasi hal tersebut.
Lebih lanjut, ia menyatakan bahwa kita juga perlu tahu mengenai dampak yang terjadi setelahnya, baik itu dampak pada halaman penjualan, transaksi penjualan, dan sebagainya.
Setelah kita mengetahui semua dampak yang akan terjadi, kita bisa melakukan over communicate kepada stakeholder yang memiliki andil terhadap produk/platform tersebut, seperti tim produk dan tim operasional yang akan membantu menyampaikan informasi terkait kendala sistem ini kepada pengguna.
“Dengan over communicate, kita dapat mencegah terjadinya hal-hal yang tidak diinginkan oleh pengguna maupun penjual Tokopedia,” cetus Danish.
Tahap IV: Post-Mortem Investigation and Resolution
Tahapan terakhir pada manajemen insiden adalah Post-Mortem Investigation and Resolution yang dijelaskan oleh Viriya Saddha Pannindriya (Software Engineer Lead – Order Tokopedia).
Pada tahap ini, kita perlu mencari tahu lebih dalam dan mendetail mengenai penyebab dari insiden yang terjadi. Viriya menjelaskan bahwa ketika mengalami insiden, kita menjadi panik dan mencari solusi dengan cara yang cepat.
Penulis | : | Rafki Fachrizal |
Editor | : | Rafki Fachrizal |
KOMENTAR