Keamanan siber memberikan analogi yang tepat untuk hal tersebut: “garbage in, garbage out.” Seperti halnya praktik kebersihan siber, kualitas dan seleksi data yang digunakan untuk membuat model sangatlah berpengaruh terhadap hasil, sehingga mampu mendeteksi anomali secara akurat sekaligus membantu mengembangkan inovasi.
Pertanyaannya adalah bagaimana kita bisa mencegah keracunan data? Kuncinya terletak pada proses pengambilan dan pemilihan data yang dilakukan dengan cermat, sehingga dapat menghindari akumulasi data yang sembrono. Perhatian khusus terhadap pengumpulan data yang berkualitas tinggi akan menjaga keakuratan output dari suatu model, terlepas dari apakah model tersebut merupakan model eksklusif atau open source. Kuantitas data tidak menjadi penentu utama dalam menentukan efektivitas suatu model, melainkan kualitas dan relevansi dari data yang dihasilkan.
Data untuk Internet yang Tidak Bias dan Aman
Transparansi algoritma memerlukan kejelasan mengenai cara kerja algoritma secara umum. Sebagai contoh, sebuah algoritma pengambil keputusan pinjaman (loan decision-making algorithm) sebaiknya memberikan penjelasan mengenai faktor-faktor yang perlu dipertimbangkan (pendapatan, skor kredit) beserta bobot dari masing-masing faktor tersebut. Akuntabilitas algoritm sebagai padanan dari transparansi, mengharuskan entitas pengguna bertanggung jawab atas pengambilan keputusan algoritmanya, terutama apabila hasilnya menunjukkan indikasi terjadinya bias atau diskriminasi.
Pertimbangkan penggunaan machine learning pada Intrusion Detection Systems (IDS), yang memantau jaringan dari potensi ancaman atau pelanggaran kebijakan. Machine learning meningkatkan kemampuan IDS dengan mengaktifkan kemampuan mengenali ancaman berdasarkan data yang sudah ada sebelumnya. Namun, terlepas dari kemajuan ini, transparansi, dan akuntabilitas yang sudah diterapkan, tantangan akan tetap ada.
Dalam konteks ini, transparansi algoritma menjelaskan bahwa pengguna IDS harus memahami dasar pengambilan keputusan. Apa karakteristik yang mengisyaratkan adanya ancaman? Bagaimana cara membedakan aktivitas normal dan berbahaya? Meskipun mengungkapkan mekanisme sistem yang tepat malah justru dapat membantu calon penyerang, dan tentunya harus dihindari, pengguna harus memiliki informasi yang cukup untuk memercayai dan menjalankan sistem secara efektif.
Akuntabilitas algoritma menimbulkan pertanyaan tentang tanggung jawab jika terjadi kesalahan respon positif atau negatif. Provider IDS harus bisa bertanggung jawab terhadap kesalahan ini, terutama jika timbul dari kelemahan-kelemahan yang terkait algoritma.
Di sini, tantangannya terletak pada cara menjaga keseimbangan antara transparansi dan akuntabilitas, melindungi kepentingan kepemilikan, dan mencegah penyerang memperoleh keuntungan yang tidak semestinya. Ini adalah tugas yang meliputi banyak aspek, memerlukan pertimbangan yang berbeda-beda dan pendekatan yang seimbang. Tak kalah pentingnya adalah memahami kompleksitas teknis dalam memahami proses pengambilan keputusan oleh beberapa algoritma, seperti neural network, dan melindungi informasi kepemilikan. Terlepas dari hambatan-hambatan ini, konsensus di antara para ahli sudah jelas: kita harus berupaya meningkatkan transparansi dan akuntabilitas yang terkait dengan algoritma.