Dirilis pertama kali pada tahun 2007, perpustakaan ini sangat erat dikaitkan dengan NumPy dan SciPy, serta dianggap sebagai salah satu perpustakaan terbaik untuk bekerja dalam lingkungan data yang kompleks.
Pustaka ini berisi sejumlah algoritme untuk menerapkan pembelajaran mesin standar dan tugas-tugas penambangan data seperti mengurangi dimensi, klasifikasi, regresi, pengelompokan data, dan pemilihan model.
Untuk dapat mengoperasikannya, scikit-learn mendukung sistem operasi Windows dan Linux. Menariknya, scikit-learn menyediakan panduan pengguna yang luas sehingga para ilmuwan data dapat dengan cepat mengakses sumber daya apa pun yang ada mulai dari algoritme multikelas, multilabel, hingga estimasi kovarian.
Pandas
Sumber gambar: pythonawesome.com
Merupakan pustaka pembelajaran mesin dengan Python yang menyediakan struktur data tingkat tinggi dan beragam alat untuk melakukan analisis data. Salah satu fitur unggulan dari perpustakaan ini adalah kemampuannya untuk menerjemahkan operasi yang kompleks dengan mengandalkan data dari satu atau dua perintah saja.
Pandas juga memiliki banyak kemampuan menarik dalam hal pengelompokan, penggabungan, dan pemfilteran data. Perpustakaan di Pandas juga terus melakukan pembaharuan yang tentunya mencakup ratusan fitur baru, perbaikan celah, peningkatan, dan perubahan API.
Pembaharuan yang terus dilakukan Pandas tersebut juga termasuk peningkatan kemampuannya seperti mengelompokkan dan mengurutkan data, memilih keluaran yang paling sesuai untuk metode yang berlaku, dan menyediakan dukungan untuk melakukan operasi jenis kostum.