Berbagai data menunjukkan, kebutuhan akan data scientist saat ini sedang meledak, dan akan terus meningkat dalam beberapa tahun ke depan. Akan tetapi, ledakan kebutuhan ini tidak dibarengi ketersediaan talenta. Dari pembicaraan dengan CIO berbagai perusahaan, InfoKomputer sering mendengar keluhan sulitnya mendapatkan talenta data scientist di Indonesia.
Karena itu jika Anda ingin mudah mendapatkan pekerjaan, menjadi data scientist adalah salah satu pilihan menarik.
Skills atau pengetahuan apa sih yang dibutuhkan untuk menjadi data scientist?
Menurut Ardya Dipta Nandaviri (Senior Data Scientist Gojek), seorang data scientist di Gojek harus memiliki end-to-end skills mulai dari analytical thinking, statistik, sampai pemahaman bisnis. Namun ekspektasi terhadap data scientist bisa berbeda di tiap perusahaan. “Di beberapa perusahaan lain, setahu saya sangat fokus pada riset mendalam, sehingga pemahaman bisnis kurang dibutuhkan,” ungkap pria yang akrab dipanggil Dipta ini.
Sedangkan untuk software, Dipta menyebut seorang data scientist harus menguasai:
- Bahasa pemrograman, utamanya Python. Alasanya Python dapat digunakan di belahan dunia manapun. Python juga memiliki koleksi library yang sudah sangat umum dan open source. Bahasa pemrograman lain adalah R.
- Data visualization libraries: Matplotlib, plotly atau seaborn untuk Python, ggplot untuk R
- Machine Learning libraries: scikit-learn, tensorflow, xgboost untuk Python,
- Dashboard software: Tableau, Metabase
Untuk mendapatkan skills di semua software tersebut, Dipta memberikan rekomendasi buku dan beberapa kursus online yang umumnya gratis. Berikut daftarnya.
Probabilitas dan Statistik
- Statistics and Probability - Khan Academy (gratis)
- Harvard Stats 110 di Youtube (gratis)
- Buku Think Stats - Allen B. Downey (gratis)
Machine Learning
- Machine Learning - Andrew Ng di Coursera (gratis materinya, hanya berbayar jika butuh sertifikat). Menurut Dipta, ini adalah kursus online terbaik hingga saat ini untuk memahami machine learning secara mendalam.
- CMU Machine Learning 10-701 by Tom Mitchell (video lecture gratis)
- Fast.ai (gratis)
- Machine Learning A-Z: Hands-On Python & R in Data Science di Udemy
- Buku Machine Learning - Tom Mitchell
- Buku Elements of Statistical Learning
- Buku Pattern Recognition - Bishop
Data Visualization
- Matplotlib tutorial series by Sentdex di Youtube (gratis)
- Data Visualization in R tutorial series by Roger Peng di Youtube (gratis)
Business Acumen
- Buku McKinsey Mind
- Buku Case Interview Secrets - Victor Cheng
- The Pyramid Principle - Barbara Minto (sangat bagus untuk mempelajari bagaimana mendefinisikan dan breakdown problem).
Nah, itu adalah rekomendasi Dipta untuk menjadi data scientist. Tertarik?