Tags Posts tagged with "data mining"

data mining

charts_graphs

Sudah menjadi pengetahuan umum bahwa Indonesia merupakan salah satu negara yang merajai ranah media sosial.

Indonesia berada di peringkat keempat negara dengan pengguna Facebook terbanyak (data Socialbakers, Maret 2014) serta peringkat ketiga negara dengan pengguna aktif terbanyak di Twitter (data PeerReach, November 2013).

Statistik ini semestinya tidak mengejutkan. Populasi pengguna internet Indonesia diperkirakan akan mencapai 83 juta orang pada tahun 2014. Lebih dari 58% di antaranya berusia muda, 12 – 34 tahun. Bagi kalangan ini, media sosial bisa jadi alasan utama mereka untuk terhubung ke internet.

Menurut data We Are Social pada Januari 2014, pengguna internet Indonesia rata-rata menghabiskan waktu selama 2 jam 54 menit di media sosial setiap hari. Kebutuhan untuk eksis di dunia maya, berbagi informasi, dan berkomunikasi dengan orang lain membuat mereka begitu aktif di media sosial.

Namun, cukuplah berbicara tentang statistik. Secantik apa pun data berbicara, tetap tidak ada artinya kalau tidak bisa dimanfaatkan menjadi sesuatu yang berguna. Ratusan, atau mungkin ribuan, tweet dan post di Facebook yang dikirimkan tiap detik hanya akan tampil selewat kalau tidak ada yang membacanya.

Padahal, aktivitas pengguna media sosial merupakan wujud percakapan yang tertulis dan bisa terekam sepanjang masa. Berbeda dengan perbincangan verbal yang biasa dilakukan sehari-hari di luar media sosial.

Jutaan pengguna Twitter dan Facebook berarti jutaan opini dan kicauan yang berbeda. Dan seperti biasanya, di mana ada banyak orang berkumpul dan berbincang, di sanalah terbuka peluang bagi siapa saja yang memerlukan massa. Perusahaan yang ingin memasarkan produknya, organisasi yang berkepentingan untuk menyebarkan pengaruhnya, dan juga tokoh politik yang membutuhkan dukungan publik.

Di tahun politik ini, begitu ramai partai dan tokoh politik terjun ke media sosial. Mereka tampaknya berkaca dari contoh sukses Joko Widodo (Gubernur DKI Jakarta), Ahmad Heryawan (Gubernur Jawa Barat), Ganjar Pranowo (Gubernur Jawa Tengah), dan Ridwan Kamil (Walikota Bandung). Empat tokoh ini terbilang rajin berinteraksi di Twitter, Facebook, dan YouTube sehingga mampu menarik simpati dan dukungan pengguna media sosial.

Inilah yang menambah seru percaturan politik menjelang Pemilu 2014. Di masa ini, internet dan media sosial telah berkembang menjadi sumber informasi kedua setelah televisi, mengalahkan surat kabar dan radio. Sesuatu yang tidak kita temui pada Pemilu 2009.

Ibarat Menambang Emas

Berbicara soal kemampuan untuk membaca dan menganalisis tren percakapan di media sosial, tidak semua pihak memilikinya.

Dengan jutaan kicauan baru setiap hari, tidak berlebihan kalau media sosial juga tergolong ke dalam kategori big data. Dibutuhkan keahlian dalam data mining, data analytics, semantic web, natural language processing, machine learning, dan cabang ilmu teknologi informasi lainnya. Tak hanya itu, diperlukan pula pemahaman terhadap ilmu komunikasi dan media massa.

Seiring banyaknya pihak yang menyadari potensi media sosial untuk ajang promosi, pemasaran, dan kampanye, bermunculanlah penyedia jasa social media monitoring dan social media analytics. Keahlian utama mereka adalah mengawasi, merekam, dan mengolah perbincangan di media sosial menjadi wawasan (insight) yang bermanfaat bagi yang membutuhkan.

Salah satunya adalah Awesometrics. Perusahaan ini berawal dari hasil riset Irfan Fahmi ketika sedang menjadi peneliti di Universitas Groningen, Belanda. Ia mempunyai situs agregasi berita yang diklasifikasi sesuai kategori berbasis Natural Language Processing. Situs ini bisa melihat sudut pandang tiap media dalam membahas suatu topik.

Pertemuan dengan Tomi Satryatomo, praktisi media berpengalaman, kemudian melahirkan inisiatif untuk membuat engine untuk mengukur sejauh mana terpaan (amplifikasi) media ke masyarakat. Lebih jauh lagi, Awesometrics juga memperhitungkan percakapan di media sosial untuk mengukur kekuatan sebuah isu.

“Awesometrics bisa melihat pemberitaan [di media cetak dan online] sekaligus percakapan [di media sosial]. Karena sekarang itu imbal balik, ada informasi dari pemberitaan yang menjadi percakapan, tapi ada juga percakapan yang berkembang menjadi pemberitaan,” ujar Hari Ambari (Business Analyst, Awesometrics).

Jenis sumber yang diamati Awesometrics meliputi media cetak, media online, media sosial, dan jika dibutuhkan, televisi dan radio. Seluruh data dari sumber-sumber ini dikumpulkan (data crawling), kemudian difilter berdasarkan keyword dan requirement tertentu sesuai definisi setiap proyek. Data-data ini juga diambil sampelnya untuk dipelajari oleh mesin guna menentukan sentimen setiap berita dan percakapan, apakah positif, negatif, atau netral.

“Ibarat menambang emas, kami menggunakan data mining. Di mana ada data yang insightful, di situ kita menggali,” imbuh Hari.

Layanan utama Awesometrics adalah social media monitoring dan analytics. Kalau sebatas monitoring, mereka akan menyediakan data mentah serta dashboard-nya bagi klien untuk memproses sendiri. Sementara itu, jasa analytics mencakup perencanaan riset, crawling, analisis, kalkulasi, sampai laporan, kesimpulan, dan rekomendasi tindakan.

Dashboard Awesometrics bisa membandingkan jumlah pembicaraan di social media dan online news tentang suatu keyword. Kita bisa tahu media mana saja yang paling banyak membuat berita tentang keyword tertentu. Kita bisa menilai PR value, engagement, dan potensi reach-nya,” papar Wahyu Saputra (IT & Operations Manager, Awesometrics).

“Logika sederhananya, dashboard kami itu seperti [balok permainan] Lego. Bentuknya generik, tapi terserah kita mau membentuknya seperti apa,” Hari menambahkan.

Di dalam dunia politik, Awesometrics sanggup mengukur suatu brand, baik partai maupun tokoh politik, secara kemasan dan atribut. Hari mencontohkan figur Jokowi yang lekat dengan identitas “sederhana”. Melalui analytics, Jokowi bisa dibandingkan dengan Dahlan Iskan dalam hal “sederhana” ini dari pemberitaan dan perbincangan publik.

Di sisi lain, Awesometrics juga menilai kebutuhan masyarakat di media sosial. Sebetulnya kriteria pemimpin seperti apa yang mereka inginkan, atribut mana yang didukung banyak massa. Misalkan, sekarang lebih banyak orang ingin memilih pemimpin yang tegas. Dengan demikian, partai bisa menggiring tokohnya untuk menampilkan identitas tersebut.

“Asumsi dasarnya, tokoh yang paling dekat dan kuat secara identitas dengan harapan masyarakat, dia yang akan unggul,” tukas Hari.

Hari belum dapat menyimpulkan bahwa kepopuleran suatu partai atau tokoh di media sosial akan menjamin kemenangan di pemilihan umum. Contoh kasusnya masih terlalu sedikit sehingga belum ada standar yang terlihat.

Sementara itu, mengenai besarnya pengaruh media sosial terhadap persepsi masyarakat, ia melihat dampaknya masih terasa lebih besar di perkotaan dengan pengguna di kalangan muda. “Artinya, media sosial relevan bagi partai atau tokoh yang mengincar target market ini. Penting bagi mereka untuk menang di sebanyak mungkin meda pertempuran, termasuk media sosial. Kalau tidak di-manage, kompetitornya yang akan menang,” pungkas Hari.

Unggul daripada Survei

Lembaga lain yang juga bermain di industri analisis media sosial adalah MediaWave Analytics. Awalnya, mereka membuat social media monitoring untuk brand supaya mereka mengetahui persepsi konsumen terhadap produk mereka. Ketika memutuskan untuk melayani klien politik melalui PoliticaWave, tujuannya yaitu mengetahui harapan masyarakat terhadap para kandidat.

Selama ini, suara masyarakat didengarkan melalui survei. Tapi, survei memiliki kelemahan yakni tidak bisa dilakukan secara real time. Survei biasanya dilaksanakan tiga bulan sekali, sedangkan isu-isu yang ada di masyarakat saat ini sangat cepat berubah. “Oleh karena itulah, politisi membutuhkan social media monitoring,” kata Yose Rizal (Founder & CEO, MediaWave Analytics).

Layanan PoliticaWave mempergunakan engine dari MediaWave yang dapat menangkap percakapan dari berbagai media digital di Indonesia. Engine ini kemudian melakukan indexing, apakah percakapan itu termasuk positif atau negatif. Lalu, insight terhadap data ini dikerjakan oleh tim analis sampai menghasilkan grafik-grafik sesuai kebutuhan. Rangkaian proses ini dikerjakan oleh sebuah tim yang terdiri dari IT, analyst, data producer, dan strategist.

“Dalam [analisis media sosial di] politik yang sudah kami monitor, terbukti 8 dari 10 hasil akhirnya benar dan akurat,” Yose mengklaim. Dari pengalaman yang pernah ia lalui, sekitar 80% topik yang dibicarakan di media sosial memang merefleksikan kondisi yang sebenarnya. Misalnya, Jakarta banjir dan macet.

Refleksi Masyarakat

Antusiasme pelaku politik terhadap layanan social media analytics juga dialami oleh Deddy Rahman (Founder & CEO, Katapedia). Awalnya, ia memperoleh proyek untuk membuat aplikasi media tracking yang bisa menelusuri pemberitaan di media online. Proyek ini gagal berlanjut. Tapi, aplikasi ini tetap ia kembangkan sendiri sampai memperoleh suntikan dana dari investor.

“Sebetulnya saya tidak ada niat untuk menggunakan Katapedia ini untuk kebutuhan politik. Niat awalnya untuk perusahaan agar mereka tahu yang diinginkan konsumen terhadap brand mereka. Tapi, ternyata klien pertama kami justru dari partai politik. Setelah itu, banyak BUMN juga yang menjadi klien kami,” Deddy bercerita.

Katapedia mengambil sumber data dari media online (melalui RSS feed) dan media sosial (dari API Twitter dan Facebook). Data dari media online bisa menghasilkan popularitas kandidat, sentimen terhadap kandidat, serta tren dan isu yang sedang berkembang. Sementara itu, data dari media sosial menghasilkan popularitas kandidat secara real time dan tren per hari/jam yang teramati dari suatu campaign. Bisa pula dianalisis mengenai brand association (persepsi publik mengenai atribut-atribut tertentu terhadap kandidat).

Engine Katapedia dibuat oleh alumnus Teknik Informatika ITB. Sistem ini terus di-update dan bisa dikustomisasi tergantung kebutuhan klien. Peranti ini akan menangkap data, lalu mengirimkannya ke analyst. Hasil akhir berupa grafik dan angka, misalnya grafik popularitas, influencer, dan lokasi, kemudian disampaikan kepada para klien.

“Saya melihat media sosial itu refleksi dari sentimen masyarakat. Kalau ingin tahu parpol disukai atau tidak, tinggal dilacak saja di media sosial,” kata Deddy. Ia mengklaim bahwa hampir semua prediksi yang pernah dibuat Katapedia di panggung politik sesuai dengan hasil akhirnya. Misalnya Pilkada DKI, Bandung, Palembang, Sumsel, dan Sumut. Ada juga yang melenceng dari hasil akhirnya, yaitu di kota Tangerang. Tapi, ia beralasan, jumlah pembicaraan tentang pilkada kota Tangerang di media sosial memang kurang dari 50 sehingga tidak bisa merefleksikan suara pemilihnya.

“Nanti, di masa depan, suara rakyat bisa dicerminkan dari suara di media sosial. Kemenangan atau kekalahan suatu partai atau kandidat akan bisa terdeteksi [dari media sosial],” pungkas Deddy.

Customers are overfished. Terlalu banyak bank yang memancing pelanggan baru di area yang sama,” demikian Erwin Sukiato (Country Manager SAS Indonesia) mengungkapkan fakta yang terjadi masa kini.

Hal ini mengakibatkan terlalu banyak penawaran dari bank-bank yang berbeda, contohnya layanan kartu kredit dan pinjaman kredit tanpa agunan (KTA). Hasilnya, masyarakat menjadi jenuh dan malah antipati terhadap institusi keuangan.

Padahal, bisa jadi di wilayah yang lain, terdapat pasar yang belum terjamah. Atau mungkin juga, kekeliruan terletak pada keputusan bisnis yang selama ini dilakukan berdasarkan insting semata, tanpa membaca kebutuhan masyarakat.

“Pemikiran pragmatis seringkali ternyata salah ketika dilihat dari kacamata behavior analytics,” kata Erwin. Menurutnya, bisnis memerlukan customer intelligence untuk menentukan target pelanggan, membantu memutuskan aksi marketing terbaik, serta memaksimalkan dampaknya. Keharusan memahami pelanggan juga tertuang dalam peraturan Bank Indonesia No. 5/21/PBI/2003 tentang Know Your Customer Principles (Prinsip Mengenal Nasabah).

Di sinilah SAS berperan sebagai fasilitator bagi institusi keuangan. Dalam SAS Executive Business Forum di Hotel Nikko – Jakarta, beberapa waktu lalu, mereka menyosialisasikan SAS Enterprise Miner, aplikasi data mining yang berfungsi mematangkan data dari sumber-sumber berbeda menjadi informasi yang bermakna.

Tapi, data mining hanya tahap awal. Solusi SAS juga meliputi langkah-langkah bisnis berikutnya. Contohnya menjalankan kampanye pemasaran serta memahami isyarat-isyarat kecil yang anomali tapi menarik. Tak ketinggalan, menganalisis sentimen publik yang disampaikan di media sosial.

Namun, ada masalah klasik di Indonesia, yaitu kualitas data. Kerap ditemukan data-data nasabah yang palsu, berganda, atau tidak sesuai dengan kenyataan. Hal ini tentu akan mengganggu proses analisis.

Menurut Luke Soon (Customer Intelligence Head, SAS Asia Pacific), data-data seperti itu bisa diatasi dengan proses data cleansing. Meski kualitasnya tidak sempurna, data tetap masih bisa digunakan. “Data cleansing dan kampanye pemasaran bisa dilakukan secara bersamaan,” tukasnya.

SAS saat ini menangani setidaknya 25 klien di tanah air dan sebagian besar dari institusi keuangan. Di antaranya bank multinasional seperti HSBC, Citibank, dan Standard Chartered.

TERBARU

Apple melelang komputer pertama Apple yaitu Apple-1 dengan nilai US$ 155 ribu atau sekitar Rp2 miliar