Kiki (K): Halo semuanya, kita balik lagi di KT. Kali ini episode ke-20 dan kita pas banget bikinnya juga di awal tahun. Udah lama bgt ya kita gak siaran, Gal. Cuman ya emang baru sempet aja. Kali ini juga topiknya bakal sesuatu yang dekat sama dunia Galuh jadi mungkin Galuh bakal lebih banyak omong di sini. Anyway, guest kita hari ini adalah Patricia Ayu, dia adalah seorang Commercial Data Analytics manager di Blibli.com. Halo Ayu

Ayu (A): Halo Kiki, Galuh. Kabarnya baik alhamdulillah.

K: Gimana nih WFH so far?

A: Enak banget WFH, jadi bisa multitasking dengan yang lain.

K: Ayu berarti dari kapan sih berkarir di data gitu?

A: Lulus kuliah S1 2011. Jadi udah 10 tahun lalu aku udah mulai kerja di bagian data. Cuman kalau untuk data science itu baru 5 tahun dari 2016 sih. Jadi sebelumnya related sama data cuman nggak data science.

K: Ceritain dong background sekolahnya di mana, terus mulai tertarik sama teknologi dan data tuh dari kapan?

A: Nah aku dulu sekolah di Undip, ngambil jurusan statistika. Nah tahun 2011 aku lulus. Abis itu aku ke Jakarta mencari peruntungan. Nah waktu itu lulusan statistika itu kebanyakan masih lumayan tradisional sih, masih lebih ke perusahaan research, marketing research, atau kayak litbang, atau bank. Jadi data science itu 10 tahun lalu belum kedengeran di Indonesia. Tahun 2012 itu aku inget, aku kan waktu itu akhirnya kerja di marketing research jadi researcher. Lalu aku emang ada keinginan buat lanjut S2 tuh. Jadi aku sibuk ngumpulin berbagai macam informasi mau ambil S2 apa dan peminatannya apa. Tahun 2012 si Harvard Business Review sempet ngeluarin tuh artikel, mungkin Galuh tau, data scientist is the sexiest job in the 20th century. Itu terkenal banget di mana-mana sering disebut. Waktu itu kayaknya belum ada data science di Indonesia. Pas aku pertama kali baca artikel itu. Temenku ngasih ke aku, eh data science ini menarik banget, kamu kan lagi mau S2, lo interest apa nggak? Nah terus abis itu aku ngurus S2aku cari deh yang berhubungan dengan data dan lagi happening. Nah di situ aku dapetin istilah kayak data science, data mining, big data. Cuman itu kayaknya juga 8-9 tahun lalu kayaknya masih teori aja, jadi belum ada kurikulum yang jelas kayak gimana. Dan di Indonesia itu belum ada tuh tech company, jadi pada saat aku dapet beasiswa dan lanjutin S2, tahun 2014 mau berangkat, nah itu baru temen-temenku mulai resign terus ikutan tech company kayak Traveloka, atau Gojek gitu. Kayak baru mulai dibikin tech company-nya. Tapi data scientist as a title/job itu aku belum denger. 6-7 tahun lalu. Nah begitu udah gede tuh tech company di Indonesia, aku pulang ke Indonesia, baru tuh kedengeran ada dicari posisi data scientist dan sebenernya aku waktu itu nggak kepikiran banget untuk jadi data scientist, kayak aku juga masih meraba-raba dari ilmu yang aku pelajarin. Tapi karena kualifikasi yang mereka cari itu kayaknya aku suka, aku iseng apply dan dapet deh posisi jadi data scientist. Itu 5 tahun lalu. Sejak itu aku switch career dari marketing researcher jadi data scientist deh sampe sekarang.

K: Berarti mulai jadi data scientist itu setelah lulus S2 ya?

A: Betul.

K: S2-nya dulu belajar apa kalau boleh tau?

A: S1 aku kan statistika, S2 aku ambil statistika terapan atau applied statistics. Cuma di situ tuh, di kampus aku udah mulai ngerasa oh ini data science lagi happening, nih. Jadi mereka udah mulai nge-infuse kurikulum data science ke dalam mata kuliah-mata kuliahnya. Meski mereka kayaknya masih ngeraba-raba, tapi kita dikasih kesempatan untuk ngambil beberapa kelas programming gitu kan. Terus ada dikasih materi-materi tentang data science juga. Kampusnya lumayan cepetlah untuk adapt, untuk lihat perkembangan jaman. Walaupun aku jurusannya nggak yang kayak data science banget tapi lebih ke statistika yang aplikatif, cuman bersinggungan ke data science ilmunya.

Galuh (G): Nah berhubungan sama tadi aku penasaran juga, kan Kak Ayu dari statistics. Sementara kalau data science kan bidangnya banyak field yang harus kita bisa, stats, programming, etc. Kalau aku misalnya background-nya computer science, harus banyak catch up dengan statistics. Itu diajarin di kelas tapi selewat doang. Kak Ayu sendiri untuk bekerja di data science selain statistics apa aja sih di luar itu yang Kak Ayu harus pelajarin dan source belajarnya di mana?

A: Yang aku lumayan harus catch-up itu bagian programming, sih. Dulu kan pas masih S1 programming statistik masih simpel kayak SPSS gitu. Terus ada SAS gitu. Nah pada saat aku S2 udah mulai kualifikasi bisa pake R atau Python udah mulai kedengeran kan. Di kampus aku waktu itu belum semuanya dia ngajarin, tapi dia udah ngajarin lagi R untuk data science. Nah itu aku belajar tuh pas di kelas. Tapi karena aku nyadar “oh ini kayaknya Python juga perlu, SQL juga perlu nih” jadi sampingan gitu. Jadi aku juga ngambil kelas-kelas online gitu buat programming sama kayaknya pada saat aku kuliah S1 dan kerjaan aku setelah S1 juga nggak pernah megang koding-kodingan lagi. Jadi akhirnya aku belakangan belajar itu lagi walaupun pas udah kerjapun, waktu itu kan SQL aku cuman tau yang simpel banget akhirnya terpaksa harus belajar lagi yang lebih kompleks. Python juga waktu itu kalau sebelum masuk kerja cuma yang simpel-simpel aja, pas udah masuk jadi harus belajar yang lebih kompleks lagi. Jadi overall yang aku lumayan catch up bagian technical skills sih.

G: Kak Ayu jago banget sih R-nya. Waktu aku magang ngambil kelas Data Science dan Analytics terus diajarin pake R. Aku nggak paham R tuh gimana gitu karena biasanya pake Python. Akhirnya nanya ke Kak Ayu minta ajarin pake R.

K: Tadi kan udah ngomongin tuh beberapa kali tentang data science. Mungkin bisa dijelasin dulu buat temen-temen yang belum terlalu familiar, bisa dijelasin nggak data science tuh apa sih sebenernya?

A: Kalau dari sudut pandang aku sih sebenernya data science itu adalah pengembangan yang lebih advanced dari pada ilmu dasarnya yaitu ilmu matematika dan ilmu statistika. Jadi pengembangannya tuh udah ada nambahin ilmu-ilmu lain kayak ilmu computer science. Nah, kalau kita balik ke statistika atau matematika sendiri itu apa sih maksudnya? Itu lebih ke ilmu memahami data, menyajikan data, dan gimana caranya supaya kita bisa dapetin insight atau kesimpulan yang menarik dari sebuah data. Cuma kalau data science itu biasanya dia lebih… kalau kita misalnya ngeliat data kan, terus kita ambil kesimpulannya, oh ini gunanya ke sini nih.. Kan kadang sampe situ aja. Tapi data science itu dia bisa juga nyediain suatu solusi gitu. Oh mungkin kita bisa model untuk memprediksi sesuatu dari data ini, jadi insightnya bisa lebih jauh. Misalnya aku bikin sesuatu untuk memprediksi sesuatu yang automated gitu, atau bikin suatu prediksi yang lebih cepet, skalanya lebih gede. Dengan data science kita bisa lebih jauh gitu memanfaatkan data ini. Kayak gitu sih.

K: Terus aku kayak jadi penasaran tentang, tadi kan banyak sebenernya bisa digali dari data. Mungkin itu juga berkaitan sama struktur berpikirnya suatu data scientist kali ya. Gimana bisa ngegali data itu supaya bisa dapet insight yang menarik, yang berguna. Kira-kira framework berpikir atau karakter seperti apa yang diperlukan oleh seorang data scientist sih sebenernya?

A: Kalau menurut aku yang paling pertama adalah orang yang suka belajar, mau belajar, dan bisa belajar secara independen. data science ini kan ilmu yang baru ada. Mungkin di masa yang akan datang akan ada ilmu baru hasil kolaborasi dengan beberapa ilmu lainnya. Cepet banget di data science itu keluar metode baru, pendekatan baru. Jadi seorang data science sih yang penting itu mereka nggak apa-apa nggak ngerti semuanya, nggak apa-apa harus tau semuanya, tapi at least dia cepet untuk belajar hal yang baru, dia bisa cepet adapt. Jadi bisa selalu up to date sama perkembangan jaman. Karena data science sendiri aku juga suka lupa sih beberapa model prinsip dasarnya apa, kadang aku masih kayak ngecek lagi karena segitu banyaknya. Cuma yang penting kayak, oh ini kayaknya ada yang baru nih atau ini ada yang perlu kita cek. Yang penting bisa cepet belajar dan keep up gitu. Terus karakter apa ya… yang tadi dibilang sama Kiki sih, bisa berpikir secara logis, bisa gali-gali data, runut, connect the dots. Itu penting banget karena biasanya kalau aku interview nih, nyari data scientist, biasanya aku present suatu problem terus minta si kandidat ini untuk coba nge-elaborate aja langkah-langkah berpikirnya kayak gimana, dia bisa connect the dots gimana, scoping problem gimana. Karena at the end of the day yang kita pengen kan data science-nya bisa solve the problem. Terus… apa ya karakter lain, skeptical tapi bukan pesimis. Aku tipe yang suka questioning the data, misalnya ada orang yang ngasih data gitu biasanya aku coba crosscheck dengan fakta yang lain atau data yang lain gitu. Karena kalau di istilah data tuh ada garbage in garbage out, kalau datanya nggak bagus, keluarannya juga ngga bagus. Data scientist tuh harus bisa questioning ini tuh bener apa nggak dan bisa ngekroscek gitu supaya dapetin source of truth-nya. Dan dia juga nggak hanya skeptikal tapi juga bisa come up dengan suatu eksperimen gitulah, jadi dia bisa “oh ini kayanya bisa diginiin deh caranya”. Lebih ke arah situ. Terus… juga satu sih, aku nggak tau ini penting nggak ya, tapi menurut aku data science harus tahu kapan dia berhenti. Dalam artian, kadang kalau aku sih dulu banget suka ih penasaran banget, ngubek-ngubek si data ini, modelnya kuutak-atik sampe dapetin yang bagus, tapi jadinya nggak deliver. Misalnya kita udah ada deadline terus kadang yang bagus itu yang useful atau good enough. Nggak harus perfect. Kalau nggak kita nyari terus tapi nggak deliver-deliver. Itu salah satu yang penting sih soal data scientist.

G: Ini menurutku banyak banget poin penting yang super penting tapi jarang dibahas. Kalau tools atau algorithms udah banyak yang bahas. Tapi in practice sebenernya poin-poin tadi penting banget. Kalau aku rangkum, kita harus bisa adapt, dan mungkin yang sering lupa root data science itu adalah di problem solving. Aku juga personally sering lupa sih. Dan skeptical itu juga super penting. Sama yang terakhir juga bener banget, knowing when to stop. Karena data science sendiri mungkin bedanya sama software engineering, kalau di data science nggak ada clear definition kapan itu done gitu kan.

A: Iya betul.

G: Kalau software engineering mungkin udah jelas fitur A, fitur B. Kalau data science kadang gak ada kayak gitu dan suka ada rasa gemes, “duh kayaknya bisa deh eksperimen lagi” padahal waktu berjalan terus.

A: Iya waktu berjalan terus.

G: Kadang harus tau dan harus merelakan to stop when it’s good enough. Itu sih kadang yang susah.

K: Kalau misalnya case yang… nggak tau boleh diceritain apa nggak, case yang paling menarik yang selama ini pernah Ayu hadapi selama jadi data scientist itu boleh diceritain nggak?

A: Kalau case data science aku sering ketimpaan yang berhubungan sama fraud atau kecurangan. Even di company yang sekarang dan sebelumnya. Somehow aku kena terus project itu gitu. Bos aku tuh pernah bilang, kalau aku tuh orangnya karena suka penasaran jadi cocok nih untuk yang berbau-bau fraud untuk mendeteksi kecurangan. Ini konteksnya luas sih, kita kayaknya sering liat di e-commerce suka ada flash sale terus customer cepet-cepetan supaya dapet flash sale. Tapi kan pernah ada di berita kalau itu pake bot. Itu sebenernya customernya bodong. Atau misalnya ada merchant bikin toko di ecommerce tapi sebenernya dia nggak pernah jualan, dia pura-pura jadi customernya, pake diskon, terus ecommercenya direimburse balik nih diskon/vouchernya. Banyaklah semua kecurangan di tech company. Selama masih ada burn money, masih ada promo pasti ada kecurangan. Kalau kita pake human untuk ngesolve itu, misalkan ada customer yang mencurigakan. Kan kalau human ya kita ngecek nih ini customernya pernah nggak ya belanja di kita. Atau customer ini tinggalnya di mana. Kalau kita mau tau kan ini jahat nggak sih customer ini? Kita berusaha nyari klu atau info-infolah gimana caranya kita bisa tau atau membuktikan dia baik atau jahat. Itu kalau customernya cuma satu. Kalau customernya ada satu juta dan melakukan transaksi dalam waktu satu hari satu jam itu kan gede banget skalanya. Nggak mungkin manusia bisa cepet ngecek itu dan ngesolve masalah ini, bisa mutusin mana yang fraud dan gak fraud dengan cepat. Jadi aku pernah kebagian untuk model untuk prediksi, misalkan kalau ada transaksi ini transaksinya mencurigakan atau nggak? Atau kita bisa prediksi customer ini baik atau sebenernya dia kayaknya bot atau bukan customer beneran. Jadi modelnya itu bisa kita otomasi dan skalanya gede. Jadi kita dalam waktu satu menit bisa tau nih, ini kayaknya jahat nih, ini kayaknya baik nih. Jadi kayak gitu sih contoh yang sering aku kerjakan dulu di data science.

K: Terus tadi dimention kan tentang model. Terus bahas kapan kita harus selesai. Biasanya Ayu gimana sih cara taunya kalau model yang kamu buat itu udah bagus gitu, udah cukup? Indikatornya apa?

A: Biasanya kalau ada masalah kecurangan dengan segini banyak dan modelnya itu somehow udah bisa kira-kira nih ketika kita tes, bisa nge-cover atau nangkep penjahat atau yang mencurigakan sekian persen. Either lebih dari 50%, 90%, at least cukup useful untuk bisa ngurangin dari yang sekarang, itu aku ngerasa udah good enough. Walaupun nggak 100%, karena untuk ke 100% kita bisa ngakalin dengan ngecombine model itu dengan human. Misalnya dengan human itu kita pake model, tapi kalau ada ragu kita lempar ke humans, ini bener nggak? Mencurigakan nggak? Ini yang penting yang cukup useful ngurangin drastis problem yang kita solve, sisanya kita cari cara supaya bisa deket ke 100%. Aku kadang nemuin stakeholders yang, “kok ini ada yang kelolosan? Masih banyak yang kita duga… kayaknya salah tapi kita juga istilahnya false positive, gitu. Sering banget stakeholder ngerasa ‘ini modelnya terlalu agresif’ gitu. Padahal sebenernya ada cara untuk ngakalin itu. Jangan terlalu terjebak angka-angka atau metriks accuracy, false positives, false negatives. Itu bisa jadi guidance, tapi at the end of the day kita juga berlomba dengan waktu, kan. Ketika kita nunggu sampe perfect, trade off-nya kerugiannya akan terus terjadi. Jadi aku sih yang penting oh ini udah cukup useful, aku bisa cari cara untuk combine dengan humans, kita go aja.

G: Berarti iya sih, model nggak berdiri sendiri ya buat dia ngasih impact nggak cuma model aja tapi mesti disambungin juga ke business context-nya seperti apa. Nah aku mau nanya nih, sebagai anak yang bukan dari statistics nih, atau bukan dari jurusan math. Pas belajar… kadang aku belajar gitu ya di kelas atau course, ada statistical materials gitu kan terus teori-teori, rumus-rumus. Kadang suka nggak kebayang gitu, misalnya confidence interval rumusnya begini. Tapi di dunia nyata dipakenya seperti apa sih? Atau sampling dan lain-lain. Kadang nggak kebayang kepakenya gimana waktu dulu belajar. Kak Ayu bisa share nggak satu contoh gitu konsep matematika atau statistik yang kepake di dunia nyata dan seperti apa aplikasinya?

A: Kalau dulu, untuk supaya aku ngerti suatu konsep ilmu statistika atau matematika. Ini aku diajarin sama dosen aku pas S2 sih. Coba aja cari tau intuisinya, gitu. Jadi biasanya aku tambahin keyword misal, apa sih itu confidence interval dan intuisinya? Aku biasanya cari example. Intuisi lebih kayak… biasanya aku kayak megang aja, aku tinggal liatin ini dan ini nggak boleh lebih dari sekian persen. Even sampe sekarang aku masih inget kalau misalnya oh kita harus ngecekin ini, tapi alasannya kenapa aku kadang masih Google. Jadi konsep-konsep itu bukan berarti kita inget sekali dan kalau nggak inget itu gagal, yang penting kita pegang aja itu istilah simpelnya apa, intuisinya apa, kalau lupa juga bisa di Google, nanti kalau ada masalah kita inget, oh kayaknya kita bisa pake tools ini, karena aku inget prinsip dasarnya kayak gini. Kalau untuk kehidupan sehari-hari, banyak banget yah konsep statistika ya. Even kalau statistika itu lebih ke ngerti potensial bias itu dari mana. Contoh nih pas kemarin kita… kan sekarang masyarakat disodorkan data Covid kan. Aku nggak tau itu akan mengubah cara masyarakat melihat data atau nggak. Cuman kan sekarang kita ngeliat tuh di Instagram, Twitter ada data-data covid segitu banyak, ada trennya, ada tabelnya, ada chart, banyak banget. Kan pernah sempet heboh, gimana cara orang me-represent persentase kasus aktif yang sangat misleading, kan. Jadi misleadingnya adalah ditunjukkan chart, berapa kasus aktif hari ini dibagi dengan total semua kasus Covid yang pernah ada dari awal. Misalnya hari ini ada 10,000, total kasus covid kita kan hampir 1 juta. Let’s say itu 10%. Kalau di awal ya itu gede banget tapi makin lama kan akan makin turun. Itu contoh bias-bias kayak gitu kalau kita ngerti soal statistika, biasanya bias-bias statistika di mana aja, ada outlierlah, atau ada misleading data, kita bisa nggak ketipu soal kayak gitu. At least data literacy kita jadi lebih bagus, kita bisa ngambil kesimpulan yang lebih nggak bias. Itu jadi konsep simpel statistika yang sehari-hari. Kalau mau dibikin kompleks banyak sih, kayak optimisasi, terus ada model-model data science kan banyak tuh pake konsep statistika, yang lumayan kompleks. Tapi kalau kayak yang simpel yang tadi aku contohin. Kalau mau cari yang kompleks, banyak. Di tempat kerja aku misalnya konsep… biasanya statistika buat eksplorasi data, itu kepake banget. Karena kan kita kalau nge-build atau bikin suatu model harus tau bener-bener data yang kita pegang kelemahan dan kelebihan apa. Kelemahan as in potential outlier, potential biasnya di mana. Terus juga kasus-kasus optimisasi itu kan biasanya kita pake konsep turunan, itu juga pake konsep dasar statistika. Jadi ya gitu lah.

K: Dari tadi kan kayak kalau ngomongin data science, kalau dari sudut pandang aku ya dari orang yang non-data scientist, aku ngerasa punya banyak ruang untuk mengerjakan tugasnya gitu. Kalian biasanya dari awal ditentuin nggak sih modelnya efektivitasnya harus segini persen, atau gimana sih?

A: Kalau di aku biasanya problem statement dulu, misalnya oh ini terjadi tindak kecurangan entah customer atau merchant segini banyak. Jadi kita pengen nge-reduce kira-kira at least berkuranglah atau ada improvement sekian persen. Nah biasanya jadi nanti dari situ. Intinya kan ini harus bisa ngesolve suatu problem, ini at least bisa improve keadaan yang sekarang. Nanti biasanya itu sih yang aku translate ke angka atau metriks, misalnya oh kita kalau mau reduce sekian persen, jadi kira-kira angka bagusnya tuh seberapa? Nah dari situ ketika kita bikin model, kita akan tes, kita akan lihat oh ini modelnya works nih, tapi ternyata yang bisa ke-solve cuma segini aja, atau ternyata ada kasus-kasus yang masih kelolosan. Itu nanti kita akan cek lagi apakah ini udah cukup bagus atau kayaknya kita perlu bikin beberapa iterasi, iterasi 1 kita solve segini dulu, iterasi selanjutnya kita improve di sini. Jadi kayak ada step-stepnya sih. Tapi selalu berangkatnya dari problem statement. Kita mau seberapa gede nih masalahnya dan mau solve sebanyak apa. Kalau Galuh ada tambahan gak?

G: Aku sama sih, dari problem statement, terus nentuin masalahnya. Kadang itu gak bisa… apa ya misalnya ada orang ngomong oh kita punya masalah itu, tapi seringkali masalahnya bukan itu. Jadi nggak se-straightforward itu. Jadi kadang banyak spend waktu rame-rame data scientist dan business stakeholder sebenernya masalahnya apa. Setelah tau problemnya, tau juga goalnya, nentuin goalnya itu sama business stakeholder. Kalau dari mereka untuk kepentingan mereka, pengennya reduce berapa fraudulent transactions gitu bisa misalnya, itu sama business stakeholder juga.

K: Terus kalau Ayu kan di Blibli jadi data analytics manager. Berarti udah managerial position kan ya. Terus biasanya kesehariannya giamna?

A: Di bawahku sekarang ada tiga, aku nge-lead tiga orang. Sehari-hari macem-macem, diskusi sama mereka, meeting, nge-coach, nge-koordinir gimana project-nya. Terus mungkin ada beda sama individual contributor (IC) dulu aku bener-bener ngerjain satu project, aku yang responsibel, aku berusaha ngesolve itu. Nggak terlalu mikir gimana ke stakeholder, gimana ini secara, apa ya, secara helicopter view. Atau ke garis besarnya. Sekarang aku lebih ke arah strategic gitu, mikirin ini implikasinya gimana, ini perlu apa nggak gitu. Ini udah bener apa nggak gitu. Jadi lebih muter-muter aja sih. Kalau di posisi yang sekarang ini.

G: Terus waktu awal-awal transisi dari IC ke managerial, susah nggak? Challenges-nya apa aja sih?

A: Nah dulu tuh awal-awal aku sebelum pindah ke managerial aku juga nggak tau apa aku bisa ke posisi manajerial ini kan. Karena most of the time aku bener-bener jadi IC, aku ngerjain proyek yang aku pegang. Jadi awal-awal aku banyak nanya ke orang, terus aku baca-baca buku. Awalnya tuh mencoba untuk ngga terlalu involve into details, agak susah karena IC kan kita terbiasa untuk ngecek semua details, bener apa nggak. Tapi kalau sekarang aku lebih ke, ya udah aku percaya ini orang bisa, jadi aku lebih ke discuss details yang lebih secara garis besarnya. Lebih ke arah strategic-nya. Yang susah sih biar bisa ngga terlalu into details tapi bisa step back untuk ngelihat lebih ke ini hubungannya ke mana, garis besarnya gimana, gitu. Terus juga harus bisa interpersonal skills, karena aku jadi lebih coba understand si tim aku, ngertiin mereka karakternya gimana. Karena kalau kita mau nge-lead projects atau mau tau apa yang dia suka supaya kerjaannya itu lebih menyenangkan itu aku juga harus interact sama mereka gitu kan. Terus skills apalagi ya, mungkin leadership itu juga. Lebih ke soft skill-nya instead of technical skill.

K: Tapi Ayu kan udah lama banget ya kerja di data. Yang menarik dari kerja sama data itu apa sih?

A: Aku seneng karena… kayaknya ini agak counterintuitive tapi aku ngerasa data gak harus banyak hapal. Awal aku ambil statistika itu karena aku nggak suka ngapal, aku sukanya nyari pattern dan melihat oh ini kayaknya bisa diginiin nih. Yang aku seneng sama data aku nggak perlu inget banyak hal tapi aku bisa dapetin macem-macem insight. Terus yang rewarding banget tuh kalau ternyata kita dari informasi bisa translate into data, akhirnya itu bisa bikin sesuatu yang useful atau bikin hidup orang jadi lebih mudah. Itu paling rewarding gitu dengan ngerjain data. Itu sih. Dari sisi aku sih aku juga orangnya suka penasaran gitu jadi suka aja sih ngutak-atik data. Galuh can relate ya?

G: Kak Ayu tuh orang yang, not surprisinglah kalau Kak Ayu bilang dia suka karena penasaran. Karena orangnya kepo banget. Gosip-gosip itu first person yang tau Kak Ayu deh. Jadi cocok banget sih buat karir di data. Not surprisinglah.

A: Tapi dulu aku dulu cita-citanya jadi detektif. Aku tuh suka banget baca buku detektif dulu. Terus sampai aku mikir enak ya kalau bisa kerja di CSI, FBI, tapi jadinya malah kerjanya ngecekin fraud, kan. Data tuh jadi kayak clues, ada bukti-bukti ini nih gimana caranya gue bisa connect supaya gue bisa dapetin sesuatu. Kayaknya gara-gara itu sih.

G: In a way tercapai ya cita-citanya.

A: Tapi jadi neverending apa ya, task-lah untuk menuntaskan kejahatan yang selalu ada.

G: Kalau buku, satu buku selesai gitu ya, penjahatnya ketangkep. Kalau ini neverending.

A: Iya, ini ada cara baru lagi, metode baru lagi, kita harus mikir kita harus ngumpulin data ini, datanya belum ada nih, gimana caranya supaya datanya bisa muncul? Tapi emang kayaknya yang penting rate kejahatannya segini aja ya. Nggak mungkin bisa 0. Yang penting bisa diturunkan.

K: Tadi kan udah ngomongin tentang kepusingannya tuh. Tantangannya biasanya apa kalau jadi data scientist?

A: Tantangan untuk data science tuh… biasanya sih kalau data scientist pada umumnya yang aku temuin itu belum kebiasaan untuk present hasilnya dan deal sama stakeholders gitu. Karena stakeholders itu udah yang paling bos terakhir kalau main game, yang lo harus bisa convince, lo harus bisa persuade mereka dan biasanya skills untuk bisa bikin presentasi yang bagus atau nunjukkin mana yang important mana yang nggak, itu yang suka susah dari sisi stakeholders-nya. Kebanyakan kalau orang yang agak awam dengan data science atau data pada umumnya, itu mereka mungkin karena pernah denger di mana gitu, mungkin jadi nge-challenge kita dengan pertanyaan yang emang penting tapi kadang tuh susah diyakinin gitu. Misal mereka ngelihat oh false positive modelnya kok gede banget, modelnya terlalu agresif nih untuk menangkap transaksi atau orang yang mencurigakan. Mereka ngerasa, oh biasanya gak segini deh angkanya. Atau, oh ini gak bagus. Dengan posisi mereka juga nggak terlalu tau sebenernya yang bagus itu seperti apa. Cuma kadang stakeholders jadi lebih anxious sama data kita dan mereka questioning kita banget. Jadi itu sih challenge-nya, lebih ke gimana caranya kita bisa mengedukasi orang-orang yang pada akhirnya akan meng-adopt solusi kita, adopt model ini. Orang-orang yang pada akhirnya akan bilang, ini projectnya bisa yes atau nggak untuk maju. Itu sih challenge paling besar yang aku rasa sejak aku di posisi managerial malah lebih sering hadapi. Kalau dulu di IC biasanya itu akan ada lead yang lebih handle itu. Kalau sekarang akulah yang harus ngehandle stakeholders itu. Gimana sih caranya ngeyakinin mereka, itu yang susah.

K: Berarti perlu skill komunikasi yang bagus juga ya untuk jadi seorang data scientist?

A: Iya, dan dulu awal-awal aku sempet defensif gitulah, bayangin kita ngerjain sesuatu terus di-attack atau nggak di-accept. Tapi kalau pada akhirnya kalau kita bisa nunjukkin, kalau nggak ada solusi ini eventually damage-nya akan lebih gede. Atau ini emang gak perfect tapi kita bisa improve ini nanti. Harusnya juga nggak terlalu defensiflah, mungkin mereka gak paham ini barang apaan yang mereka tau ini nggak perfect. Jadi mereka keburu anxious duluan. Kalau kita bisa pahamin concern mereka, mereka coming from mana, concern utamanya apa, kita bisa lebih convincing sih buat mereka terima kerjaan kita. Karena kalau nggak, kita udah kerja capek, jadi nggak gol, kan?

G: Yap. Tapi menarik ya tantangannya gak cuma teknikal tapi even misalnya kita udah bikin model secanggih apapun, sebagus apapun dengan the most advanced technology and algorithm kalau stakeholders nggak convinced bahwa we should adopt this, ya goodbye. Tapi di sisi lain mengerti juga sih kenapa mereka questioning. Toh mereka just doing their job.

A: Iya, karena kalau ada apa-apa kan mereka juga harus take responsibility, kan. Kayak… ini kok modelnya jelek, tapi kok lo ambil? Bisa aja kan kayak gitu. Jadi wajar ngejar kita terus, ini kayaknya bisa deh lo improve lagi. Tapi ya neverending kalau kita tunggu sampe perfect, kan. Mungkin keburu udah semakin gede damage-nya.

G: Yap, jadi kita kadang harus ketemu mereka di tengah.

A: Iya harus ada angel-nya ya di tengah situ untuk menjembatani.

K: Menurutku skill kayak gitu emang secara umum diperlukan semua posisi nggak sih? Kayak gimana caranya kita bisa mengkomunikasikan apa yang kita kerjakan. Menurutku itu semuanya berlaku sih, di semua pekerjaan.

A: Setuju banget. Itu skills yang harusnya dimiliki oleh siapapun.

K: Iya, maksudnya sebagus apapun kerjaan lo, tapi lo nggak bisa mengkomunikasikan itu ke yang lain, ya goodbye. Siapa yang mau liat, gitu. Terakhir nih, kira-kira pesan apa yang Ayu pengen sampaikan buat teman-teman pendengar Kartini Teknologi yang tertarik jadi data scientist?

A: Pesan dari aku… mungkin agak, gimana ya, pesan dari aku yang pertama maybe you don’t have to be a data scientist. Jadi lebih ke kadang aku nanya ke orang yang… junior aku di kampus, dia pengen jadi data scientist, aku biasanya nanya baliK: kenapa mau jadi data scientist? Apakah karena titelnya kah, apakah karena kerjaannyakah, apakah karena misalnya salary-nya. Atau lagi banyak yang nyari gitu. Mungkin pertama cari tahu motivasinya apa. Karena kalau kita tahu motivasinya apa, kita bisa decide apakah emang harus jadi data scientist atau nggak. Jangan sampe terjebak sama titel data scientist. Aku sendiri dulu nggak kepikiran untuk jadi data scientist. Aku cuma suka ngerjain data, suka baca yang sedikit lebih advanced tentang data, dan kebetulan deskripsi data scientist ini sesuai yang aku pengen. Bukan jadi data scientistnya tapi oh aku suka kerjaannya. Dan bisa jadi ada orang yang, aku suka nih ngerjain data tapi pengennya lebih ke arah bisnisnya, deh. Aku lebih suka belajar yang hubungannya sama kerjanya sama orang, sama bisnis. Itu bisa aja jadi business intelligence atau data analyst. Jadi not necessarily jadi data scientist. Jadi motivasinya lebih digali aja. Kayak di tim aku mereka gak kepengen jadi data science awalnya, mereka suka ngerjain data. Ada dua orang dari fisika, satu orang matematika, mereka suka ngerjain data, modeling, terus kebetulan emang pas dengan job descriptionnya jadi mereka cocok. Itu yang pertama. Terus mungkin kalau cewek ya, di tempat aku fortunately tim aku cowok semua nih. Entah gimana ada sesuatu yang terjadi sehingga aku jarang ketemu female data science. Padahal di jurusan S1 statistika itu banyak banget, tapi somehow along the way di tech-nya atau posisi ini jadi sedikit banget. Mungkin apa ya…

G: Di tempat kita dulu semuanya cewek.

A: Tapi dulu satu Gojek cuma dikit kan?

G: Iya di tim kita doang.

A: Terus tadi sempet disinggung, cari-cari info, banyak belajar. Di tim aku itu mereka ambil kelas percepatan data science, sekarang itu udah banyak banget sekolah-sekolah yang buka kayak bootcamp atau training data science gitu. Itu bisa banget cuman aku sering beberapa kali interview yang seperti itu tuh mungkin terlalu kilat jadi kadang nggak sempet paham basic atau intuisinya gimana. Jadi istilahnya kita ngajarin orang masak, teknik masaknya gimana, tapi apa ya ada pengetahuan basic atau misalkan yang kayak gimana sih bahan ini sebenernya harus dimasak apa atau yang bagus tuh apa, itu kayak suka skip, jadi lebih ke… kadang pas dites di interview mereka tau kulitnya tapi dalemnya tuh agak kurang kuat. Jadi itu bakal kelihatan ketika dikasih problem untuk disolve. Itu akan kelihatan sih. Jadi saran aku kalau temen-temen mau ngambil kelas-kelas kayak gitu, atau otodidakpun juga gak masalah, cari-cari aja di internet kelas-kelas udah banyak banget, tapi jangan sampe esensi dasarnya itu kita nggak terlalu paham. Kadang basic-basic statistika, matematika, ada prinsip-prinsip dasar di ilmu itu yang kita harus tetep paham, gitu. Jadi nggak asal dicemplungin, modelnya jadi, tapi kita harus paham kenapa bisa kayak gitu. Lebih ke situ. Mungkin satu tips yang nggak tau ya related apa nggak, cuman aku sempet bilang ke junior aku, waktu itu aku sempet ngisi acara di kampus: Bahasa Inggris-nya di-improve kalau bisa. Karena material data science itu banyak banget yang bagus-bagus tapi nggak Bahasa Indonesia. Jadi kayak online course dulu semua awal-awalnya pasti Bahasa Inggris, kan. Jadi takutnya untuk ke situ malah susah karena dari segi bahasa juga masih ada kendala. Jadi kalau bisa di-improve juga bahasa Inggris-nya juga bagus.

K: Oke, kayaknya menurut aku ini pembahasan tentang data scientist… atau mungkin karena aku juga jarang ngulik tentang ini ya, aku ngerasa banyak banget belajar tentang data scientist dari obrolan ini. Kayak dari karakteristik, apa aja yang perlu dipelajarin, bahkan lebih penting tentang ini sih menurutku, framework dan karakter apa sih yang diperluin dari seorang data scientist. Karena menurut aku technical itu kan bisa dipelajari kan, tapi cara berpikir tuh menurut aku adalah hal yang paling mendasar untuk kita bisa belajar apapun. Jadi menurutku ini penting banget sih. Jadi gitu ya temen-temen. Kalau temen-temen Kartini Teknologi ada yang kepo kayak Ayu ini, suka ngulik, terus juga suka data, suka statistik, pinter untuk connect the dots. Jangan takut untuk belajar data science. Mungkin bisa dimulai dari mana aja kali ya, course, ikutan bootcamp. Cuma kalau ikutan bootcamp jangan cuma mengandalkan dari itu aja kali ya. Tetep harus diasah intuisi datanya. Itu aja kalau kalian tertarik, karena kata Ayu tadi kan masih sedikit perempuan di bidang data science ini. Jadi menurut aku peluangnya juga masih banyak. So semangat temen-temen buat jadi data scientist buat nemenin Galuh dan Kak Ayu.

A: Aku berharap banyak sih biar lebih banyak data scientist yang perempuan. Karena dari sisi demand job itu masih gede banget peluangnya untuk data scientist. Tim aku masih nyari, aku sering ngeliat masih banyak sih orang yang nyari data scientist tapi suplainya emang… kurikulum Indonesia emang masih pelan-pelan ke arah situ. Aku berharap banget cewek-cewek juga interested-lah untuk ke arah situ.

K: Iya, apalagi bisa WFH juga lho. Kalau misalnya kerjaan bisa dikerjain di mana aja, apalagi perempuan kan banyak yang mesti ngerjain yang lain, kalau kalian udah mulai keluarga menurut aku fleksibilitas buat bekerja dari mana aja itu penting banget.

A: Betul.

K: Yah, aku jadi kampanye remote work lagi kan. Anyway, gitu ya temen-temen. Thank you Ayu udah mau ngobrol sama kita, semoga temen-temen dapet manfaat dari apa yang kita obrolkan. Thank you!

A: Thank you!