Data besar yang dapat ditindaklanjuti: Cara menjembatani kesenjangan antara ilmuwan dan insinyur data

Keributan seputar data besar telah menciptakan kesalahpahaman yang tersebar luas: bahwa keberadaannya semata-mata dapat memberi perusahaan wawasan yang dapat ditindaklanjuti dan hasil bisnis yang positif. Kenyataannya sedikit lebih rumit. Untuk mendapatkan nilai dari data besar, Anda membutuhkan tim ilmuwan data yang mampu menyaringnya. Sebagian besar, perusahaan memahami hal ini, sebagaimana dibuktikan oleh pertumbuhan 15x - 20x dalam pekerjaan data ilmuwan dari 2016 hingga 2019. Namun, bahkan jika Anda memiliki tim ilmuwan data yang mampu, Anda masih perlu menghapus rintangan utama dari memasukkan ide-ide itu ke dalam produksi. Untuk mewujudkan nilai bisnis sejati, Anda harus memastikan insinyur dan ilmuwan data Anda bekerja bersama satu sama lain. Pada intinya, para ilmuwan data adalah inovator yang mengekstraksi ide-ide dan pemikiran baru dari data yang dicerna oleh perusahaan Anda setiap hari, sementara para insinyur pada gilirannya membangun ide-ide tersebut dan menciptakan lensa berkelanjutan untuk melihat data kami. Ilmuwan data ditugaskan untuk menguraikan, memanipulasi, dan memperdagangkan data untuk hasil bisnis yang positif. Untuk mencapai prestasi ini, mereka melakukan berbagai tugas mulai dari penambangan data hingga analisis statistik. Mengumpulkan, mengatur, dan menafsirkan data semuanya dilakukan dalam upaya mengidentifikasi tren yang signifikan dan informasi yang relevan. Meskipun para insinyur jelas bekerja sama dengan ilmuwan data, ada beberapa perbedaan yang jelas antara kedua peran tersebut. Salah satu perbedaan mendasar adalah bahwa para insinyur menempatkan nilai yang jelas lebih tinggi pada "kesiapan produk" dari sistem. Dari ketahanan dan keamanan model yang dihasilkan oleh para ilmuwan data hingga format aktual dan skalabilitas, para insinyur ingin sistem mereka menjadi cepat dan berfungsi dengan andal. Dengan kata lain: Ilmuwan data dan tim teknik memiliki masalah sehari-hari yang berbeda. Ini menimbulkan pertanyaan, bagaimana Anda bisa memposisikan kedua peran untuk sukses dan akhirnya mengambil wawasan yang paling berarti dari data Anda? Jawabannya terletak pada mendedikasikan waktu dan sumber daya untuk menyempurnakan data dan hubungan teknik. Sama pentingnya untuk mengurangi kekacauan atau "noise" di sekitar set data, juga penting untuk memperlancar setiap dan semua gesekan antara kedua tim yang memainkan peran penting dalam kesuksesan bisnis Anda. Berikut adalah tiga langkah penting untuk mewujudkan hal ini. Tidak cukup hanya dengan menempatkan beberapa ilmuwan dan beberapa insinyur di sebuah ruangan dan meminta mereka untuk memecahkan masalah dunia. Pertama-tama Anda harus membuat mereka memahami terminologi satu sama lain dan mulai berbicara dalam bahasa yang sama. Salah satu cara untuk melakukan ini adalah dengan melatih lintas tim. Dengan memasangkan ilmuwan dan insinyur ke dalam pod of two, Anda dapat mendorong pembelajaran bersama dan memecah hambatan. Untuk ilmuwan data, ini berarti mempelajari pola pengkodean, menulis kode dengan cara yang lebih terorganisir, dan, mungkin yang paling penting, memahami tumpukan teknologi dan pertukaran infrastruktur yang terlibat dengan memperkenalkan model ke dalam produksi. Diposting di 7wData.be