4 Langkah Mudah Menjadi Citizen Data Scientist

Diterbitkan: 2022-05-07

Apa itu ilmuwan data warga?

Seseorang yang dapat melakukan (beberapa) pekerjaan tingkat ilmuwan data, tanpa pelatihan ilmuwan data.

Seorang pekerja yang dapat menggunakan perangkat lunak intelijen bisnis untuk melakukan pengelompokan, segmentasi, dan pencampuran data tingkat lanjut, bahkan jika mereka tidak memiliki gelar PhD statistik.

Dengan kata lain? Ilmuwan data warga adalah unicorn lingkungan ramah setiap bisnis.

Jika Anda menginginkan definisi formal, Gartner mendefinisikan ilmuwan data warga (CDS) sebagai “seseorang yang membuat atau menghasilkan model yang menggunakan analitik diagnostik tingkat lanjut atau kemampuan prediktif dan preskriptif, tetapi fungsi pekerjaan utamanya berada di luar bidang statistik dan analitik. ”

Dalam banyak kasus, bahwa "di luar bidang statistik dan analitik" berarti CDS adalah analis bisnis—analis bisnis yang belajar membuat model tingkat tinggi itu dari campuran inisiatif (jika saya dapat mengetahui variabel x, saya dapat meningkatkan pendapatan kami) dan kebutuhan (ilmuwan data kami sama terbebaninya seperti seorang guru tanpa periode perencanaan).

Karena ilmuwan data semakin dikenai pajak dengan permintaan untuk membuat bisnis lebih didorong oleh data, ilmuwan data warga dapat membantu bisnis mereka dengan dua cara utama:

  • mereka dapat meringankan beban ilmuwan data dengan menggunakan perangkat lunak intelijen bisnis yang tepat untuk melakukan tugas-tugas ilmu data yang lebih sederhana.
  • Mereka dapat membawa perspektif sisi bisnis orang luar ke ilmu data.

Untungnya, menjadi ilmuwan data warga tidak memerlukan gelar, atau bahkan pelatihan setahun penuh. Itu memang membutuhkan pekerjaan, tetapi manfaatnya membuat pekerjaan itu berharga. Jika Anda tertarik untuk menjadi ilmuwan data warga, berikut adalah empat langkah yang dapat membantu Anda memulainya.

1. Minta akses ke sumber data yang lebih banyak dan baru.

Jika Anda bosan berurusan dengan data lama yang sama dari laporan lama yang sama, ilmuwan data warga negara Anda gatal, dan mungkin sudah waktunya untuk meminta supervisor Anda untuk mengakses data yang tidak termasuk dalam laporan normal Anda. dan informasi.

Saat Anda membuka akses ke data untuk ilmuwan non-data, Anda dapat melihat kekuatan dan manfaat yang diperoleh dari ilmu data warga. Dengan memperluas data ke sekelompok ilmuwan data warga yang sangat unik, IBM mengubah turnamen Wimbledon 2016 menjadi perpustakaan informasi. Raksasa komputer ini memberdayakan para profesional tenis untuk menggunakan program analisis data mereka, Watson Analytics. Hasilnya adalah wawasan yang belum pernah terjadi sebelumnya tentang penampilan para pemain. Watson Analytics dapat menggunakan titik data sekecil tempat bola mendarat untuk menentukan apakah gaya pemain telah berubah.

Memperluas akses ke orang-orang tanpa gelar ilmu data juga ternyata sangat mudah—sebenarnya, lebih mudah melatih atlet profesional untuk menggunakan perangkat lunak ilmu data daripada melatih ilmuwan data untuk memahami seluk-beluk tenis tingkat profesional. Lebih baik lagi, itu berarti sekelompok orang dengan pengetahuan tingkat ahli dapat berkontribusi pada bidang ilmu data yang tidak dapat diakses.

2. Pelajari cara menggunakan perangkat lunak intelijen bisnis dengan fitur analitik canggih dan penemuan data cerdas.

Setelah Anda mendapatkan sumber data baru untuk wawasan baru, Anda harus tahu cara menggunakan alat yang memungkinkan ilmu data tingkat tinggi untuk seseorang yang tidak memiliki ilmu data atau PhD statistik.

Fitur seperti apa yang harus Anda cari dalam perangkat lunak yang memungkinkan Anda sebagai ilmuwan data warga?

  • Persiapan data swalayan tingkat lanjut
  • Analisis perilaku
  • Analisis grafik
  • Analisis lokasi
  • analitik web
  • Penemuan data yang cerdas

Persiapan data swalayan tingkat lanjut telah membantu Sears mengubah analis intelijen bisnis mereka menjadi ilmuwan data warga. Sears berinvestasi dalam solusi perangkat lunak penemuan data besar Platfora, memberikan akses ke 400 analis mereka. Hasilnya, para analis dapat menggunakan segmentasi pelanggan—biasanya tindakan ilmu data tingkat lanjut—untuk meningkatkan rekomendasi produk bagi pelanggan di situs web Sears.

Vendor intelijen bisnis Alteryx menawarkan alat visual yang mudah digunakan untuk melakukan pencampuran data yang kompleks. Daripada harus membuat kumpulan data baru untuk menggabungkan berbagai jenis data (misalnya, file Excel dan file Oracle), Anda dapat menggunakan fungsi drag-and-drop Alteryx untuk mengurangi tugas ilmu data yang panjang menjadi beberapa klik mouse.

Seperti Platfora dan Alteryx, perangkat lunak Paxata membuat analitik data tingkat lanjut menjadi kenyataan. Saya berbicara dengan Farnaz Erfan dari Paxata, yang menjelaskan bagaimana salah satu pelanggan mereka, sebuah perusahaan barang kemasan konsumen, membawa aktivitas tingkat PhD kepada para analis.

Paxata menciptakan "paradigma swalayan yang lengkap untuk para analis," yang tidak memerlukan bantuan ilmuwan data. Perusahaan menggunakan solusi swalayan untuk meningkatkan inventaris, pasokan, dan pemasaran. Misalnya, menggunakan Paxata “telah mengurangi waktu yang dibutuhkan analis bisnis untuk menyiapkan data waktu transit dari lima jam sebulan menjadi kurang dari satu jam.” Sumber penghematan lainnya adalah kemampuan untuk “mendeteksi penipuan kupon dengan mengidentifikasi dan mencocokkan alamat email yang menyinggung”.

Meskipun belajar menggunakan analitik tingkat lanjut menawarkan banyak manfaat, juga akan ada kurva pembelajaran. Yang mengatakan, itu tidak terlalu berlebihan: menurut perkiraan Gartner, hanya perlu satu hingga dua minggu untuk mencapai kecepatan. Sebagian besar vendor menawarkan pelatihan, tutorial, dan forum komunitas dengan jawaban atas pertanyaan umum.

3. Pastikan tata kelola diatur

Mo' akses, mo' (tata kelola data) masalah. Atau itu bisa terjadi, kecuali jika Anda menjadikan pemerintahan sebagai prioritas. Dengan lebih banyak ilmuwan data warga mengakses lebih banyak kumpulan data, ada lebih banyak peluang bagi data untuk jatuh ke tangan yang salah.

“Tata kelola data sangat penting,” jelas Werner Krebs, CEO perusahaan konsultan ilmu data Acculation. “Anda harus melatih karyawan Anda untuk memahami bahwa data itu berharga, dan membantu mereka menyediakan alat dan kerangka kerja untuk membantu mereka mengumpulkannya,” lanjutnya. Untungnya, ada beberapa kerangka kerja untuk mengatur data itu, dari Total Quality Management hingga ISO 9001 hingga "berbagai kerangka kerja enam sigma."

Gartner memberikan penekanan serupa pada tata kelola data: “Tata kelola yang tepat sangat penting, seperti halnya panduan tentang cara memahami data, hubungannya, dan penggunaan yang sesuai.”

Ada banyak manfaat dalam membiarkan lebih banyak orang mengakses lebih banyak data, tetapi orang-orang itu perlu memahami cara mengaksesnya, dan cara menjaganya tetap aman (jangan membaca dokumen sensitif di area dengan Wi-Fi publik yang tidak aman, misalnya ).

4. Pastikan organisasi Anda memiliki “penjaga” yang mengawasi cara Anda menggunakan data Anda

Peran baru seperti ilmuwan data warga membutuhkan aturan dan peran baru untuk mengelolanya. Manfaat yang bisa Anda dapatkan dari persiapan data tingkat lanjut sangat layak untuk dipikirkan ulang dan ditata ulang di seluruh bisnis. Yang mengatakan, Anda tidak ingin menyingkirkan peran manajemen data lama.

Satu aturan praktis untuk manajemen data di era ilmuwan data warga diringkas oleh lagu Pramuka lama: cari teman baru, tapi pertahankan yang lama. Dengan kata lain, pertahankan peran seperti pengelola data dan administrator basis data, tetapi juga tambahkan peran baru, seperti gagasan Gartner tentang wali, untuk memastikan ilmuwan data warga dapat menggunakan apa yang mereka butuhkan secara bertanggung jawab.

Gartner mendefinisikan peran "penjaga" sebagai orang yang "memastikan data dapat diindustrialisasi, aman, dan dapat diskalakan." Dengan kata lain, mereka adalah orang-orang yang mengawasi keamanan data, dan juga memastikan bahwa contoh yang berhasil dari ilmu data warga dapat diadopsi oleh seluruh bisnis. Mereka juga menjembatani kesenjangan antara peran manajemen data tradisional (Gartner menyebutnya "operator") dan ilmuwan data warga menggunakan data dengan cara baru ("inovator").

Bagaimana Anda menggunakan ilmu data warga?

Apakah Anda berperan sebagai ilmuwan data warga? Sudahkah Anda menggunakan analitik data tingkat lanjut untuk membantu bisnis Anda menghemat uang atau menghasilkan uang? Jika demikian, beri tahu saya di komentar di bawah!