Cara Menggunakan Pembelajaran Mesin di Big Data Analytics
Diterbitkan: 2022-09-30Pembelajaran mesin memungkinkan organisasi mengubah data besar menjadi wawasan yang meningkatkan laba. Pelajari bagaimana big data dan machine learning terkait dan cara menggunakannya.
Bertahun-tahun yang lalu, pemilik bisnis harus mengandalkan ingatan mereka untuk menyesuaikan cara mereka melayani pelanggan mereka. Ketika Ms. Jones masuk, seorang pemilik toko harus mengingat apa yang dia beli terakhir kali, apakah dia akhirnya membawanya kembali atau tidak, dan apakah dia mengeluh tentang hal itu selama kunjungan terakhirnya.
Sekarang, berkat data besar, banyak data pelanggan dan bisnis ada di ujung jari Anda. Anda tahu di mana Ms. Jones tinggal, apa yang dia beli selama 10 tahun terakhir, berapa banyak yang dia belanjakan, seberapa sering dia mengembalikan barang, dan lusinan metrik lainnya. Dengan pembelajaran mesin, Anda dapat mengubah data ini dan data lainnya menjadi wawasan yang meningkatkan bisnis. Berikut adalah rincian big data dan machine learning serta bagaimana Anda dapat memanfaatkannya untuk memperkuat bisnis Anda.
Apa itu big data dan pembelajaran mesin?
Data besar dan pembelajaran mesin berbeda namun terhubung erat.
Apa itu data besar?
Data besar mengacu pada kumpulan data yang sangat besar atau sangat kompleks yang mungkin tidak mungkin dimanfaatkan tanpa alat khusus. Beberapa bisnis tidak pernah harus berurusan dengan data besar. Misalnya, jika Anda memiliki restoran dengan tiga lokasi yang menghasilkan data penjualan dan inventaris, itu bukan "data besar".
Di sisi lain, jika restoran yang sama menambahkan 10 lokasi lagi dan aplikasi seluler yang memungkinkan pelanggan melakukan pemesanan secara online, memanfaatkan hadiah loyalitas, dan mengobrol dengan perwakilan layanan pelanggan melalui teks, Anda sekarang memiliki situasi data yang besar. Aplikasi itu sendiri dapat menghasilkan data mengenai:
- Makanan yang paling sering dipesan pelanggan
- Waktu pelanggan melakukan pemesanan
- Dari mana pelanggan memesan makanan berdasarkan data geo-lokasi
- Tempat tinggal pelanggan dan statistik pembelian yang terkait dengan setiap kota
- Data penjualan dari setiap lokasi
- Bagaimana pelanggan menggunakan poin reward mereka
- Membeli data saat jam sibuk dan liburan
Contoh-contoh ini hanya menggores permukaan. Aplikasi semacam ini dapat menghasilkan lusinan kumpulan data. Juga, informasi akan mengalir hampir secara konstan. Itu data besar.
Apa itu pembelajaran mesin?
Pembelajaran mesin (ML) mengacu pada penggunaan komputer untuk mengenali pola dalam data. Pembelajaran mesin melakukan ini menggunakan algoritme, yang merupakan kumpulan instruksi yang disusun selangkah demi selangkah. Model pembelajaran mesin menggunakan langkah-langkah dalam algoritme untuk mempelajari pola. Ini juga termasuk mengenali ketika pola sedang rusak dan belajar bagaimana membandingkan pola satu sama lain.
Sebagai contoh sederhana, misalkan Anda ingin membuat algoritme pembelajaran mesin untuk menganalisis data penjualan. Anda memiliki angka penjualan selama lima tahun. Tujuan Anda adalah memaksimalkan keuntungan musim panas dengan mencari tahu produk mana yang harus Anda tawarkan untuk dijual antara bulan Juni dan Agustus.
Anda dapat memprogram sistem pembelajaran mesin Anda untuk:
- Gabungkan data penjualan untuk setiap produk Anda, dari bulan ke bulan.
- Identifikasi produk yang memiliki volume penjualan tertinggi antara bulan Juni dan Agustus.
- Memprediksi penjualan yang terkait dengan menawarkan setiap produk.
- Memberi tahu Anda produk mana yang akan ditawarkan dan apakah Anda harus menawarkannya pada bulan Juni, Juli, Agustus, atau selama tiga bulan tersebut.
Tentu saja, Anda dapat membawa ML selangkah lebih maju dan memasukkan harga pokok penjualan (COGS) Anda untuk setiap produk, termasuk pengiriman, tenaga kerja, penyimpanan, dan data lainnya. Kemudian model ML Anda dapat merekomendasikan tidak hanya produk yang memiliki volume penjualan musim panas tertinggi, tetapi juga dapat memberi tahu Anda mana yang menghasilkan laba bersih paling banyak.
Anda kemudian dapat menggunakan model yang sama untuk memberikan wawasan penjualan untuk:
- Produk individu selama setahun
- Produk baru yang ditujukan untuk target pasar yang serupa
- Setiap bulan dalam setahun
Apa itu pembelajaran mesin dalam data besar?
Dalam konteks data besar, kapan pun ada pola dalam data, Anda dapat menggunakan pembelajaran mesin untuk menemukannya dan memberikan wawasan yang berguna. Selain itu, Anda dapat menggunakan ML untuk membuat rekomendasi berdasarkan pola yang dianalisis algoritme.
Cara kerja pembelajaran mesin dengan data besar
Salah satu aplikasi pembelajaran mesin yang paling populer adalah kendaraan self-driving. Mobil menggunakan pembelajaran mesin untuk memutuskan apa yang harus dilakukan sehubungan dengan data yang dikumpulkan dari sekitarnya dan kendaraan lain.
Misalnya, ketika kamera di dalam kendaraan self-driving "melihat" tanda berhenti, mereka dapat mengenalinya dan mengerem secara otomatis. Proses di balik keputusan ini kemungkinan besar dimulai dengan sekelompok ilmuwan data yang menguji beberapa algoritma pembelajaran mesin. Pada tingkat tinggi, ini membutuhkan tiga langkah:
1. Pelatihan
Untuk menganalisis data besar, ilmuwan data pertama-tama menggunakan satu set pelatihan untuk mengajarkan satu atau lebih algoritme apa yang harus mereka cari.
Misalnya, dengan tanda berhenti, set pelatihan akan menjadi ribuan gambar tanda berhenti. Insinyur data akan menampilkan gambar tanda berhenti dari sudut yang berbeda, dalam pencahayaan yang berbeda, dan bahkan dengan pohon atau benda lain yang menghalangi sebagian.
Pada akhir tahap pelatihan, harapannya adalah algoritma telah mengidentifikasi pola dalam bentuk dan warna tanda berhenti. Dengan kata lain, ia tahu seperti apa "tampak" tanda berhenti—dan dalam pencahayaan yang berbeda dan dari berbagai sudut.
2. Memvalidasi
Set validasi digunakan untuk mengetahui seberapa akurat model ML menggunakan set data besar yang sama sekali berbeda. Tujuan fase validasi adalah menemukan cara untuk menyempurnakan model ML.
Misalnya, model ML yang dirancang untuk mengidentifikasi tanda berhenti memiliki akurasi 95%, dan semua gambar yang salah sangat gelap. Pengembang kemudian dapat menggunakan formula lain yang meningkatkan kontras setiap gambar, membuat karakteristik penting lebih mudah dilihat oleh model ML.
3. Pengujian
Fase pengujian melibatkan memberi makan model ML lebih banyak data besar yang benar-benar berbeda dari apa yang dilihatnya selama fase pelatihan dan validasi.

Misalnya, untuk menguji model rambu berhenti, pemrogram dapat menunjukkan model ML 250.000 gambar dari berbagai jenis rambu, beberapa di antaranya adalah rambu berhenti. Mereka kemudian akan menganalisis hasilnya untuk melihat seberapa akurat model tersebut dapat membedakan rambu-rambu berhenti—serta menghindari kesalahan mengidentifikasi jenis rambu lainnya.
Tantangan dengan pembelajaran mesin dan data besar
Dua tantangan paling menakutkan yang dihadapi ilmuwan data yang menggunakan ML untuk mempelajari data besar adalah ketidakakuratan dan dilema etika.
1. Ketidakakuratan
Tentu saja, bahkan dengan proses komputasi lanjutan yang terlibat, Anda masih akan melalui elemen coba-coba kapan pun Anda menggunakan pembelajaran mesin dalam analitik data besar. Ini karena Anda tidak pernah tahu faktor mana yang dapat memengaruhi hasil Anda saat Anda melatih, memvalidasi, dan menguji model Anda.
Misalnya, saat mengidentifikasi gambar—seperti tanda berhenti atau wajah manusia—beberapa faktor dapat menyebabkan performa yang buruk dalam model ML Anda. Misalnya, Anda sedang mengembangkan model pembelajaran mesin untuk meningkatkan sistem keamanan perusahaan Anda. Secara khusus, Anda menginginkan model yang dapat mengidentifikasi wajah eksekutif dan orang-orang berpangkat tinggi lainnya sehingga mereka dapat diberikan akses ke area sensitif bangunan. Selama fase validasi, sistem hanya sekitar 65% akurat. Tapi ini bisa disebabkan oleh beberapa variabel, seperti:
- Gambar wajah dalam piksel
- Gambar yang tidak fokus
- Orang yang memalingkan muka selama pemindaian wajah
- Individu yang memutuskan untuk memakai kacamata hitam, masker wajah, syal, atau hal lain yang dapat merusak hasil identifikasi
2. Dilema etika
Ada juga tantangan etika. Misalnya, departemen SDM menggunakan pembelajaran mesin untuk mengidentifikasi kandidat yang paling memenuhi syarat, menarik mereka keluar dari tumpukan digital 1.500 resume.
Jika model ML dilatih menggunakan perusahaan dan departemen perekrutan yang dijalankan hanya oleh laki-laki, datanya mungkin termasuk bias. Beberapa laki-laki mungkin lebih cenderung mempekerjakan laki-laki lain—karena alasan-alasan selain dari kelebihan atau kualifikasi mereka. Oleh karena itu, kandidat "sukses" yang dilatih oleh para insinyur model ML untuk dicari mungkin, dalam banyak kasus, adalah laki-laki. Alhasil, model tersebut merekomendasikan pria ketimbang wanita yang mungkin lebih berkualitas.
Dalam konteks bisnis, bagaimana data besar dan pembelajaran mesin terkait?
Dalam konteks bisnis, pembelajaran mesin menggunakan data besar yang dihasilkan organisasi Anda untuk meningkatkan atau mengotomatiskan proses penting bisnis dan meningkatkan keamanan dan keselamatan. Aplikasi potensial benar-benar tidak terbatas—dan beragam seperti berbagai jenis data yang Anda hasilkan.
Misalnya, pabrik atau fasilitas produksi dapat menggunakan pembelajaran mesin untuk mengoptimalkan tingkat suhu dan kelembaban untuk lantai pabriknya. Misalnya, model pembelajaran mesin dapat mengetahui:
- Tingkat suhu dan kelembaban yang memaksimalkan produktivitas karyawan sambil meminimalkan jumlah istirahat yang tidak direncanakan yang harus mereka ambil
- Tingkat suhu dan kelembaban yang ideal untuk peralatan sensitif yang dapat memburuk lebih cepat dengan kondisi yang salah
- Kondisi suhu dan kelembaban yang paling hemat biaya, mengingat biaya menjalankan sistem HVAC dan penurun kelembapan
Sistem kemudian dapat digunakan untuk secara otomatis mengontrol sistem atmosfer Anda untuk mencapai hasil yang optimal.
Bagaimana pembelajaran mesin dan analitik data besar digunakan dalam pemasaran?
Pemasaran menawarkan beberapa aplikasi pembelajaran mesin dan analisis data besar yang paling menjanjikan. Perhatikan contoh kehidupan nyata berikut.
Harley Davidson's Albert meningkatkan keunggulan sebesar 2.930%
Harley Davidson membangun robot bernama Albert yang menggunakan pembelajaran mesin untuk membuat keputusan pemasaran [1] . Beginilah cara Albert membantu para eksekutif Harley Davidson menuju matahari terbenam yang lebih cerah.
Harley Davidson ingin memanfaatkan hubungan mereka yang sudah ada dengan pelanggan sebelumnya. Mereka menggunakan Albert untuk menganalisis:
- Seberapa sering orang melakukan pembelian
- Berapa banyak yang dihabiskan pelanggan ini?
- Berapa banyak waktu yang dihabiskan pelanggan untuk menjelajahi situs web Harley Davidson
Albert kemudian menggunakan data ini untuk memisahkan pelanggan ke dalam segmen yang berbeda. Tim pemasaran kemudian membuat kampanye uji untuk setiap kategori pelanggan. Setelah menguji keberhasilan kampanye, tim meningkatkannya untuk melibatkan banyak pelanggan sebelumnya.
Hasilnya, Harley Davidson meningkatkan penjualannya sebesar 40%. Mereka juga menghasilkan 2.930% lebih banyak prospek. Separuh dari petunjuk itu langsung diidentifikasi oleh Albert sendiri. Albert mempelajari profil prospek yang kemungkinan besar akan berkonversi menjadi pelanggan yang membayar dan kemudian mempelajari profil data pengguna lain dan menunjukkan "penampilan", atau orang yang memiliki banyak kesamaan dengan pelanggan berkonversi tinggi.
Baik Anda mencoba mencari tahu apa yang akan dibeli Ms. Jones selanjutnya atau mengoptimalkan efisiensi fasilitas produksi yang kompleks, pembelajaran mesin dapat mengubah data besar yang tampaknya acak menjadi wawasan transformasional. Dengan sedikit curah pendapat dan pemikiran kreatif, Anda dapat menemukan cara untuk menggunakan ML dan data besar untuk melampaui persaingan dan membawa organisasi Anda ke tingkat berikutnya.
Ingin mempelajari lebih lanjut tentang alat yang dapat membantu dengan data besar?
Perangkat lunak data besar dapat berfungsi untuk membantu memastikan bisnis Anda mendapatkan hasil maksimal dari data besar dan analitiknya. Jelajahi dan bandingkan beberapa alat teratas, baca ulasan, dan temukan solusi terbaik untuk kebutuhan spesifik bisnis Anda.
Sumber
1. Harley Davidson NYC mencapai rekor tertinggi sepanjang masa bersama Albert, Albert.ai