Pembelajaran dengan Pengawasan vs Tanpa Pengawasan: Model Pembelajaran Mesin Mana yang Tepat untuk Anda?
Diterbitkan: 2022-05-07Pembelajaran mesin tidak harus membingungkan. Kami akan memecah dua jenis yang paling umum dan kasus penggunaannya dalam artikel ini.

Sebagai pemimpin bisnis, Anda tahu bahwa mengadopsi teknologi baru dapat mengurangi masalah dan membuat bisnis Anda lebih kompetitif. Itulah sebabnya selama satu tahun disrupsi, banyak bisnis beralih ke transformasi digital untuk melewatinya.
Anda mungkin juga menyadari potensi teknologi yang muncul seperti pembelajaran mesin yang dapat membuat bisnis Anda tahan di masa depan. Tetapi pembeli berhati-hatilah—jika Anda tidak memahami aplikasi pembelajaran mesin, Anda berisiko membuang-buang uang untuk hasil yang tidak dapat digunakan. Ambil contoh di bawah ini untuk melihat apa yang kami maksud.
Untuk mempersiapkan penulisan artikel ini, kami menggunakan alat generasi bahasa alami (NLG) untuk membantu kami memahami cara terbaik memecah pembelajaran yang diawasi versus tidak diawasi. Berikut adalah kutipan dari mitra NLG kami:
“Setiap model pembelajaran tanpa pengawasan menyediakan matriks tensorong maju berdasarkan koefisien korelasi, respons positif palsu, data yang berguna secara statistik minimal (atau sangat bergantung padanya), digunakan untuk pengurangan dimensi menggunakan grafik dan pohon untuk menghasilkan titik data batasnya sendiri.”
Merasa bingung? Kami juga. Namun terlepas dari sintaks yang membingungkan dari kalimat alat NLG, percobaan dengan kecerdasan buatan (AI) ini tidak sepenuhnya tidak membantu. Itu membuat kami menyadari bahwa untuk mendapatkan hasil terbaik dari AI, menemukan aplikasi yang tepat itu penting—itulah sebabnya kami menulis panduan ini untuk membantu Anda.
Kami berbicara dengan Thomas Wood, konsultan ilmu data untuk Fast Data Science, dan dia membantu memecah topik dalam istilah yang mudah dipahami. Dengan bantuan Wood, kami akan menjelaskan perbedaan antara dua metode pembelajaran mesin yang umum, pembelajaran yang diawasi dan tidak diawasi, dan kasus penggunaan apa yang paling cocok untuk setiap metode.
Baru mengenal pembelajaran mesin? Tinjau konsep-konsep kunci ini sebelum menyelam ke sisa artikel ini:
- Pembelajaran mesin (ML) adalah bagian dari kecerdasan buatan (AI) yang memecahkan masalah menggunakan algoritma dan model statistik untuk mengekstrak pengetahuan dari data. Secara garis besar, semua model machine learning bisa dikategorikan menjadi supervised atau unsupervised learning.
- Algoritma dalam pembelajaran mesin adalah prosedur yang dijalankan pada data untuk membuat model pembelajaran mesin.
- Model dalam pembelajaran mesin adalah output dari algoritma pembelajaran mesin yang dijalankan pada data. Artinya, model mewakili apa yang dipelajari oleh algoritma pembelajaran mesin.
Apa perbedaan utama antara pembelajaran yang diawasi dan tidak diawasi?
Jika kita harus meringkasnya menjadi satu kalimat, itu akan menjadi ini: Perbedaan utama antara pembelajaran yang diawasi dan pembelajaran tanpa pengawasan adalah bahwa pembelajaran yang diawasi menggunakan data berlabel untuk membantu memprediksi hasil, sedangkan pembelajaran tanpa pengawasan tidak.
Namun, ada nuansa tambahan di antara kedua pendekatan tersebut, yang akan terus kami klarifikasi sehingga Anda dapat memilih pendekatan terbaik untuk situasi Anda.
Cara kerja pembelajaran mesin yang diawasi
Seperti yang kami sebutkan di atas, pembelajaran terawasi menggunakan data berlabel untuk melatih model. Tapi apa artinya itu secara teori? Mari kita telusuri beberapa contoh untuk memulai.
Dengan pembelajaran terawasi, model diberikan input dan output yang sesuai. Misalkan kita melatih model untuk mengidentifikasi dan mengklasifikasikan berbagai jenis buah-buahan. Dalam contoh ini, Anda akan memberikan beberapa gambar buah sebagai input, beserta profil bentuk, ukuran, warna, dan rasanya. Selanjutnya, Anda akan memberikan model dengan nama masing-masing buah sebagai output Anda.
Akhirnya, algoritme akan mengambil pola antara karakteristik buah (input) dan namanya (output). Setelah ini terjadi, model dapat diberikan input baru, dan itu akan memprediksi output untuk Anda. Pembelajaran terawasi semacam ini, yang disebut klasifikasi , adalah yang paling umum .
Cara kerja pembelajaran mesin tanpa pengawasan
Sebaliknya, pembelajaran tanpa pengawasan bekerja dengan mengajarkan model untuk mengidentifikasi pola sendiri (karenanya tanpa pengawasan ) dari data yang tidak berlabel. Ini berarti bahwa input disediakan, tetapi bukan output.
Untuk memahami cara kerjanya, mari kita lanjutkan dengan contoh buah yang diberikan di atas. Dengan pembelajaran tanpa pengawasan, Anda akan memberikan model dengan dataset input (gambar buah dan karakteristiknya), tetapi Anda tidak akan memberikan output (nama buah).
Model akan menggunakan algoritma yang sesuai untuk melatih dirinya membagi buah ke dalam kelompok yang berbeda sesuai dengan fitur yang paling mirip di antara mereka. Pembelajaran tanpa pengawasan semacam ini, yang disebut pengelompokan , adalah yang paling umum.
Perlu menjalankan kedua model pembelajaran mesin sekali lagi? Lihat video singkat ini untuk penjelasan tingkat tinggi:
Kapan pembelajaran yang diawasi vs. pembelajaran tanpa pengawasan digunakan?
Apakah Anda harus menggunakan pembelajaran terawasi atau tidak terawasi tergantung pada tujuan Anda dan struktur serta volume data yang tersedia untuk Anda. Sebelum membuat keputusan, mintalah data scientist Anda mengevaluasi hal-hal berikut:

- Apakah data masukan merupakan kumpulan data yang tidak berlabel atau berlabel? Jika tidak berlabel, dapatkah tim Anda mendukung pelabelan tambahan?
- Apa tujuan yang ingin Anda capai? Apakah Anda bekerja dengan masalah yang berulang dan terdefinisi dengan baik atau akankah algoritme perlu memprediksi masalah baru?
- Apakah ada algoritme yang mendukung volume dan struktur data Anda? Apakah mereka memiliki dimensi yang sama yang Anda butuhkan (jumlah fitur atau atribut)?
Kapan harus menggunakan pembelajaran mesin yang diawasi
Menurut Gartner, pembelajaran yang diawasi adalah jenis pembelajaran mesin yang paling populer dan paling sering digunakan dalam skenario bisnis. Ini mungkin karena meskipun mengklasifikasikan data besar dapat menjadi tantangan nyata dalam pembelajaran yang diawasi, hasilnya sangat akurat dan dapat dipercaya (sumber lengkap tersedia untuk klien).
Berikut adalah beberapa contoh kasus penggunaan untuk pembelajaran yang diawasi. Beberapa spesifik industri, sementara yang lain dapat berlaku untuk organisasi mana pun:
- Mengidentifikasi faktor risiko penyakit dan merencanakan tindakan pencegahan
- Mengklasifikasikan apakah sebuah email adalah spam
- Memprediksi harga rumah
- Memprediksi churn pelanggan
- Memprediksi curah hujan dan kondisi cuaca
- Mencari tahu apakah pemohon pinjaman berisiko rendah atau berisiko tinggi
- Memprediksi kegagalan bagian mekanis pada mesin mobil
- Memprediksi skor berbagi media sosial dan skor kinerja
Wood membagikan kepada kami contoh bagaimana dia menggunakan pembelajaran yang diawasi untuk membangun sistem triase untuk email masuk klien. Dengan bantuan sistem CRM, email dikategorikan ke dalam kelompok yang mewakili pertanyaan umum (misalnya pelanggan mengubah alamat, keluhan). Wood kemudian menggunakan kategori ini untuk melatih model sehingga ketika menerima email masuk baru, ia akan mengetahui kategori mana yang akan ditetapkan untuk email tersebut. Dia berkata:
“Pembelajaran yang diawasi dimungkinkan dalam hal ini karena adanya sistem CRM yang menyediakan serangkaian 'label' untuk melatih model. Tanpa ini, hanya pembelajaran tanpa pengawasan yang mungkin terjadi.”
Kapan menggunakan pembelajaran mesin tanpa pengawasan
Berbeda dengan pembelajaran yang diawasi, pembelajaran tanpa pengawasan dapat menangani volume data yang besar secara real time. Dan karena model akan secara otomatis mengidentifikasi struktur dalam data (klasifikasi), ini berguna dalam kasus di mana manusia akan kesulitan menemukan tren dalam data sendiri.
Misalnya, jika Anda mencoba mengelompokkan calon konsumen ke dalam kelompok untuk tujuan pemasaran, metode pengelompokan tanpa pengawasan akan menjadi titik awal yang bagus.
Berikut adalah beberapa contoh kasus penggunaan untuk pembelajaran tanpa pengawasan:
- Mengelompokkan pelanggan berdasarkan perilaku pembelian mereka
- Menemukan korelasi dalam data pelanggan (misalnya, orang yang membeli tas gaya tertentu mungkin juga tertarik dengan gaya sepatu tertentu)
- Segmentasi data berdasarkan riwayat pembelian
- Mengklasifikasikan orang berdasarkan minat yang berbeda
- Mengelompokkan inventaris berdasarkan metrik manufaktur dan penjualan
Wood menjelaskan kepada kami bahwa dia pernah bekerja di sebuah perusahaan farmasi dengan fasilitas manufaktur di seluruh dunia. Perangkat lunak yang digunakan perusahaan untuk merekam kesalahan yang terjadi di fasilitas mereka tidak memiliki menu tarik-turun dengan opsi kesalahan umum untuk dipilih.
Karena itu, pekerja pabrik mendokumentasikan kesalahan dalam teks biasa (baik dalam bahasa Inggris atau bahasa lokal mereka). Perusahaan ingin mengetahui penyebab umum masalah manufaktur, tetapi tanpa kategorisasi kesalahan, tidak mungkin untuk melakukan analisis statistik pada data.
Wood menggunakan algoritma pembelajaran tanpa pengawasan untuk menemukan kesamaan dalam kesalahan. Dia mampu mengidentifikasi tema terbesar dan menghasilkan statistik seperti rincian diagram lingkaran dari masalah manufaktur umum di perusahaan. Kayu berkata:
“Ini memberi perusahaan gambaran sekilas tentang masalah dalam bisnis mereka yang seharusnya membutuhkan pekerjaan manual yang cukup besar.”
Bersiaplah untuk masa depan yang cerdas: Rangkullah pembelajaran mesin
Pembelajaran mesin adalah alat canggih yang dapat membantu Anda memecahkan masalah bisnis dan membuat keputusan berdasarkan data. Semoga artikel ini memberi Anda beberapa gagasan tentang bagaimana pembelajaran mesin yang diawasi atau tidak dapat diterapkan di organisasi Anda.
Jika Anda siap untuk merangkul teknologi pembelajaran mesin, langkah Anda selanjutnya adalah mengevaluasi kemampuan tumpukan perangkat lunak Anda saat ini. Kemudian, minta vendor Anda untuk kasus penggunaan dari klien lain di industri Anda yang selaras dengan aplikasi yang ingin Anda gunakan untuk pembelajaran mesin.
Merasa masih banyak yang harus dipelajari? Lihat bacaan terkait ini dari Capterra:
- Apa itu Pembelajaran Mesin? Glosarium Kecerdasan Bisnis Esensial Anda
- Panduan Bisnis Kecil yang Cerdas untuk Pembelajaran Mesin vs. Kecerdasan Buatan
- Aplikasi Teratas Kecerdasan Buatan untuk Usaha Kecil
Juga, periksa direktori perangkat lunak pembelajaran mesin Capterra, di mana Anda dapat membaca ulasan dari pengguna nyata dan alat filter berdasarkan titik harga atau fitur mereka.