Denetimli ve Denetimsiz Öğrenme: Hangi Makine Öğrenimi Modeli Size Uygun?

Yayınlanan: 2022-05-07

Makine öğrenimi gizemli olmak zorunda değil. Bu makalede en yaygın iki türü ve kullanım durumlarını inceleyeceğiz.

Verileri birbirleriyle paylaşan bir kişi ve bir makine

Bir iş lideri olarak, yeni teknolojiyi benimsemenin sorunlu noktaları hafifletebileceğini ve işinizi daha rekabetçi hale getirebileceğini biliyorsunuz. Bu nedenle, bir kesinti yılı boyunca birçok işletme, bunu başarmak için dijital dönüşüme yöneldi.

Ayrıca, işinizi geleceğe hazır hale getirebilecek makine öğrenimi gibi gelişen teknolojilerin potansiyelinin de farkında olabilirsiniz. Ancak alıcı dikkatli olun - makine öğreniminin uygulamalarını anlamazsanız, kullanılamaz sonuçlar için para harcama riskiniz vardır. Ne demek istediğimizi görmek için aşağıdaki örneği inceleyin.

Bu makaleyi yazmaya hazırlanmak için, denetimli ve denetimsiz öğrenmeyi en iyi nasıl ayıracağımızı anlamamıza yardımcı olacak bir doğal dil oluşturma (NLG) aracı kullandık. İşte NLG meslektaşımızdan bir alıntı:

"Her denetimsiz öğrenme modeli, korelasyon katsayısına, yanlış pozitif yanıta, istatistiksel olarak çok az faydalı veriye (veya buna büyük ölçüde bağımlı) dayalı ileri tensorong matrisleri sağlar, kendi limit veri noktalarını oluşturmak için grafikler ve ağaçlar kullanılarak boyutsallık azaltma için kullanılır."

Kafan karışık mı? Biz de. Ancak NLG aracının cümlelerinin şaşırtıcı sözdizimine rağmen, yapay zeka (AI) ile yapılan bu deney tamamen yararsız değildi. Yapay zekadan en iyi sonuçları almak söz konusu olduğunda, doğru uygulamayı bulmanın önemli olduğunu anlamamızı sağladı - bu kılavuzu size yardımcı olmak için tam da bu yüzden yazdık.

Fast Data Science için veri bilimi danışmanı olan Thomas Wood ile konuştuk ve konunun anlaşılması kolay terimlerle çözülmesine yardımcı oldu. Wood'un yardımıyla, iki yaygın makine öğrenimi yöntemi olan denetimli ve denetimsiz öğrenme arasındaki farkı ve her bir yöntem için en uygun kullanım durumlarının hangileri olduğunu açıklayacağız.

Makine öğreniminde yeni misiniz? Bu makalenin geri kalanına dalmadan önce bu temel kavramları gözden geçirin:

  • Makine öğrenimi (ML) , verilerden bilgi çıkarmak için algoritmalar ve istatistiksel modeller kullanarak sorunları çözen bir yapay zeka (AI) alt kümesidir. Genel olarak konuşursak, tüm makine öğrenimi modelleri denetimli veya denetimsiz öğrenme olarak kategorize edilebilir.
  • Makine öğreniminde bir algoritma , bir makine öğrenimi modeli oluşturmak için veriler üzerinde çalıştırılan bir prosedürdür.
  • Makine öğrenimindeki bir model , veriler üzerinde çalışan bir makine öğrenimi algoritmasının çıktısıdır. Anlamı, bir model, bir makine öğrenimi algoritması tarafından öğrenilenleri temsil eder.

Denetimli ve denetimsiz öğrenme arasındaki temel farklar nelerdir?

Bunu bir cümleye indirgemek zorunda olsaydık, şu olurdu: Denetimli öğrenme ile denetimsiz öğrenme arasındaki temel fark, denetimli öğrenmenin sonuçları tahmin etmeye yardımcı olmak için etiketlenmiş verileri kullanması, denetimsiz öğrenmenin ise kullanmamasıdır.

Ancak, durumunuza en uygun yaklaşımı seçebilmeniz için açıklığa kavuşturmaya devam edeceğimiz iki yaklaşım arasında ek nüanslar vardır.

Denetimli makine öğrenimi nasıl çalışır?

Yukarıda bahsettiğimiz gibi, denetimli öğrenme, modeli eğitmek için etiketlenmiş verileri kullanır. Ama bu teoride ne anlama geliyor? Başlamak için birkaç örnek üzerinden gidelim.

Denetimli öğrenme ile modele hem girdiler hem de karşılık gelen çıktılar sağlanır. Modeli farklı meyve türlerini tanımlamak ve sınıflandırmak için eğittiğimizi varsayalım. Bu örnekte, girdi olarak şekil, boyut, renk ve lezzet profilleriyle birlikte meyvelerin birkaç resmini sunacaksınız. Ardından, çıktınız olarak modele her meyvenin adını vereceksiniz.

Sonunda algoritma, meyvelerin özellikleri (girdiler) ve adları (çıkışlar) arasında bir model alacaktır. Bu gerçekleştiğinde, modele yeni bir girdi sağlanabilir ve sizin için çıktıyı tahmin edecektir. Sınıflandırma adı verilen bu tür denetimli öğrenme en yaygın olanıdır .

Denetimsiz makine öğrenimi nasıl çalışır?

Aksine, denetimsiz öğrenme, modele etiketlenmemiş verilerden kalıpları kendi başına (dolayısıyla denetimsiz ) tanımlamayı öğreterek çalışır. Bu, bir girdinin sağlandığı, ancak bir çıktının olmadığı anlamına gelir.

Bunun nasıl çalıştığını anlamak için yukarıda verilen meyve örneği ile devam edelim. Denetimsiz öğrenme ile, modele girdi veri kümesini (meyvelerin resimleri ve özellikleri) sağlayacaksınız, ancak çıktıyı (meyvelerin adları) sağlamayacaksınız.

Model, meyveleri aralarındaki en benzer özelliklere göre farklı gruplara bölmek için kendini eğitmek için uygun bir algoritma kullanacaktır. Kümeleme adı verilen bu tür denetimsiz öğrenme en yaygın olanıdır.

İki makine öğrenimi modelini bir kez daha çalıştırmanız mı gerekiyor? Üst düzey bir açıklama için bu kısa videoyu izleyin:

Denetimli öğrenme ve denetimsiz öğrenme ne zaman kullanılmalıdır?

Denetimli veya denetimsiz öğrenmeyi kullanmanız, hedeflerinize ve elinizde bulunan verilerin yapısına ve hacmine bağlıdır. Bir karar vermeden önce veri bilimcinizin aşağıdakileri değerlendirmesini sağlayın:

  • Girdi verileri etiketlenmemiş veya etiketlenmiş bir veri kümesi mi? Etiketlenmemişse ekibiniz ek etiketlemeyi destekleyebilir mi?
  • Ulaşmak istediğiniz hedef nedir? Tekrar eden, iyi tanımlanmış bir problemle mi çalışıyorsunuz yoksa algoritmanın yeni problemleri tahmin etmesi gerekecek mi?
  • Veri hacminizi ve yapınızı destekleyen algoritmalar var mı? İhtiyacınız olan aynı boyuta sahipler mi (özellik veya nitelik sayısı)?

Denetimli makine öğrenimi ne zaman kullanılır?

Gartner'a göre, denetimli öğrenme, iş senaryolarında en popüler ve en sık kullanılan makine öğrenimi türüdür. Bunun nedeni, büyük verileri sınıflandırmak denetimli öğrenmede gerçek bir zorluk olsa da sonuçların oldukça doğru ve güvenilir olmasıdır (müşteriler için tam kaynak mevcuttur).

İşte denetimli öğrenme için bazı kullanım örnekleri. Bazıları sektöre özeldir, diğerleri ise herhangi bir kuruluşa başvurabilir:

  • Hastalıklar için risk faktörlerinin belirlenmesi ve önleyici tedbirlerin planlanması
  • Bir e-postanın spam olup olmadığını sınıflandırma
  • Ev fiyatlarını tahmin etme
  • Müşteri kaybını tahmin etme
  • Yağış ve hava koşullarının tahmin edilmesi
  • Kredi başvurusunda bulunan kişinin düşük riskli mi yoksa yüksek riskli mi olduğunu öğrenmek
  • Otomobil motorlarındaki mekanik parçaların arızasını tahmin etme
  • Sosyal medya paylaşım puanlarını ve performans puanlarını tahmin etme

Wood, bir müşterinin gelen e-postaları için bir triyaj sistemi oluşturmak için denetimli öğrenmeyi nasıl kullandığına dair bir örneği bizimle paylaştı. Bir CRM sisteminin yardımıyla, e-postalar ortak sorguları temsil eden gruplara ayrıldı (örneğin, müşteri adresi değiştirme, şikayetler). Wood daha sonra bu kategorileri bir modeli eğitmek için kullandı, böylece yeni bir gelen e-posta aldığında bu e-postayı hangi kategoriye atayacağını bilecek. Diyor:

“Bu durumda, modeli eğitmek için bir dizi 'etiket' sağlayan CRM sisteminin varlığı nedeniyle denetimli öğrenme mümkün oldu. Bunlar olmadan, yalnızca denetimsiz öğrenme mümkün olabilirdi.”

Gelen kutunuzu temizlemek mi istiyorsunuz? CRM yazılımını kullanmaya başlayın.

Denetimsiz makine öğrenimi ne zaman kullanılır?

Denetimli öğrenmenin aksine, denetimsiz öğrenme büyük miktarda veriyi gerçek zamanlı olarak işleyebilir. Model, verilerdeki yapıyı (sınıflandırma) otomatik olarak tanımlayacağından, bir insanın verilerde kendi başına eğilimleri bulmakta zorlanacağı durumlarda yararlıdır.

Örneğin, pazarlama amacıyla potansiyel tüketicileri gruplara ayırmaya çalışıyorsanız, denetimsiz bir kümeleme yöntemi harika bir başlangıç ​​noktası olacaktır.

Denetimsiz öğrenme için bazı kullanım örnekleri şunlardır:

  • Müşterileri satın alma davranışlarına göre gruplama
  • Müşteri verilerinde korelasyon bulma (örneğin, belirli bir tarzda çanta satın alan kişiler, belirli bir ayakkabı stiliyle de ilgilenebilirler)
  • Verileri satın alma geçmişine göre segmentlere ayırma
  • İnsanları farklı ilgi alanlarına göre sınıflandırmak
  • Stokları üretim ve satış metriklerine göre gruplama

Wood bize bir zamanlar dünya çapında üretim tesisleri olan bir ilaç şirketinde çalıştığını anlattı. Şirketin tesislerinde meydana gelen hataları kaydetmek için kullandığı yazılım, aralarından seçim yapabileceğiniz yaygın hata seçeneklerinin bulunduğu bir açılır menüye sahip değildi.

Bu nedenle, fabrika işçileri hataları düz metin olarak (İngilizce veya yerel dillerinde) belgelediler. Şirket, yaygın üretim sorunlarının nedenlerini bilmek istedi, ancak hataların sınıflandırılması olmadan veriler üzerinde istatistiksel analiz yapmak imkansızdı.

Wood, hatalardaki ortak noktaları keşfetmek için denetimsiz bir öğrenme algoritması kullandı. En büyük temaları belirleyebildi ve şirketteki yaygın üretim sorunlarının pasta grafik kırılımları gibi istatistikler üretebildi. Ahşap diyor ki:

"Bu, şirkete, aksi takdirde önemli ölçüde manuel çalışma gerektirebilecek işlerindeki sorunlara bir bakışta genel bir bakış sağladı."

Akıllı bir geleceğe hazırlanın: Makine öğrenimini benimseyin

Makine öğrenimi, iş sorunlarını çözmenize ve veriye dayalı kararlar almanıza yardımcı olabilecek güçlü bir araçtır. Umarım bu makale, kuruluşunuzda denetimli veya denetimsiz makine öğreniminin nasıl uygulanabileceği hakkında size bazı fikirler verir.

Makine öğrenimi teknolojisini benimsemeye hazırsanız, sonraki adımınız mevcut yazılım yığınınızın yeteneklerini değerlendirmek olmalıdır. Ardından, satıcınızdan/satıcılarınızdan, sektörünüzdeki diğer istemcilerden makine öğrenimini kullanmak istediğiniz uygulamalarla uyumlu kullanım örnekleri isteyin.

Öğrenecek daha çok şey var gibi mi hissediyorsun? Capterra'dan bu ilgili okumalara göz atın:

  • Makine Öğrenimi Nedir? Temel İş Zekası Sözlüğünüz
  • Yapay Zeka ve Makine Öğrenimi Karşılaştırmasında Bilgili Küçük İşletme Kılavuzu
  • Küçük İşletmeler İçin En İyi Yapay Zeka Uygulamaları

Ayrıca, gerçek kullanıcılardan gelen yorumları okuyabileceğiniz ve araçları fiyat noktalarına veya özelliklerine göre filtreleyebileceğiniz Capterra'nın makine öğrenimi yazılım dizinine göz atın.