Büyük Veri Analitiğinde Makine Öğrenimi Nasıl Kullanılır?

Yayınlanan: 2022-09-30

Makine öğrenimi, kuruluşların büyük verileri kâr artırıcı içgörülere dönüştürmesini sağlar. Büyük veri ve makine öğreniminin ne kadar ilişkili olduğunu ve nasıl kullanılacağını öğrenin.

Yıllar önce, işletme sahipleri müşterilerine nasıl hizmet ettiklerini kişiselleştirmek için hafızalarına güvenmek zorundaydılar. Bayan Jones içeri girdiğinde, bir dükkan sahibi, en son ne aldığını, onu geri getirip getirmediğini ve son ziyaretinde bundan şikayet edip etmediğini hatırlamak zorunda kaldı.

Artık büyük veriler sayesinde tonlarca müşteri ve iş verisi parmaklarınızın ucunda. Bayan Jones'un nerede yaşadığını, son 10 yılda ne satın aldığını, ne kadar harcadığını, ne sıklıkta eşya iade ettiğini ve onlarca başka ölçümü biliyorsunuz. Makine öğrenimini kullanarak, bu ve diğer verileri işletmenizi güçlendiren içgörülere dönüştürebilirsiniz. İşte büyük veri ve makine öğreniminin bir dökümü ve işinizi güçlendirmek için bunlardan nasıl yararlanabileceğiniz.

Büyük veri ve makine öğrenimi nedir?

Büyük veri ve makine öğrenimi birbirinden farklıdır ancak yakından bağlantılıdır.

Büyük veri nedir?

Büyük veri, özel araçlar olmadan kullanılması imkansız olabilecek devasa veya inanılmaz derecede karmaşık veri kümelerini ifade eder. Bazı işletmeler asla büyük verilerle uğraşmak zorunda kalmaz. Örneğin, satış ve envanter verileri üreten üç lokasyonlu bir restoranınız varsa, bu "büyük veri" değildir.

Öte yandan, aynı restoran 10 konum daha eklerse ve müşterilerin çevrimiçi sipariş vermelerini, sadakat ödüllerinden yararlanmalarını ve bir müşteri hizmetleri temsilcisiyle metin yoluyla sohbet etmelerini sağlayan bir mobil uygulama eklerse, artık büyük bir veri durumunuz var. Uygulama tek başına aşağıdakilerle ilgili veriler üretebilir:

  • Müşterilerin en sık sipariş ettiği yemekler
  • Müşterilerin sipariş verdiği günün saatleri
  • Müşterilerin coğrafi konum verilerine göre yemek siparişi verdiği yerler
  • Müşterilerin yaşadığı yer ve her bir kasabayla ilişkili satın alma istatistikleri
  • Her konumdan satış verileri
  • Müşteriler ödül puanlarını nasıl kullanır?
  • Yoğun ve tatil zamanlarında satın alma verileri

Bu örnekler sadece yüzeyi çizer. Bu tür bir uygulama düzinelerce veri kümesi oluşturabilir. Ayrıca, bilgi neredeyse sürekli olarak akacaktır. Bu büyük veri.

Makine öğrenimi nedir?

Makine öğrenimi (ML), verilerdeki kalıpları tanımak için bilgisayarların kullanılması anlamına gelir. Makine öğrenimi bunu, adım adım düzenlenmiş talimat kümeleri olan algoritmaları kullanarak yapar. Bir makine öğrenimi modeli, kalıpları öğrenmek için bir algoritmadaki adımları kullanır. Bu aynı zamanda kalıpların ne zaman bozulduğunu fark etmeyi ve kalıpları birbirleriyle nasıl karşılaştıracağını öğrenmeyi de içerir.

Basit bir örnek olarak, satış verilerini analiz etmek için bir makine öğrenimi algoritması oluşturmak istediğinizi varsayalım. Beş yıllık satış rakamlarınız var. Amacınız Haziran-Ağustos ayları arasında hangi ürünleri satışa sunmanız gerektiğini belirleyerek yaz karını maksimize etmektir.

Makine öğrenimi sisteminizi şu şekilde programlayabilirsiniz:

  • Her bir ürününüz için aylık satış verilerini toplayın.
  • Haziran-Ağustos ayları arasında en yüksek satış hacmine sahip ürünleri belirleyin.
  • Her bir ürünün sunulmasıyla ilişkili satışları tahmin edin.
  • Hangi ürünleri sunacağınızı ve bunları Haziran, Temmuz, Ağustos aylarında mı yoksa üç ay boyunca mı sunacağınızı söyleyin.

Elbette, makine öğrenimini bir adım daha ileri götürebilir ve nakliye, işçilik, depolama ve diğer veriler dahil olmak üzere her ürün için satılan mal maliyetinizi (COGS) dahil edebilirsiniz. O zaman ML modeliniz sadece en yüksek yaz satış hacmine sahip ürünleri önermekle kalmaz, aynı zamanda hangilerinin en fazla net kâr getirdiğini de söyleyebilir.

Daha sonra, aşağıdakiler için satış öngörüleri sağlamak için aynı modeli kullanabilirsiniz:

  • Bir yıl boyunca bireysel ürünler
  • Benzer hedef pazarlara yönelik yeni ürünler
  • Yılın her ayında

Büyük veride makine öğrenimi nedir?

Büyük veri bağlamında, verilerde herhangi bir kalıp olabilir, bunları keşfetmek ve faydalı bilgiler sağlamak için makine öğrenimini kullanabilirsiniz. Ayrıca, algoritmaların analiz ettiği kalıplara dayalı önerilerde bulunmak için makine öğrenimini kullanabilirsiniz.

Makine öğrenimi büyük verilerle nasıl çalışır?

Makine öğreniminin en popüler uygulamalarından biri kendi kendini süren araçlardır. Araba, çevresinden ve diğer araçlardan topladığı verilerle ilgili olarak ne yapacağına karar vermek için makine öğrenimini kullanır.

Örneğin, sürücüsüz bir aracın içindeki kameralar bir dur işaretini "gördüğünde", bunu bu şekilde algılayabilir ve otomatik olarak fren uygulayabilir. Bu kararın arkasındaki süreç, büyük olasılıkla, birden fazla makine öğrenimi algoritmasını test eden bir grup veri bilimcisiyle başladı. Yüksek düzeyde, bu üç adımdan oluşur:

1. Eğitim

Büyük verileri analiz etmek için, veri bilimcileri önce bir veya daha fazla algoritmaya ne aramaları gerektiğini öğretmek için bir eğitim seti kullanır.

Örneğin, bir dur işaretiyle, eğitim seti binlerce dur işareti görüntüsü olacaktır. Veri mühendisleri, farklı açılardan, farklı ışıklandırmalarda ve hatta kısmen onları engelleyen ağaçlar veya diğer nesnelerle birlikte dur işaretlerinin görüntülerini sunar.

Eğitim aşamasının sonunda, umut, algoritmanın dur işaretlerinin şekil ve renklerindeki kalıpları tanımlamasıdır. Başka bir deyişle, bir dur işaretinin "nasıl göründüğünü" ve farklı ışık koşullarında ve çeşitli açılardan bilir.

2. Doğrulama

Doğrulama kümesi, makine öğrenimi modelinin tamamen farklı bir büyük veri kümesini ne kadar doğru kullandığını bulmak için kullanılır. Doğrulama aşamasının amacı, makine öğrenimi modelinde ince ayar yapmanın yollarını keşfetmektir.

Örneğin, dur işaretlerini tanımlamak için tasarlanan makine öğrenimi modelinin %95 doğru olduğunu ve yanlış aldığı tüm görüntülerin çok karanlık olduğunu varsayalım. Geliştiriciler daha sonra her görüntünün kontrastını artıran ve önemli özellikleri ML modelinin görmesini kolaylaştıran başka bir formül kullanabilir.

3. Test

Test aşaması, makine öğrenimi modeline, eğitim ve doğrulama aşamalarında gördüğünden tamamen farklı daha büyük veriler beslemeyi içerir.

Örneğin, dur işareti modelini test etmek için programcılar, bazıları dur işareti olan farklı türden işaretlerin 250.000 görüntüsünü ML modeline gösterebilir. Ardından, modelin dur işaretlerini ne kadar doğru bir şekilde ayırt edebildiğini görmek ve diğer işaret türlerini yanlış tanımlamaktan kaçınmak için sonuçları analiz edeceklerdi.

Makine öğrenimi ve büyük veri ile ilgili zorluklar

Büyük verileri incelemek için ML kullanan veri bilimcilerinin karşılaştığı en göz korkutucu zorluklardan ikisi, yanlışlık ve etik ikilemlerdir.

1. Yanlışlık

Doğal olarak, dahil olan gelişmiş hesaplama süreçlerinde bile, büyük veri analitiğinde makine öğrenimini her kullandığınızda bir deneme yanılma unsurundan geçeceksiniz. Bunun nedeni, modelinizi eğitirken, doğrularken ve test ederken hangi faktörlerin sonuçlarınızı çarpıtabileceğini asla bilemezsiniz.

Örneğin, dur işaretleri veya insan yüzleri gibi görüntüleri tanımlarken, ML modelinizdeki düşük performansa birden çok faktör katkıda bulunabilir. Örneğin, şirketinizin güvenlik sistemini geliştirmek için bir makine öğrenimi modeli geliştirdiğinizi varsayalım. Özellikle, yöneticilerin ve diğer üst düzey kişilerin yüzlerini tanımlayabilen ve böylece binanın hassas alanlarına erişim sağlayabilecek bir model istiyorsunuz. Doğrulama aşamasında, sistem yalnızca yaklaşık %65 oranında doğrudur. Ancak bu, aşağıdakiler gibi çeşitli değişkenlerden kaynaklanabilir:

  • Yüzlerin pikselleştirilmiş görüntüleri
  • Odak dışında kalan görüntüler
  • Yüz taraması sırasında uzağa bakan kişi
  • Güneş gözlüğü, yüz maskesi, eşarp veya tanımlama sonuçlarını çarpıtabilecek başka bir şey takmaya karar veren kişi

2. Etik ikilemler

Etik zorluklar da var. Örneğin, bir İK departmanının en nitelikli adayları belirlemek için makine öğrenimini kullandığını ve onları 1.500 özgeçmişten oluşan dijital bir yığından çıkardığını varsayalım.

Makine öğrenimi modeli, yalnızca erkekler tarafından yönetilen şirketler ve işe alım departmanları kullanılarak eğitildiyse, veriler yanlılık içerebilir. Bazı erkekler, meziyetleri veya nitelikleri dışındaki nedenlerle başka erkekleri işe almaya daha meyilli olabilir. Bu nedenle, mühendislerin ML modelini aramak için eğittikleri “başarılı” aday, çoğu durumda erkek olabilir. Sonuç olarak, model daha nitelikli olabilecek kadınlar yerine erkekleri önermektedir.

Bir iş bağlamında, büyük veri ve makine öğrenimi nasıl ilişkilidir?

İş bağlamında, makine öğrenimi, kuruluşunuzun ürettiği büyük verileri, iş açısından kritik süreçleri iyileştirmek veya otomatikleştirmek ve güvenliği ve emniyeti artırmak için kullanır. Potansiyel uygulamalar kelimenin tam anlamıyla sonsuzdur ve ürettiğiniz farklı veri türleri kadar çeşitlidir.

Örneğin, bir fabrika veya üretim tesisi, fabrika zemini için sıcaklık ve nem seviyelerini optimize etmek için makine öğrenimini kullanabilir. Örneğin, makine öğrenimi modelleri şunları çözebilir:

  • Çalışanların üretkenliğini en üst düzeye çıkarırken, almaları gereken plansız molaların sayısını en aza indiren sıcaklık ve nem seviyeleri
  • Yanlış koşullar altında daha hızlı bozulabilen hassas ekipman için ideal sıcaklık ve nem seviyeleri
  • HVAC sistemleri ve nem gidericileri çalıştırma maliyeti göz önüne alındığında, en uygun maliyetli sıcaklık ve nem koşulları

Sistem daha sonra en iyi sonuçları elde etmek için atmosferik sisteminizi otomatik olarak kontrol etmek için kullanılabilir.

Pazarlamada makine öğrenimi ve büyük veri analitiği nasıl kullanılır?

Pazarlama, makine öğrenimi ve büyük veri analitiğinin en umut verici uygulamalarından bazılarını sunar. Aşağıdaki gerçek yaşam örneğini düşünün.

Harley Davidson'dan Albert, liderliği %2,930 artırıyor

Harley Davidson, pazarlama kararları almak için makine öğrenimini kullanan Albert adında bir robot yaptı [1] . Albert, Harley Davidson'ın yöneticilerinin daha parlak bir gün batımına doğru yola çıkmasına bu şekilde yardımcı oldu.

Harley Davidson, önceki müşterilerle olan mevcut ilişkilerinden yararlanmak istedi. Albert'i analiz etmek için kullandılar:

  • İnsanlar ne sıklıkla alışveriş yaptı?
  • Bu müşteriler ne kadar harcadı
  • Müşterilerin Harley Davidson'ın web sitesine göz atmak için ne kadar zaman harcadıkları

Albert daha sonra bu verileri müşterileri farklı segmentlere ayırmak için kullandı. Pazarlama ekibi daha sonra her müşteri kategorisi için test kampanyaları oluşturdu. Ekip, kampanyanın başarısını test ettikten sonra, önceki müşterilerin geniş bir bölümünü dahil etmek için kampanyayı büyüttü.

Sonuç olarak, Harley Davidson satışlarını %40 oranında artırdı. Ayrıca %2.930 daha fazla potansiyel müşteri oluşturdular. Bu ipuçlarının yarısı doğrudan Albert'in kendisi tarafından belirlendi. Albert, ödeme yapan müşterilere dönüşme olasılığı çok yüksek olan müşteri adaylarının profillerini inceledi ve ardından diğer kullanıcıların veri profillerini inceledi ve "benzerleri" veya yüksek dönüşüm sağlayan müşterilerle çok ortak noktası olan kişileri belirledi.

İster Bayan Jones'un daha sonra ne satın alacağını bulmaya çalışıyor olun, ister karmaşık bir üretim tesisinin verimliliğini optimize ediyor olun, makine öğrenimi rastgele görünen büyük verileri dönüşümsel içgörülere dönüştürebilir. Biraz beyin fırtınası ve yaratıcı düşünceyle, rekabeti geride bırakmak ve kuruluşunuzu bir sonraki seviyeye taşımak için makine öğrenimi ve büyük verileri kullanmanın yollarını bulabilirsiniz.

Büyük verilerle ilgili yardımcı olabilecek araçlar hakkında daha fazla bilgi edinmek ister misiniz?

Büyük veri yazılımı, işletmenizin büyük veri ve analitiklerinden en iyi şekilde yararlanmasını sağlamaya yardımcı olabilir. En iyi araçlardan bazılarına göz atın ve karşılaştırın, incelemeleri okuyun ve özel işletme ihtiyaçlarınız için en iyi çözümü bulun.


Kaynaklar

1. Harley Davidson NYC, Albert, Albert.ai ile tüm zamanların rekorunu kırdı