Makine Öğrenimi Nedir? Temel İş Zekası Sözlüğünüz
Yayınlanan: 2022-05-07Bahar temizliğini hep çok geç, çok az görmüşümdür. Benim için Ocak, sipariş verdiğiniz, öncelik verdiğiniz ve gelecek yılın sorularını yanıtlamaya başladığınız zamandır. Bu nedenle, bir süredir aklınıza gelebilecek bir soruyu yanıtlamak için Ocak ayını seçtim: Makine öğrenimi nedir?
Buna cevap vereceğim ve ayrıca 2017'nin zirvesinde kalmak için bilmeniz gereken bazı diğer terimleri tanımlayacağım. İş zekası yazılımının sizin için neler yapabileceğiyle ilgileniyorsanız, önce bu temel terimleri bilmeniz gerekir. .
Gartner'ın 2017 için En İyi On Stratejik Teknoloji Trendinden biri olduğu için makine öğrenimini ilk sıraya koydum , ancak girişlerin geri kalanı alfabetik olarak düzenlenmiştir.
Makine öğrenme
Makine öğreniminden önce bilgisayarlara nasıl düşüneceklerinin söylenmesi (programlanması) gerekiyordu. Makine öğrenimi ile bilgisayarlar (bir çeşit) kendileri için düşünebilir.
Kısa bir süre önce BI yazılım şirketi AnswerRocket'te Makine Öğrenimi Başkanı Michael Finley ile konuştum ve bu da ayrıntılandırmaya yardımcı oldu. Makine öğreniminden önce, çoğu yazılım "programlandığı şekilde çalışıyordu: insanlar talimatları bilgisayar koduna dönüştürdü ve bilgisayar bu kodun yapmasını söylediği şeyi yaptı." Çok basit bir örnek bir hesap makinesi olabilir: hesap makinesi numaralarını verdiniz, ona ne yapacağını söylediniz (toplama, çıkarma) ve hesap makinesi size sonuçları verdi. Ancak makine öğrenimi ile yazılım uyum sağlayabilir. Finley şöyle devam ediyor: "Makine öğrenimli yazılım, onu kurduğunuz gün, çalıştırdığınız onuncu veya yüzüncü gün yaptığı işi yapmıyor." Bilgisayara beslenen değerler değişirse, yazılım bu değerlere uyum sağlayacaktır. Makine öğrenimine sahip bir bilgisayar, bunları nasıl dahil edeceğini öğrenir.
Finley, makine öğrenimini "beğenme" kavramıyla nasıl başa çıkacağını bilen bir yazılım olarak nitelendiriyor: "Son duyduğum gibi bir şarkı duymak istiyorum." Konsept insanlar için kolaydır, ancak bilgisayarlar için zordur. Finley, bilgisayarların hangi sayıların daha büyük veya daha küçük olduğunu anlamada ve sayıları ve isimleri eşleştirmede iyi olduğunu, ancak benzerlik fikriyle mücadele ettiklerini açıkladı. Makine öğrenimi, bilgisayarların neden bir şeyin diğerine "benzer" olduğunu anlamasına yardımcı olur. Makine öğreniminin benzerliği kavraması, özellikle müşteri isteklerini tahmin etmede yardımcı olur.
Pandora'da duyduğunuz bir sonraki şarkının veya Netflix'in önerdiği filmin arkasında makine öğrenimi var. Pandora ve Netflix'in makine öğrenimi algoritmaları, seçimlerinizi (ve Pandora'nın durumunda gerçek "beğenmelerinizi") "besler" ve bunu, hangi benzer şarkılardan veya şovlardan hoşlanabileceğinizi tahmin etmek için kullanır.
Bu makine öğrenimi algoritmalarını farklı verilerle beslerseniz, farklı tepki verirler. Her zamanki korku filmleri diyetiniz aniden ve açıklanamaz bir şekilde romantik bir komedi içeriyorsa, Netflix'in ML algoritmaları bu verilere tepki verir ve diğer romantik komedileri veya korku romantizmini önermeye başlar.
Filmlerde azalan beğeni bir yana, makine öğrenimi KOBİ'ler için neden önemli? Daha büyük rakiplerle rekabet etmelerine yardımcı olabilir. Makine öğrenimine sahip BI yazılımı, her yenilediğinizde yeni sayılar alır. Stratejinizi yıllık rapor rakamlarına dayandırmıyorsunuz, neredeyse gerçek zamanlı bilgilere ve bu değişen verilere nasıl uyum sağlayacağını bilen algoritmalara dayanıyorsunuz. Finley, bir işletmenin yaptıkları her şeyi ölçeklendirmesinin geleneksel, homojen yolunun ML ile devrim yaratabileceğini açıklıyor:
“En iyi uygulamaları ortaya koymuş olabilirim ve süreçleri tekrarlamak isteyebilirim. Peki ya her gün en iyi uygulamaları ortaya koyabilseydiniz, bunları değiştirmek ve stratejinizi her gün yeniden formüle etmek için bilginiz olsaydı? Stratejiyi her gün yeniden yazabilen ML sayesinde verileriniz var ve KOBİ'ler gerçekten de daha büyük adamların öğle yemeğini bu şekilde yiyor.”
Çevik iş stratejisiyle ilgilenen KOBİ'ler için makine öğrenimi hayatta kalmanın bir yolundan daha fazlası olabilir. Yerleşik oyuncuların pazar paylarından pay almaya başlamanın bir yolu olabilir.
- Ad hoc analitik
- Özel sorgu
- Gelişmiş Analitik
- Yapay zeka
- Büyük veri
- Bağlamsal Veriler
- Veri noktası
- Veri kalitesi
- Veri goruntuleme
- Veri deposu
- Veri tabanı
- Panolar
- Derinlemesine
- ETL
- meta veri
- Metrikler
- Modern BI
- geleneksel iş zekası
- SaaS/Bulut Yazılımı
- dilim ve zar
- SQL
- Bilmek istediğiniz terimler…
Ad hoc analitik
Ad hoc analitik, ihtiyaç duyduğunuzda, BT ve uzman olmayanların anlayabileceği bir düzeyde analizdir.
Erişilebilir iş zekası, istenecek bariz bir şey gibi görünüyorsa, her zaman ulaşılabilir değildi. İş zekası programlarını sorgulamak için uzun bir süre BI profesyonellerinin “bilgisayar konuşabilmesi” (yani bir kodlama dilinde yazabilmesi) gerekiyordu. SQL, R veya Python'da nasıl kod yazılacağını bilmiyor muydunuz? BT'deki birine sorun. Sonra bekle. Ardından iş zekası programlarının çalışmasını bekleyin ve ardından analiz için biraz daha bekleyin.
Neyse ki, BI sonunda geçici analitik için olgunlaştı. : Bu sistemle, gerekli verileri elde etmek için BT'yi veya geleneksel raporların daha yavaş üretilmesini beklemenize gerek yok. Sizin ve onların işini daha kolay ve daha az stresli hale getirir.
BT personeliniz yoksa, geçici analitik bu sorunu çözer. Ad hoc analitik ayrıca daha hızlı bir içgörü süresi sağlar (bu, görebileceğiniz başka bir moda kelimedir; bu, ihtiyacınız olan bilgiyi almanın daha kısa zaman aldığı anlamına gelir).
Özel sorgu
"Sorgular", iş zekası yazılımınızdan yanıtlamasını isteyebileceğiniz sorulardır. Örneğin, BI yazılımınızdan 1970'den beri doğan tüm kahverengi gözlü müşterilerin alfabetik bir listesini isteyebilirsiniz. Bir sorguyu kolayca soru olarak adlandırabilirsiniz, ancak konuşmada ne sıklıkla "sorgu" diyebilirsiniz?
Geçici bir sorgu, ihtiyacınız olduğunda isteyebileceğiniz bir sorgudur. Daha eski iş analizlerinde olduğu gibi, daha eski sorguların BT'den birine sorması gerekiyordu. Sorgular ayrıca, aylık veya yıllık olarak alacağınız düzenli raporların bir parçası olarak yer alma eğilimindeydi. Daha eski BI yazılımıyla, bu sorguyu bir programlama dilinde sormanız gerekir. SQL, iş zekasında uzun zamandır bir standarttı; bu günlerde R ve Python popüler olanlardır.
BI dahil bilgisayar programlarına, DOJ'den HHS'ye kadar bir bürokrasinin şubeleri olarak bakabilirsiniz. Teknik olarak bir şeyleri başarmak için oradalar, ancak her birinin kendi dili var ve kendine özgü bir şekilde çalışıyor. Bir programcı, dili konuşan ve her programda/bölümde nasıl gezineceğini bilen bir bürokrat gibidir.
Gelişmiş Analitik
Bu terim aslında iş zekasının ötesine geçiyor. “İş zekası” geleneksel olarak ne olup bittiğini analiz etmekle ilgilenir. İster gelecekte ne olacağını tahmin etmek, isterse iş zekası ile genellikle ilişkili olmayan ayrıntıları ve faktörleri analiz etmek olsun, gelişmiş analitik daha da ileri gider. Bazı gelişmiş analitik örnekleri, veri ve metin madenciliği , tahmine dayalı analitik , tahmin , konum analizi , duygu analizi ve makine öğrenimidir.
Yapay zeka
Makine öğrenimi, AI'nın bir parçasıdır, ancak AI çok daha büyük bir kavramdır. AI, " makineler tarafından sergilenen zeka " diyebileceğiniz her şeyi içerir . Yapay zeka anlamında "zeka", bir şeyi yapma yeteneği anlamına gelir. Dolayısıyla, "zeka"nın sadece çok şey bilmek olduğu şeklindeki yaygın anlayış, yapay zekada bulunan türden bir zeka değildir.
AI'nın yapabileceği "bir şeyler" zaten çeşitlidir. Örneğin, Daisy Intelligence , perakendecilerin verilerini incelemek için AI kullanır ve ardından "satışları %5 veya daha fazla artırabileceğini" iddia ettikleri önerilerde bulunur. Benim gibi, planlama yapmaktan DMV'de beklemek kadar hoşlanıyorsanız, Amy gibi katılımcıların tercihlerine göre toplantılar planlayabilen sanal bir asistan, en iyi yeni hayali arkadaşınız olabilir.
Büyük veri
Büyük veri, son derece büyük veri kümeleridir. Normalde “ cehenneme giden yol zarflarla döşenmiştir ” konusunda Stephen King ile aynı fikirde olsam da , “son derece” garantilidir. Az miktarda veri, örneğin kısa bir kitap olacaktır. İlk Harry Potter kitabının PDF'si yaklaşık bir megabayttır (MB).
Büyük Veri, bir petabayt veri gibi bir şey olurdu. Kitap örneğine devam edecek olursak, kayıtlı tarihin başlangıcından beri yazılan her şey 50 petabayttır . Google gibi mega şirketler petabaytlarla uğraşan türden. Google'ın reklam trafiğini izleyen Google'ın Mesa sistemi , petabaytlarca veriyi izler.
bağlamsal veriler
Bağlamsal veriler, bir kişi, yer veya olay hakkında ek verilerdir (veri konuşmasında "varlıklar" olarak adlandırılır). Bağlamsal veriler, bir işletmenin potansiyel bir müşteri hakkında bildiklerini tamamlamaya ve hatta ne isteyebileceklerini tahmin etmeye yardımcı olur.
Bu bir işletme olmasa da, İngiltere'deki Manchester Üniversitesi, " başarınızın ve potansiyelinizin tam ve kapsamlı bir görünümünü oluşturmak için" kabul sürecinde bağlamsal verileri kullanır . Öğrencinin kabul formunun yanı sıra UM, adayın posta kodu, sınavlara girdiğiniz okulun kalitesi ve “ üç aydan daha uzun süredir bakılıp bakılmadığı” gibi faktörleri de dikkate alır.
Bir işletme için bağlamsal veriler satışlara yardımcı olabilir. Çok geniş bir örnek vermek gerekirse, geçmişteki bir müşteriyle ilgili, bulundukları yerin hava durumuna dayalı bağlamsal veriler geliri artırabilir. Arizona, Tuscon'daki bir müşterinin Ekim ayında buzlu şeker satın alması, International Falls, Minnesota'daki bir müşteriye göre daha olasıdır .
Veri noktası
Bir veri noktası, tek bir veri kırıntısıdır. Veri noktası, izlediğiniz veriler arasında bağımsız herhangi bir birim veya veridir. Tek bir veri noktası, " bir yatırımın boyutundan " Google'da satın aldığınız bir reklama yapılan tek tıklamaya kadar her şey olabilir. Uber söz konusu olduğunda, konum önemli bir veri noktasıdır - o kadar önemlidir ki , yolculuğunuz bittikten sonra onu takip ederler .
Temel performans göstergelerine aşinaysanız, veri noktalarına da aşinasınızdır . KPI'lar, gelir veya bir projeyi tamamlamak için gereken süre gibi belirli türdeki veri noktalarını ölçer.
Veri kalitesi
Veri kalitesi, verilerinizin kullanışlılığının ölçüsüdür. Yüksek kaliteli veriler temiz, düzenli ve kullanılabilir. Bir kütüphanenin verisi onun kitaplarıysa, yüksek kaliteli veriye sahip bir kütüphane, nüfusun istediği ve ihtiyaç duyduğu kitapları iyi durumda, doğru yerlerde raflara yerleştirir.
Veri kalitesinin altı boyutu vardır:
- eksiksizlik
- benzersizlik
- Geçerlilik
- zamanlılık
- Tutarlılık
- Kesinlik
Veri goruntuleme
Veri görselleştirme, verilerinizi görüntüleyen herhangi bir resim, görsel veya grafiktir. Pasta grafikler ve çubuk grafikler en yaygın türler olacaktır. Yine de, çok daha geniş bir görselleştirme yelpazesi var. Gartner'ın 2016 için İş Zekası ve Analitik Platformları için Değerlendirme Kriterleri (ödeme duvarı korumalı; buna değer), daha gelişmiş grafik türlerini BI çözümünüzde aranacak "tercih edilen" öğeler olarak derecelendirir. Aranacak yüksek kaliteli, tercih edilen grafik türlerinden bazıları şunlardır:
- Marimekko çizelgeleri
- X/Y Grafikleri
- Ağ Grafikleri
- Pareto Diyagramları
- kelime bulutları
Veri deposu
Veri ambarı, çeşitli veri tabanlarından ve işlem sistemlerinden gelen verilerin tutulduğu ve düzenlendiği bilgisayar sistemidir. Bir veri ambarına ihtiyaç duymak için büyük, kurumsal boyutta bir veriye ihtiyacınız olacağından, terimi genellikle ön tarafta bir "kurumsal" ile göreceksiniz.
Veri tabanı
Veritabanı, ihtiyacınız olanı kolayca alabilmeniz için düzenlenmiş verilerdir. Hiç IMDB'ye gittin mi? Elbette var. Bu bir veri tabanıdır: filmler, aktörler, yönetmenler, yapımcılar, hepsi kolay arama için organize edilmiştir, örneğin altı derecelik bir Kevin Bacon oyununda hile yapmanız gerektiğinde olduğu gibi .
Panolar
Bu resim, bu açıklamadan önce, çünkü bir gösterge panosunun neye benzediğini göstermek daha kolay.
Resmi bir tanım için: gösterge tablosu, izlediğiniz verilerin görsel bir temsilidir. BI programınızın kesinlikle bir gösterge panosuna sahip olması gerekir. Gösterge paneli olmayan bir araba satın almazsınız. Aynı şey BI yazılımı için de geçerlidir.
BI yazılımı için alışveriş yaparken, programınızın gösterge tablolarının Gartner tarafından önerilen şu iki temel kritere sahip olduğundan emin olun (ödeme duvarı korumalı; buna değer):
- “Üçüncü taraf seçenekleri, kodlama veya komut dosyası gerektirmeden tablolar, çubuk grafikler, çizgi grafikler, alan grafikleri ve pasta grafikleri dahil olmak üzere en azından temel grafik türleriyle gösterge panoları tasarlama yeteneği.”
- "Gördüğünüz şey, elde ettiğiniz şeydir (WYSIWYG) tasarımı", bir pano tasarlama ve kodlamayı bilmeden verileri analiz etme yeteneği.
Derinlemesine
Detaya inme, yıllık satış rakamları gibi genel bir bilgi alma ve aya, haftaya ve hatta güne göre detaya inme yeteneğini ifade eder. "Ayrıntıya gitmek", bilgi ve içgörü arasında genellikle fark yaratan genelden ayrıntılara daraltabileceğiniz anlamına gelir. Detaya inmek, o eski "on gücün gücü" filminin iş zekası versiyonuna benziyor.
ETL
ETL (veya ayıklama, dönüştürme, yükleme) veri toplama ve bu verileri veri ambarına yerleştirme arasında gerçekleşir.
“Çıkarma” ihtiyacı , verilerin veri ambarına ulaşmadan önce veritabanlarında veya ERP yazılımlarında toplanması gerçeğinden kaynaklanmaktadır . Dönüştürme ihtiyacı, bu çoklu veri kaynaklarının genellikle farklı formatlarda olması ve veri ambarında saklanmak ve aranmak için uygun formata dönüştürülmeleri gerektiği gerçeğinden kaynaklanmaktadır. Yükleme ihtiyacı kendini açıklayıcıdır; bir veri kaynağını başka bir veri kaynağıyla arayıp karşılaştırmadan önce veri ambarına koymalısınız.
meta veri
Meta veriler, veriler hakkındaki verilerdir. Kulağa hoş geliyorsa, meta, bu… bu meta veri !
Ama ciddice.
Meta veriler, verileriniz hakkındaki bilgilerdir. Üç kategori vardır:
- Teknik: Modelleri, formatı ve ölçüleri gibi verileriniz hakkındaki teknik ayrıntılar.
- İş: verilerin kullanıcı dostu terimlerle tanımları (yani, sade İngilizce)
- Süreç: Hangi veri parçalarıyla ne zaman ve ne yapıldığını söyleyen veri.
Metrikler
"Metrik", ölçtüğünüz her şey için süslü bir kelimedir.
Net karınızı takip ediyor musunuz? Bu bir ölçü. Şirketinizde BI yazılımını kaç kişinin kullandığını takip ediyor musunuz? Bu da bir ölçü. Bu konuşma oranına göz kulak oluyor musun? Bu da bir ölçü. Metriklerin püf noktası, şirketiniz için en iyi olanları seçmektir. Her şirketin farklı ihtiyaçları vardır ve metrikleri seçerken ihtiyaçlarınızı ve önceliklerinizi göz önünde bulundurmak iyi bir fikirdir .
Modern BI
Modern iş zekası terimi , onu şu şekilde tanımlayan Gartner'dan gelmektedir :
Modern bir BI platformu, BT destekli analitik içerik geliştirmeyi destekler. Teknik bilgisi olmayan kullanıcıların veri erişimi, alım ve hazırlıktan etkileşimli analize ve içgörülerin işbirlikçi paylaşımına kadar tam spektrumlu analitik iş akışlarını özerk bir şekilde yürütmesini sağlayan bağımsız bir mimari ile tanımlanır.
Basitçe söylemek gerekirse, modern BI iş kullanıcısını ilk sıraya koyar. Modern bir BI programını kullanmak için BT'den birine bağımlı olmanıza gerek kalmayacak veya onlara çok daha az bağımlı olmanız gerekecek. Geleneksel, eski BI programlarının yalnızca BT çalışanlarının içerik yazmasına izin verecek şekilde kurulduğu yerlerde, örneğin modern BI programları, iş kullanıcılarının kendi başlarına içerik oluşturmasını kolaylaştırır.
geleneksel iş zekası
Geleneksel iş zekası programları ağırlıklı olarak BT personeline dayanır. Genellikle kullanıcıların SQL (bir programlama dili, aşağıya bakın) bilmesini gerektirir ve bu dilde birden çok sorguyu manuel olarak girmeniz gerektiğinden yanıtları almak çok daha uzun sürer. Bu nedenle, çok daha az çeviktirler ve Gartner'dakiler gibi uzmanlar , alıcıların bunun yerine modern BI programlarında bulunan özellikleri aramasını önerir .
SaaS/Bulut yazılımı
Hizmet olarak yazılım, alıcıların yazılımı satın alıp kurmak yerine kullanmak için lisans satın aldığı bir modeldir. Çoğu SaaS yazılımı internet üzerinden (yani bulutta) yapılır, bu da satın alma ve yüklemenin ön maliyetlerini azaltır. Ayrıca, yazılımın tutulduğu sunucuları izleme ihtiyacını da ortadan kaldırır; SaaS şirketi, olası kesintileri takip eder.
dilim ve zar
Verilere farklı perspektiflerden bakmak veya belirli parçalara daha ayrıntılı bakmak için büyük veri kümelerini dilimleme ve dilimleme. Dilimleme ve zar yetenekleri, örneğin verileri haftaya, sonra aya ve ardından tek bir güne göre kontrol etmenize olanak tanıyan şeydir. Bir rapor beklemek yerine, dilimle ve zar, inisiyatif almanızı ve ihtiyacınız olduğunda belirli verileri kontrol etmenizi sağlar.
SQL
“Sequel” olarak telaffuz edilen SQL, veritabanlarından bilgi almak için kullanılan yaygın bir programlama dilidir. İngilizce konuşuyorsanız, veritabanı SQL konuşur ve yalnızca bu şekilde ifade edilen soruları nasıl yanıtlayacağını bilir. Tabii ki, iş zekası yazılımınızda doğal dil sorgusu (NLQ) yoksa, tıpkı bir arama motorunda olduğu gibi soru sormanıza olanak tanır.
Bilmek istediğiniz terimler…
Veya bu listenin okuyucularına fayda sağlayacağını düşündüğünüzü? Aşağıdaki yorumlarda onları bana bildirin. İdeal olarak, yorumlar bölümü, insanların tanımları talep edebileceği ve benim de onları sağlayacağım başka bir yer olabilir.
Bu terimlerin size nasıl daha iyi yardımcı olabileceğini öğrenmek istiyorsanız, Capterra'nın iş zekası yazılım dizinindeki seçeneklerden birine göz atın ve bir satıcıyla iletişime geçin.