Co to jest uczenie maszynowe? Twój podstawowy glosariusz analizy biznesowej

Opublikowany: 2022-05-07

Wiosenne porządki zawsze uważałam za zbyt małe, za późno. Dla mnie styczeń to czas, kiedy zamawiasz, ustalasz priorytety i zaczynasz odpowiadać na pytania w nadchodzącym roku. Dlatego wybrałem styczeń, aby odpowiedzieć na pytanie, które mogłeś mieć od jakiegoś czasu: co to jest uczenie maszynowe?

Odpowiem na to, a także zdefiniuję kilka innych terminów, które musisz znać, aby być na bieżąco z 2017 r. Jeśli interesuje Cię, co oprogramowanie do analizy biznesowej może dla Ciebie zrobić, najpierw musisz znać te podstawowe terminy .

Na pierwszym miejscu postawiłem uczenie maszynowe, ponieważ jest to jeden z dziesięciu najważniejszych strategicznych trendów technologicznych firmy Gartner na rok 2017 , ale pozostałe wpisy są ułożone alfabetycznie.

Nauczanie maszynowe

Przed uczeniem maszynowym komputerom trzeba było powiedzieć (zaprogramować), jak mają myśleć. Dzięki uczeniu maszynowemu komputery mogą myśleć (w pewnym sensie) same.

Niedawno rozmawiałem z Michaelem Finleyem, szefem uczenia maszynowego w firmie AnswerRocket zajmującej się oprogramowaniem BI , który pomógł opracować. Przed uczeniem maszynowym większość oprogramowania „działała tak, jak została zaprogramowana: ludzie przekształcali instrukcje w kod komputerowy, a komputer robił to, co kazał mu ten kod”. Bardzo prostym przykładem może być kalkulator: wprowadziłeś liczby do kalkulatora, powiedziałeś mu, co ma robić (dodawać, odejmować), a kalkulator podawał wyniki. Jednak dzięki uczeniu maszynowemu oprogramowanie może się dostosować. Finley kontynuuje: „Oprogramowanie z uczeniem maszynowym nie robi tego samego w dniu, w którym je instalujesz, co dziesiątego lub setnego dnia, w którym je uruchamiasz”. Jeśli wartości wprowadzane do komputera ulegną zmianie, oprogramowanie dostosuje się do tych wartości. Komputer z uczeniem maszynowym uczy się, jak je wykorzystywać.

Dzięki uprzejmości niesamowitych komiksów Andre Pinto i Anthill

Finley charakteryzuje uczenie maszynowe jako oprogramowanie, które wie, jak radzić sobie z koncepcją „polubienia”, na przykład: „Chcę usłyszeć piosenkę taką jak ostatnia, którą właśnie słyszałem”. Koncepcja jest łatwa dla ludzi, ale jest trudna dla komputerów. Finley wyjaśnił, że komputery są dobre w zrozumieniu, które liczby są większe, a które mniejsze, oraz w dopasowywaniu liczb i nazw, ale zmagają się z ideą podobieństwa. Uczenie maszynowe pomaga komputerom zrozumieć, dlaczego jedna rzecz jest „podobna” do innej. Pojmowanie podobieństwa przez uczenie maszynowe jest szczególnie pomocne w przewidywaniu pragnień klientów.

Uczenie maszynowe stoi za kolejną piosenką, którą usłyszysz na Pandorze, lub filmem, który sugeruje Netflix. Algorytmy uczenia maszynowego Pandory i Netflix są „karmione” twoimi wyborami (i rzeczywistymi „polubieniami” w przypadku Pandory) i wykorzystują je do przewidywania, jakie podobne piosenki lub programy mogą ci się spodobać.

Podaj tym algorytmom uczenia maszynowego różne dane, a zareagują inaczej. Jeśli Twoja zwykła dieta horrorów nagle i w niewytłumaczalny sposób zawiera komedię romantyczną, algorytmy ML Netflix zareagują na te dane i zaczną sugerować inne komedie romantyczne lub horrory.

Pomijając gust filmowy, dlaczego uczenie maszynowe ma znaczenie dla małych i średnich firm? Może im pomóc konkurować z większymi konkurentami. Oprogramowanie BI z uczeniem maszynowym zyskuje nowe liczby przy każdym odświeżeniu. Nie opierasz strategii na liczbach rocznych raportów, opierasz ją na informacjach niemal w czasie rzeczywistym i algorytmach, które wiedzą, jak dostosować się do zmieniających się danych. Finley wyjaśnia, że ​​tradycyjny, jednorodny sposób, w jaki biznes skaluje wszystko, co robi, może zostać zrewolucjonizowany dzięki ML:

„Mogłem przedstawić najlepsze praktyki i chcieć powtórzyć procesy. Ale co by było, gdybyś mógł codziennie przedstawiać najlepsze praktyki, gdybyś miał informacje, które pozwolą je zmienić i przeformułować swoją strategię każdego dnia? Dzięki ML masz dane, które mogą codziennie przerabiać strategię, i tak właśnie małe i średnie firmy jedzą obiad dla większych facetów”.

Dla małych i średnich firm zainteresowanych zwinną strategią biznesową uczenie maszynowe może być czymś więcej niż sposobem na przetrwanie. Może to być sposób na rozpoczęcie przejmowania części udziałów rynkowych uznanych graczy.

  • Analizy ad hoc
  • Zapytanie ad hoc
  • Zaawansowana analiza
  • Sztuczna inteligencja
  • Big Data
  • Dane kontekstowe
  • Punkt danych
  • Jakość danych
  • Wizualizacja danych
  • Hurtownia danych
  • Baza danych
  • Pulpity nawigacyjne
  • Drążyć
  • ETL
  • Metadane
  • Metryka
  • Nowoczesne BI
  • Tradycyjne BI
  • Oprogramowanie SaaS/chmury
  • Plasterek i kości
  • SQL
  • Terminy, które chcesz poznać…

Analizy ad hoc

Analityka ad hoc to analiza, kiedy jej potrzebujesz, na poziomie zrozumiałym dla nie-informatyka, nie-specjalisty.

Jeśli dostępna analiza biznesowa wydaje się czymś oczywistym, nie zawsze była osiągalna. Przez długi czas specjaliści BI musieli umieć „mówić komputerowo” (tj. pisać w języku kodowania) w celu wysyłania zapytań do programów analizy biznesowej. Nie wiesz, jak kodować w SQL, R lub Pythonie? Zapytaj kogoś z działu IT, kto to robi. Wtedy poczekaj. A potem poczekaj, aż zaczną działać programy do analizy biznesowej, a potem jeszcze trochę poczekaj na analizę.

Na szczęście BI w końcu dojrzało do analizy ad hoc. : Dzięki temu systemowi nie musisz czekać na dział IT ani wolniejsze tworzenie tradycyjnych raportów, aby uzyskać potrzebne dane. Sprawia, że ​​Twoja praca i ich praca jest łatwiejsza i mniej stresująca.

Jeśli nie masz personelu IT, analizy ad hoc rozwiążą ten problem. Analityka ad hoc zapewnia również krótszy czas do uzyskania wglądu (jest to kolejne modne hasło, które możesz zobaczyć; oznacza to, że uzyskanie potrzebnych informacji zajmuje mniej czasu).

Zapytanie ad hoc

„Zapytania” to pytania, na które możesz poprosić oprogramowanie do analizy biznesowej. Na przykład, możesz poprosić oprogramowanie BI o alfabetyczną listę wszystkich brązowookich klientów urodzonych od 1970 roku. Równie łatwo możesz nazwać zapytanie pytaniem, ale jak często możesz powiedzieć „zapytanie” w rozmowie?

Zapytanie ad hoc to takie, o które możesz poprosić, gdy go potrzebujesz. Podobnie jak w przypadku starszych analiz biznesowych, starsze zapytania wymagały, aby ktoś z działu IT je zadał. Zapytania również miały miejsce w ramach regularnych raportów, które otrzymywałeś co miesiąc lub co rok. W przypadku starszego oprogramowania BI, musiałbyś zadać to zapytanie w języku programowania. SQL był od dawna standardem w analizie biznesowej; obecnie popularne są R i Python.

Możesz spojrzeć na programy komputerowe, w tym BI, jako gałęzie biurokracji, od DOJ do HHS. Technicznie są po to, by coś osiągnąć, ale każdy z nich ma swój własny język i działa na swój własny sposób. Programista jest jak biurokrata, który mówi językiem i wie, jak poruszać się po każdym programie/działu.

Zaawansowana analiza

Termin ten w rzeczywistości wykracza poza wywiad biznesowy. „Business intelligence” tradycyjnie zajmowała się analizowaniem tego, co się wydarzyło. Zaawansowana analityka idzie dalej, niezależnie od tego, czy chodzi o prognozowanie tego, co wydarzy się w przyszłości, czy analizowanie szczegółów i czynników zwykle niezwiązanych z analizą biznesową. Niektóre przykłady zaawansowanej analityki to eksploracja danych i tekstu , analityka predykcyjna , prognozowanie , analityka lokalizacji , analiza sentymentu i uczenie maszynowe.

Sztuczna inteligencja

Uczenie maszynowe jest jedną z części sztucznej inteligencji, ale sztuczna inteligencja to znacznie większa koncepcja. Sztuczna inteligencja obejmuje wszystko, co można nazwać „ inteligencją eksponowaną przez maszyny ”. „Inteligencja” w sensie AI oznacza zdolność do zrobienia czegoś. Tak więc powszechne rozumienie „inteligencji” jako po prostu dużej wiedzy nie jest rodzajem inteligencji, którą można znaleźć w sztucznej inteligencji.

„Coś”, co AI może zrobić, jest już różne. Na przykład Daisy Intelligence wykorzystuje sztuczną inteligencję do badania danych sprzedawców, a następnie wydaje rekomendacje, które według nich mogą „zwiększyć sprzedaż o 5% lub więcej”. Jeśli, tak jak ja, lubisz planowanie tak samo jak czekanie w DMV, wirtualna asystentka, taka jak Amy , która może planować spotkania na podstawie preferencji uczestników, może być Twoim najlepszym nowym wyimaginowanym przyjacielem.

Big Data

Big data to niezwykle duże zbiory danych. Chociaż zwykle zgadzam się ze Stephenem Kingiem, że „ droga do piekła jest wybrukowana przysłówkami ”, to „niezwykle” jest to uzasadnione. Niewielka ilość danych byłaby, powiedzmy, krótką książką. PDF pierwszej książki o Harrym Potterze zajmuje około jednego megabajta (MB).

Big Data to coś w rodzaju petabajta danych. Kontynuując przykład książkowy, wszystko napisane od początku spisanej historii ma 50 petabajtów . Megakorporacje, takie jak Google, zajmują się petabajtami. System Mesa firmy Google , który monitoruje ruch reklamowy Google, śledzi petabajty danych.

Dane kontekstowe

Dane kontekstowe to dodatkowe dane o osobie, miejscu lub wydarzeniu (które w mowie danych nazywane są „podmiotami”). Dane kontekstowe pomagają uzupełnić, co firma wie o potencjalnym kliencie, a nawet przewidzieć, czego może chcieć.

Chociaż nie jest to biznes, Uniwersytet w Manchesterze w Anglii wykorzystuje dane kontekstowe w procesie rekrutacji, aby „ zbudować pełny i zaokrąglony obraz Twoich osiągnięć i potencjału ”. Wraz z formularzem przyjęcia ucznia, UM bierze pod uwagę takie czynniki, jak kod pocztowy kandydata, jakość szkoły, w której zdałeś egzaminy oraz „ czy byłeś pod opieką lub pod opieką przez ponad trzy miesiące”.

W przypadku firmy dane kontekstowe mogą pomóc w sprzedaży. W bardzo szerokim przykładzie, dane kontekstowe dotyczące poprzedniego klienta, oparte na pogodzie w ich lokalizacji, mogą zwiększyć przychody. Klient z Tuscon w Arizonie chętniej kupi popsicles w październiku niż klient z International Falls w Minnesocie .

Punkt danych

Punkt danych to pojedynczy skrawek danych. Punkt danych to dowolna samodzielna jednostka lub punkt odniesienia wśród śledzonych danych. Pojedynczym punktem danych może być wszystko, od „ wielkości inwestycji ” do pojedynczego kliknięcia reklamy kupionej w Google. W przypadku Ubera lokalizacja jest ważnym punktem danych – tak ważnym, że faktycznie śledzi go po zakończeniu jazdy .

Jeśli znasz kluczowe wskaźniki wydajności , znasz punkty danych. KPI mierzą określone typy punktów danych, takie jak przychody lub czas potrzebny na ukończenie projektu.

Jakość danych

Jakość danych jest miarą użyteczności Twoich danych. Dane wysokiej jakości są czyste, uporządkowane i dostępne. Jeśli danymi biblioteki są jej książki, biblioteka z danymi wysokiej jakości miałaby książki, których populacja chce i potrzebuje, w dobrym stanie, na odpowiednich miejscach.

Istnieje sześć wymiarów jakości danych:

  • Kompletność
  • Wyjątkowość
  • Ważność
  • Aktualność
  • Spójność
  • Precyzja

Wizualizacja danych

Wizualizacja danych to dowolny obraz, wizualizacja lub grafika przedstawiająca Twoje dane. Najczęściej spotykanymi rodzajami są wykresy kołowe i wykresy słupkowe. Istnieje jednak znacznie szerszy zakres wizualizacji. Kryteria oceny Gartnera dla platform Business Intelligence i Analytics na rok 2016 (ochrona płatna; warto) ocenia bardziej zaawansowane typy wykresów jako „preferowane” elementy, których należy szukać w rozwiązaniu BI. Niektóre z tych preferowanych typów wykresów o wyższej jakości to:

  • Wykresy Marimekko
  • Wykresy X/Y
  • Wykresy sieciowe
  • Diagramy Pareto
  • Chmury słów

Hurtownia danych

Hurtownia danych to system informatyczny, w którym przechowywane i organizowane są dane z różnych baz danych i systemów transakcyjnych. Termin ten często pojawia się z napisem „przedsiębiorstwo”, ponieważ do hurtowni danych potrzebna jest duża ilość danych o wielkości przedsiębiorstwa.

Baza danych

Baza danych to dane uporządkowane, dzięki czemu możesz łatwo uzyskać to, czego potrzebujesz. Byłeś kiedyś na IMDB ? Oczywiście, że masz. To baza danych: filmy, aktorzy, reżyserzy, producenci, wszystko zorganizowane w celu łatwego wyszukiwania, na przykład, gdy trzeba oszukiwać w grze o sześć stopni Kevina Bacona .

Pulpity nawigacyjne

To zdjęcie znajduje się przed tym wyjaśnieniem, ponieważ łatwiej jest pokazać, jak wygląda pulpit nawigacyjny.

W przypadku formalnej definicji: pulpit nawigacyjny to wizualna reprezentacja śledzonych danych. Twój program BI bezwzględnie musi mieć pulpit nawigacyjny. Nie kupiłbyś samochodu bez deski rozdzielczej. To samo dotyczy oprogramowania BI.

Kiedy kupujesz oprogramowanie BI, upewnij się, że pulpity nawigacyjne Twojego programu mają te dwa podstawowe kryteria zalecane przez firmę Gartner (zabezpieczone paywall; warto):

  • „Możliwość projektowania pulpitów nawigacyjnych z co najmniej podstawowymi typami wykresów, w tym tabelami, wykresami słupkowymi, wykresami liniowymi, wykresami warstwowymi i wykresami kołowymi, bez konieczności korzystania z opcji stron trzecich, kodowania lub tworzenia skryptów”.
  • „To, co widzisz, to projekt, który otrzymujesz (WYSIWYG)”, możliwość projektowania pulpitu nawigacyjnego i analizowania danych bez znajomości kodowania.

Drążyć

Drążenie odnosi się do możliwości zebrania ogólnych informacji, takich jak roczne dane dotyczące sprzedaży, i przeanalizowania ich według miesiąca, tygodnia, a nawet dnia. „Drukowanie” oznacza, że ​​możesz zawęzić zakres od ogólnych do szczegółowych, które często decydują o różnicy między informacjami a wglądem. Drążenie to coś w rodzaju wersji Business Intelligence tego starego filmu o „mocy dziesięciu”.

ETL

ETL — czyli wyodrębnianie, przekształcanie, ładowanie — odbywa się między zbieraniem danych a umieszczaniem ich w hurtowni danych.

Konieczność „wydobycia” wynika z tego, że dane są gromadzone w bazach danych lub oprogramowaniu ERP, zanim trafią do hurtowni danych. Konieczność transformacji wynika z faktu, że te liczne źródła danych są często w różnych formatach i muszą zostać przekształcone do odpowiedniego formatu, aby można je było przechowywać i przeszukiwać w hurtowni danych. Konieczność załadowania jest oczywista; musisz umieścić go w hurtowni danych, zanim będziesz mógł przeszukiwać i porównywać jedno źródło danych z drugim.

Metadane

Metadane to dane o danych. Jeśli to brzmi, meta, to… to metadane !

Ale poważnie.

Metadane to informacje o Twoich danych. Istnieją trzy kategorie:

  • Techniczne: szczegóły techniczne dotyczące Twoich danych, takie jak modele, format i miary.
  • Biznes: opisy danych w sposób przyjazny dla użytkownika (tj. zwykłym angielskim)
  • Proces: dane informujące o tym, co zostało zrobione z jakimi fragmentami danych i kiedy.

Metryka

„Metryczny” to tylko wymyślne słowo określające wszystko, co mierzysz.

Czy śledzisz swoje zyski netto? To jest metryka. Kontrolujesz, ile osób korzysta z oprogramowania BI w Twojej firmie? To też jest miara. Pilnujesz tego tempa rozmów? To także metryka. Sztuczka z metrykami polega na tym, aby wybrać te, które są najlepsze dla Twojej firmy. Każda firma ma inne potrzeby, dlatego podczas wybierania wskaźników warto wziąć pod uwagę swoje potrzeby i priorytety .

Nowoczesne BI

Termin nowoczesna inteligencja biznesowa pochodzi od Gartnera , który definiuje go w następujący sposób :

Nowoczesna platforma BI wspiera tworzenie treści analitycznych z wykorzystaniem technologii IT. Jest zdefiniowany przez samodzielną architekturę, która umożliwia użytkownikom nietechnicznym autonomiczne wykonywanie przepływów pracy analitycznej w pełnym spektrum, od dostępu do danych, ich pozyskiwania i przygotowania do interaktywnej analizy i wspólnego udostępniania spostrzeżeń.

Mówiąc najprościej, nowoczesne BI stawia użytkownika biznesowego na pierwszym miejscu. Aby korzystać z nowoczesnego programu BI, nie będziesz musiał polegać na kimś z działu IT lub będziesz musiał polegać na nim w znacznie mniejszym stopniu. Tam, gdzie tradycyjne, starsze programy BI zostały skonfigurowane tak, aby umożliwiały tylko informatykom tworzenie treści, na przykład nowoczesne programy BI ułatwiają użytkownikom biznesowym samodzielne tworzenie treści.

Tradycyjne BI

Tradycyjne programy Business Intelligence w dużym stopniu opierają się na personelu IT. Zwykle wymagają, aby użytkownicy znali SQL (język programowania, patrz poniżej), a uzyskanie odpowiedzi zajmuje znacznie więcej czasu, ponieważ musisz ręcznie wprowadzić wiele zapytań w tym języku. W związku z tym są one znacznie mniej sprawne, a eksperci, tacy jak Gartner, sugerują kupującym, aby zamiast tego szukali funkcji, które można znaleźć we współczesnych programach BI .

Oprogramowanie SaaS/Cloud

Oprogramowanie jako usługa to model, w którym kupujący kupują licencje na korzystanie z oprogramowania, zamiast kupować je i instalować. Większość oprogramowania SaaS jest wykonywana przez Internet (tj. w chmurze), co zmniejsza początkowe koszty zakupu i instalacji. Eliminuje również konieczność monitorowania serwerów, na których przechowywane jest oprogramowanie; firma SaaS śledzi wszelkie potencjalne przestoje.

Plasterek i kości

Krojenie i dzielenie dużych zbiorów danych, aby spojrzeć na dane z różnych perspektyw lub przyjrzeć się niektórym częściom bardziej szczegółowo. Funkcje Slice and Dice pozwalają na przykład sprawdzać dane według tygodnia, miesiąca, a następnie dla poszczególnych dni. Zamiast czekać na raport, krojenie w kostkę pozwala przejąć inicjatywę i sprawdzić konkretne dane, gdy zajdzie taka potrzeba.

SQL

Wymawiany jako „kontynuacja”, SQL jest powszechnym językiem programowania używanym do uzyskiwania informacji z baz danych. Jeśli mówisz po angielsku, baza danych posługuje się językiem SQL i będzie wiedziała tylko, jak odpowiedzieć na pytania sformułowane w ten sposób. O ile oczywiście oprogramowanie do analizy biznesowej nie zawiera zapytań w języku naturalnym (NLQ), co pozwala zadawać pytania w taki sam sposób, jak wyszukiwarka.

Terminy, które chcesz poznać…

A może myślisz, że skorzystają na tym czytelnicy tej listy? Daj mi znać w komentarzach poniżej. W idealnym przypadku sekcja komentarzy mogłaby stać się kolejnym miejscem, w którym ludzie mogą prosić o definicje, a ja je dostarczam.

Jeśli chcesz dowiedzieć się, jak te warunki mogą pomóc Ci lepiej, sprawdź jedną z opcji w katalogu oprogramowania Business Intelligence firmy Capterra i skontaktuj się ze sprzedawcą.