4 proste kroki, aby zostać naukowcem zajmującym się danymi obywatelskimi
Opublikowany: 2022-05-07Kim jest naukowiec zajmujący się danymi obywatelskimi?
Osoba, która może wykonywać (niektóre) prace na poziomie analityka danych bez przeszkolenia analityka danych.
Pracownik, który może używać oprogramowania Business Intelligence do grupowania, segmentacji i zaawansowanego łączenia danych, nawet jeśli nie ma doktoratu w dziedzinie statystyki.
Innymi słowy? Naukowiec zajmujący się danymi obywatelskimi jest przyjaznym jednorożcem z sąsiedztwa każdej firmy.
Jeśli potrzebujesz formalnej definicji, Gartner definiuje analityka danych obywatelskich (CDS) jako „osobę, która tworzy lub generuje modele wykorzystujące zaawansowaną analitykę diagnostyczną lub zdolności predykcyjne i preskryptywne, ale której główna praca jest poza dziedziną statystyki i analityki. ”
W wielu przypadkach to „poza dziedziną statystyki i analityki” oznacza, że CDS jest analitykiem biznesowym — analitykiem biznesowym, który nauczył się tworzyć modele wysokiego poziomu z mieszanki inicjatyw (jeśli mogę znaleźć zmienną x, ja może zwiększyć nasze dochody) i potrzeby (nasi naukowcy zajmujący się danymi są tak przeciążeni jak nauczyciele bez okresu planowania).
Ponieważ analitycy danych są coraz bardziej opodatkowani prośbami, aby firma była bardziej oparta na danych, analitycy danych obywatelskich mogą pomóc swoim firmom na dwa kluczowe sposoby:
- mogą odciążyć naukowców zajmujących się danymi, używając odpowiedniego oprogramowania do analizy biznesowej do wykonywania prostszych zadań związanych z analizą danych.
- Mogą wnieść do nauki o danych perspektywę osoby z zewnątrz, po stronie biznesowej.
Na szczęście, aby zostać naukowcem zajmującym się danymi obywatelskimi, nie trzeba mieć stopnia naukowego ani nawet całego roku szkolenia. To wymaga pracy, ale korzyści sprawiają, że praca jest opłacalna. Jeśli chcesz zostać naukowcem zajmującym się danymi obywatelskimi, oto cztery kroki, od których możesz zacząć.
1. Poproś o dostęp do większej ilości nowych źródeł danych.
Jeśli masz dość zajmowania się tymi samymi starymi danymi z tych samych starych raportów, masz swędzenie naukowca zajmującego się danymi obywatelskimi i być może nadszedł czas, aby poprosić przełożonego o dostęp do danych, które nie są zawarte w twoich normalnych raportach i informacje.
Kiedy otwierasz dostęp do danych dla naukowców nie zajmujących się danymi, możesz zobaczyć siłę i korzyści, jakie czerpie z nauki o danych obywatelskich. Rozszerzając dane do bardzo wyjątkowej grupy naukowców zajmujących się danymi obywatelskimi, IBM przekształcił turniej Wimbledonu 2016 w bibliotekę informacji. Gigant komputerowy umożliwił tenisistom korzystanie z ich programu do analizy danych, Watson Analytics. Rezultatem był bezprecedensowy wgląd w występy graczy. Watson Analytics był w stanie wykorzystać punkty danych tak małe, jak miejsce lądowania piłki, aby określić, czy zmienił się styl gracza.
Rozszerzenie dostępu do osób bez stopni naukowych w zakresie danych było również zaskakująco łatwe — w rzeczywistości łatwiej było wyszkolić zawodowych sportowców w zakresie korzystania z oprogramowania do analizy danych niż wytrenować naukowców zajmujących się danymi w celu zrozumienia zawiłości tenisa na profesjonalnym poziomie. Co więcej, oznaczało to, że grupa ludzi z wiedzą na poziomie eksperckim mogła wnieść swój wkład w niedostępną w inny sposób dziedzinę nauki o danych.
2. Dowiedz się, jak korzystać z oprogramowania do analizy biznesowej z zaawansowanymi funkcjami analitycznymi i inteligentnym wykrywaniem danych.
Po uzyskaniu nowych źródeł danych do nowych spostrzeżeń, musisz wiedzieć, jak korzystać z narzędzi, które sprawiają, że nauka o danych wysokiego poziomu jest możliwa dla kogoś, kto nie ma tytułu naukowego ani doktora statystyki.
Jakich funkcji powinieneś szukać w oprogramowaniu, które umożliwi ci pracę jako naukowiec zajmujący się danymi obywatelskimi?
- Zaawansowane samoobsługowe przygotowywanie danych
- Analityka behawioralna
- Analiza wykresów
- Analiza lokalizacji
- Analityka internetowa
- Inteligentne wykrywanie danych
Zaawansowane samoobsługowe przygotowywanie danych już pomogło firmie Sears przekształcić analityków analityki biznesowej w naukowców zajmujących się danymi obywatelskimi. Sears zainwestował w rozwiązanie Big Data Discovery firmy Platfora, zapewniając dostęp do 400 swoich analityków. W rezultacie analitycy byli w stanie wykorzystać segmentację klientów — zwykle zaawansowaną czynność związaną z nauką o danych — w celu ulepszenia rekomendacji produktów dla klientów w witrynie Sears.
Alteryx, dostawca analityki biznesowej, oferuje łatwe w użyciu narzędzie wizualne do wykonywania złożonych miksów danych. Zamiast tworzyć nowy zestaw danych w celu włączenia różnych typów danych (powiedzmy, plik Excel i plik Oracle), możesz użyć funkcji przeciągania i upuszczania Alteryx, aby skrócić to długie zadanie analizy danych do kilku kliknięć mysz.
Podobnie jak Platfora i Alteryx, oprogramowanie Paxaty sprawia, że zaawansowana analiza danych staje się rzeczywistością. Rozmawiałem z Farnazem Erfanem z Paxata, który opisał, jak jeden z ich klientów, firma produkująca towary konsumpcyjne, przedstawił analitykom zajęcia na poziomie doktoratu.
Paxata stworzył „kompletny paradygmat samoobsługi dla analityków”, który nie wymagał pomocy analityków danych. Firma wykorzystała rozwiązanie samoobsługowe w celu poprawy zapasów, dostaw i marketingu. Na przykład korzystanie z Paxaty „skróciło czas potrzebny analitykom biznesowym na przygotowanie danych dotyczących czasu tranzytu z pięciu godzin miesięcznie do mniej niż jednej godziny”. Innym źródłem oszczędności była możliwość „wykrywania oszustw kuponowych poprzez identyfikowanie i dopasowywanie obraźliwych adresów e-mail”.
Chociaż nauka korzystania z zaawansowanej analityki oferuje wiele korzyści, pojawi się również krzywa uczenia się. To powiedziawszy, nie jest to zbyt przytłaczające: według szacunków Gartnera, przyspieszenie powinno zająć tylko od jednego do dwóch tygodni. Większość dostawców oferuje szkolenia, samouczki i fora społecznościowe z odpowiedziami na często zadawane pytania.
3. Upewnij się, że ustanowiono zarządzanie
Problemy z dostępem mo ', mo' (zarządzanie danymi). Albo może tak być, chyba że priorytetem będzie zarządzanie. Ponieważ coraz więcej naukowców zajmujących się danymi obywatelskimi ma dostęp do większej liczby zbiorów danych, istnieje więcej możliwości, aby dane wpadły w niepowołane ręce.
„Nadzór nad danymi jest absolutnie kluczowy” — wyjaśnia Werner Krebs, dyrektor generalny firmy konsultingowej Acculation zajmującej się analizą danych. „Musisz przeszkolić swoich pracowników, aby zrozumieli, że dane są cenne, i zapewnić im narzędzia i ramy, które pomogą im je zebrać”, kontynuuje. Na szczęście istnieje wiele ram do organizowania tych danych, od Total Quality Management przez ISO 9001 do „różnych ram Six Sigma”.
Gartner kładzie podobny nacisk na zarządzanie danymi: „Właściwe zarządzanie jest kluczowe, podobnie jak wskazówki dotyczące zrozumienia danych, ich relacji i odpowiedniego wykorzystania”.
Umożliwienie większej liczbie osób dostępu do większej ilości danych ma dużą wartość, ale te osoby muszą zrozumieć, jak uzyskać do nich dostęp i jak je zabezpieczyć (na przykład nie czytaj poufnych dokumentów w obszarze z niezabezpieczoną publiczną siecią Wi-Fi ).
4. Upewnij się, że Twoja organizacja ma „opiekunów” nadzorujących sposób korzystania z Twoich danych
Nowa rola, jaką jest analityk danych obywatelskich, wymaga nowych zasad i ról, aby nią zarządzać. Korzyści, jakie można uzyskać z zaawansowanego przygotowania danych, są zdecydowanie warte przemyślenia i reorganizacji w całej firmie. To powiedziawszy, nie chcesz pozbyć się starych ról zarządzania danymi.
Jedną z podstawowych zasad zarządzania danymi w erze analityków danych obywatelskich jest stara piosenka Girl Scout: zdobywaj nowych przyjaciół, ale zachowaj stare. Innymi słowy, zachowaj role, takie jak zarządca danych i administrator bazy danych, ale także dodaj nowe role, takie jak pomysł opiekuna Gartnera, aby upewnić się, że naukowcy zajmujący się danymi obywatelskimi mogą korzystać z tego, czego potrzebują w sposób odpowiedzialny.
Gartner definiuje rolę „opiekuna” jako ludzi, którzy „zapewniają, że dane mogą być uprzemysłowione, bezpieczne i skalowalne”. Innymi słowy, są to ludzie, którzy nadzorują bezpieczeństwo danych, a także dbają o to, aby udane przykłady nauki o danych obywatelskich mogły zostać przyjęte przez całą firmę. Wypełniają również lukę między tradycyjnymi rolami zarządzania danymi (Gartner nazywa ich „operatorami”) a badaczami danych obywatelskich wykorzystującymi dane w nowy sposób („innowatorami”).
Jak wykorzystałeś analizę danych obywatelskich?
Czy wcielasz się w rolę naukowca zajmującego się danymi obywatelskimi? Czy korzystałeś z zaawansowanej analityki danych, aby pomóc Twojej firmie zaoszczędzić pieniądze lub zarabiać? Jeśli tak, daj mi znać w komentarzach poniżej!