4 einfache Schritte, um ein Citizen Data Scientist zu werden
Veröffentlicht: 2022-05-07Was ist ein Citizen Data Scientist?
Eine Person, die (einige) Arbeiten auf Data Scientist-Niveau erledigen kann, ohne die Ausbildung eines Data Scientists.
Ein Mitarbeiter, der Business-Intelligence-Software verwenden kann, um Clustering, Segmentierung und erweiterte Datenverschmelzung durchzuführen, auch wenn er keinen Doktortitel in Statistik hat.
Mit anderen Worten? Ein Citizen Data Scientist ist das freundliche Einhorn in der Nachbarschaft jedes Unternehmens.
Wenn Sie eine formale Definition wünschen, definiert Gartner den Citizen Data Scientist (CDS) als „eine Person, die Modelle erstellt oder generiert, die fortschrittliche diagnostische Analysen oder prädiktive und präskriptive Fähigkeiten verwenden, deren Hauptaufgabe jedoch außerhalb des Bereichs Statistik und Analytik liegt. ”
In vielen Fällen bedeutet das „außerhalb des Bereichs Statistik und Analytik“, dass der CDS ein Geschäftsanalyst ist – ein Geschäftsanalyst, der gelernt hat, diese High-Level-Modelle aus einer Mischung von Eigeninitiative (wenn ich die Variablen x, I können unseren Umsatz steigern) und Bedarf (unsere Data Scientists sind so überfordert wie ein Lehrer ohne Planungszeitraum).
Da Data Scientists zunehmend mit Anfragen belastet werden, um ein Unternehmen datengesteuerter zu machen, können Citizen Data Scientists ihren Unternehmen auf zwei Arten helfen:
- Sie können Data Scientists entlasten, indem sie die richtige Business-Intelligence-Software verwenden, um die einfacheren Data-Science-Aufgaben zu erledigen.
- Sie können die Data Science aus einer betriebswirtschaftlichen Perspektive von außen einbringen.
Glücklicherweise ist kein Abschluss oder gar ein ganzes Jahr Ausbildung erforderlich, um Citizen Data Scientist zu werden. Es erfordert Arbeit, aber die Vorteile machen die Arbeit lohnenswert. Wenn Sie daran interessiert sind, Citizen Data Scientist zu werden, finden Sie hier vier Schritte, die Sie auf diesem Weg unterstützen können.
1. Bitten Sie um Zugang zu weiteren und neuen Datenquellen.
Wenn Sie es leid sind, sich mit denselben alten Daten aus denselben alten Berichten herumzuschlagen, juckt Sie der Citizen Data Scientist, und es ist möglicherweise an der Zeit, Ihren Vorgesetzten um Zugriff auf Daten zu bitten, die nicht in Ihren normalen Berichten enthalten sind und Information.
Wenn Sie den Zugang zu Daten für Nicht-Datenwissenschaftler öffnen, können Sie die Stärke und die Vorteile erkennen, die sich aus Citizen Data Science ergeben. Durch die Ausweitung der Daten auf eine sehr einzigartige Gruppe von Citizen Data Scientists verwandelte IBM das Wimbledon-Turnier 2016 in eine Informationsbibliothek. Der Computerriese befähigte Tennisprofis, sein Datenanalyseprogramm Watson Analytics zu verwenden. Das Ergebnis war ein beispielloser Einblick in die Leistungen der Spieler. Watson Analytics war in der Lage, Datenpunkte zu verwenden, die so klein sind wie die Stelle, an der der Ball gelandet ist, um festzustellen, ob sich der Spielstil eines Spielers geändert hat.
Auch die Ausweitung des Zugangs auf Personen ohne Data-Science-Abschluss war überraschend einfach – tatsächlich war es einfacher, Profisportler in der Verwendung von Data-Science-Software zu schulen, als Data Scientists darin zu schulen, die Feinheiten des Profi-Tennis zu verstehen. Besser noch, es bedeutete, dass eine Gruppe von Menschen mit Expertenwissen in der Lage war, zu dem ansonsten unzugänglichen Gebiet der Datenwissenschaft beizutragen.
2. Erfahren Sie, wie Sie Business-Intelligence-Software mit erweiterten Analysefunktionen und intelligenter Datenermittlung verwenden.
Sobald Sie die neuen Datenquellen für neue Erkenntnisse haben, müssen Sie wissen, wie Sie die Tools verwenden, die Datenwissenschaft auf hohem Niveau für jemanden ohne einen Doktortitel in Datenwissenschaft oder Statistik ermöglichen.
Nach welchen Funktionen sollten Sie in einer Software suchen, die Sie als Citizen Data Scientist unterstützen kann?
- Erweiterte Self-Service-Datenaufbereitung
- Verhaltensanalyse
- Grafische Analyse
- Standortanalyse
- Netz Analyse
- Intelligente Datenerkennung
Die fortschrittliche Self-Service-Datenaufbereitung hat Sears bereits dabei geholfen, ihre Business-Intelligence-Analysten in Citizen Data Scientists zu verwandeln. Sears investierte in die Big-Data-Discovery-Softwarelösung von Platfora und gewährte 400 seiner Analysten Zugriff. Infolgedessen konnten die Analysten die Kundensegmentierung – normalerweise eine fortschrittliche Data-Science-Aktion – nutzen, um die Produktempfehlungen für Kunden auf der Sears-Website zu verbessern.
Der Business-Intelligence-Anbieter Alteryx bietet ein benutzerfreundliches visuelles Tool für die komplexe Datenverschmelzung. Anstatt einen neuen Datensatz erstellen zu müssen, um verschiedene Datentypen zu integrieren (z. B. eine Excel-Datei und eine Oracle-Datei), können Sie die Drag-and-Drop-Funktion von Alteryx verwenden, um diese langwierige Data-Science-Aufgabe auf wenige Klicks zu reduzieren Maus.
Wie Platfora und Alteryx lässt die Software von Paxata fortschrittliche Datenanalysen Wirklichkeit werden. Ich habe mit Farnaz Erfan von Paxata gesprochen, der beschrieb, wie einer ihrer Kunden, ein Konsumgüterunternehmen, Analysten Aktivitäten auf PhD-Ebene vermittelte.
Paxata schuf „ein vollständiges Self-Service-Paradigma für die Analysten“, das keine Hilfe von Datenwissenschaftlern erforderte. Das Unternehmen nutzte die Self-Service-Lösung, um Bestand, Lieferung und Marketing zu verbessern. Beispielsweise hat die Verwendung von Paxata „die Zeit, die Business-Analysten für die Erstellung von Laufzeitdaten benötigen, von fünf Stunden pro Monat auf weniger als eine Stunde reduziert.“ Eine weitere Quelle für Einsparungen war die Möglichkeit, „Coupon-Betrug zu erkennen, indem anstößige E-Mail-Adressen identifiziert und abgeglichen werden“.
Während das Erlernen der Verwendung von Advanced Analytics viele Vorteile bietet, wird es auch eine Lernkurve geben. Allerdings ist es nicht zu überwältigend: Laut Gartners Schätzung sollte es nur ein bis zwei Wochen dauern, bis es auf Hochtouren kommt. Die meisten Anbieter bieten Schulungen, Tutorials und Community-Foren mit Antworten auf häufig gestellte Fragen an.
3. Stellen Sie sicher, dass Governance eingerichtet ist
Mo' Zugriff, mo' (Data Governance) Probleme. Oder das könnte der Fall sein, es sei denn, Sie machen Governance zu einer Priorität. Da immer mehr Citizen Data Scientists auf mehr Datensätze zugreifen, gibt es mehr Möglichkeiten, dass Daten in die falschen Hände geraten.
„Data Governance ist absolut entscheidend“, erklärt Werner Krebs, CEO des Data-Science-Beratungsunternehmens Acculation. „Sie müssen Ihre Mitarbeiter dahingehend schulen, dass sie verstehen, dass Daten wertvoll sind, und ihnen dabei helfen, Tools und Frameworks bereitzustellen, mit denen sie sie erfassen können“, fährt er fort. Glücklicherweise gibt es mehrere Frameworks für die Organisation dieser Daten, von Total Quality Management über ISO 9001 bis hin zu „den verschiedenen Six-Sigma-Frameworks“.
Gartner legt einen ähnlichen Schwerpunkt auf Data Governance: „Die richtige Governance ist von entscheidender Bedeutung, ebenso wie Anleitungen zum Verständnis von Daten, ihren Beziehungen und ihrer angemessenen Verwendung.“
Es ist sehr wertvoll, mehr Menschen den Zugriff auf mehr Daten zu ermöglichen, aber diese Menschen müssen verstehen, wie sie darauf zugreifen und wie sie sicher bleiben (lesen Sie beispielsweise keine sensiblen Dokumente in einem Bereich mit ungesichertem öffentlichem WLAN). ).
4. Stellen Sie sicher, dass Ihre Organisation „Wächter“ hat, die überwachen, wie Sie Ihre Daten verwenden
Eine neue Rolle wie Citizen Data Scientist erfordert neue Regeln und Rollen, um sie zu verwalten. Die Vorteile, die Sie aus einer fortschrittlichen Datenaufbereitung ziehen können, sind definitiv ein unternehmensweites Umdenken und eine Neuorganisation wert. Allerdings möchten Sie die alten Datenverwaltungsrollen nicht loswerden.
Eine Faustregel für das Datenmanagement im Zeitalter der Citizen Data Scientists lässt sich mit dem alten Pfadfinderlied auf den Punkt bringen: Neue Freunde finden, aber die alten behalten. Mit anderen Worten, behalten Sie Rollen wie Data Steward und Datenbankadministrator bei, fügen Sie aber auch neue Rollen hinzu, wie Gartners Idee des Wächters, um sicherzustellen, dass Citizen Data Scientists verantwortungsvoll mit dem umgehen können, was sie benötigen.
Gartner definiert die Rolle des „Wächters“ als Personen, die „sicherstellen, dass Daten industrialisiert, sicher und skalierbar sein können“. Mit anderen Worten, es sind Personen, die die Datensicherheit überwachen und auch dafür sorgen, dass erfolgreiche Instanzen von Citizen Data Science vom gesamten Unternehmen übernommen werden können. Sie schließen auch die Lücke zwischen traditionellen Datenverwaltungsrollen (Gartner nennt sie „Operatoren“) und den Citizen Data Scientists, die Daten auf neue Weise nutzen („Innovatoren“).
Wie haben Sie Citizen Data Science eingesetzt?
Übernehmen Sie die Rolle eines Citizen Data Scientist? Haben Sie fortschrittliche Datenanalysen eingesetzt, um Ihrem Unternehmen dabei zu helfen, Geld zu sparen oder Geld zu verdienen? Wenn ja, lass es mich in den Kommentaren unten wissen!