4 sencillos pasos para convertirse en un ciudadano científico de datos
Publicado: 2022-05-07¿Qué es un ciudadano científico de datos?
Una persona que puede hacer (algunos) trabajos de nivel de científico de datos, sin la capacitación de un científico de datos.
Un trabajador que pueda utilizar software de inteligencia empresarial para agrupar, segmentar y combinar datos avanzados, incluso si no tiene un doctorado en estadística.
¿En otras palabras? Un ciudadano científico de datos es el amigable unicornio del vecindario de todas las empresas.
Si desea una definición formal, Gartner define al ciudadano científico de datos (CDS) como “una persona que crea o genera modelos que usan análisis de diagnóstico avanzado o capacidades predictivas y prescriptivas, pero cuya función principal de trabajo está fuera del campo de las estadísticas y el análisis. ”
En muchos casos, que "fuera del campo de la estadística y el análisis" significa que el CDS es un analista de negocios, un analista de negocios que aprendió a hacer esos modelos de alto nivel a partir de una combinación de iniciativas (si puedo encontrar la variable x, puedo puede aumentar nuestros ingresos) y necesidad (nuestros científicos de datos están tan sobrecargados como un maestro sin un período de planificación).
A medida que a los científicos de datos se les exigen cada vez más solicitudes para hacer que un negocio esté más basado en datos, los científicos de datos ciudadanos pueden ayudar a sus negocios de dos maneras clave:
- pueden aligerar la carga de los científicos de datos utilizando el software de inteligencia comercial adecuado para realizar las tareas de ciencia de datos más simples.
- Pueden aportar una perspectiva externa del lado empresarial a la ciencia de datos.
Afortunadamente, convertirse en un ciudadano científico de datos no requiere un título, ni siquiera un año completo de capacitación. Requiere trabajo, pero los beneficios hacen que el trabajo valga la pena. Si está interesado en convertirse en un ciudadano científico de datos, aquí hay cuatro pasos que pueden iniciarlo en ese camino.
1. Solicite acceso a más y nuevas fuentes de datos.
Si está cansado de lidiar con los mismos datos antiguos de los mismos informes antiguos, tiene la picazón del científico de datos ciudadano y puede ser el momento de pedirle a su supervisor acceso a los datos que no están incluidos en sus informes normales. e información.
Cuando abre el acceso a los datos a los que no son científicos de datos, puede ver la fuerza y los beneficios que se derivan de la ciencia de datos de los ciudadanos. Al expandir los datos a un grupo muy exclusivo de ciudadanos científicos de datos, IBM convirtió el torneo de Wimbledon de 2016 en una biblioteca de información. El gigante informático permitió a los profesionales del tenis utilizar su programa de análisis de datos, Watson Analytics. El resultado fue una visión sin precedentes del rendimiento de los jugadores. Watson Analytics pudo usar puntos de datos tan pequeños como el lugar donde cayó la pelota para determinar si el estilo de un jugador había cambiado.
Ampliar el acceso a personas sin títulos en ciencia de datos también fue sorprendentemente fácil; en realidad, fue más fácil capacitar a atletas profesionales para usar software de ciencia de datos que capacitar a científicos de datos para comprender las complejidades del tenis de nivel profesional. Mejor aún, significó que un grupo de personas con conocimientos de nivel experto pudieron contribuir al campo de la ciencia de datos, que de otro modo sería inaccesible.
2. Aprenda a usar el software de inteligencia comercial con funciones de análisis avanzadas y descubrimiento inteligente de datos.
Una vez que tenga las nuevas fuentes de datos para nuevos conocimientos, necesitará saber cómo usar las herramientas que hacen que la ciencia de datos de alto nivel sea una posibilidad para alguien sin un doctorado en ciencia de datos o estadística.
¿Qué tipo de características debe buscar en un software que pueda habilitarlo como científico de datos ciudadano?
- Preparación avanzada de datos de autoservicio
- Análisis de comportamiento
- Análisis gráfico
- Análisis de ubicación
- Analista de la red
- Descubrimiento inteligente de datos
La preparación avanzada de datos de autoservicio ya ayudó a Sears a transformar a sus analistas de inteligencia comercial en científicos de datos ciudadanos. Sears invirtió en la solución de software de descubrimiento de big data de Platfora, otorgando acceso a 400 de sus analistas. Como resultado, los analistas pudieron utilizar la segmentación de clientes, normalmente una acción avanzada de ciencia de datos, para mejorar las recomendaciones de productos para los clientes en el sitio web de Sears.
El proveedor de inteligencia empresarial Alteryx ofrece una herramienta visual fácil de usar para combinar datos complejos. En lugar de tener que crear un nuevo conjunto de datos para incorporar diferentes tipos de datos (por ejemplo, un archivo de Excel y un archivo de Oracle), puede usar la función de arrastrar y soltar de Alteryx para reducir esa larga tarea de ciencia de datos en unos pocos clics de un ratón.
Al igual que Platfora y Alteryx, el software de Paxata hace realidad el análisis de datos avanzado. Hablé con Farnaz Erfan de Paxata, quien describió cómo uno de sus clientes, una empresa de bienes de consumo empaquetados, llevó actividades de nivel de doctorado a los analistas.
Paxata creó “un paradigma completo de autoservicio para los analistas”, que no requería la ayuda de científicos de datos. La empresa utilizó la solución de autoservicio para mejorar el inventario, el suministro y la comercialización. Por ejemplo, el uso de Paxata "ha reducido el tiempo que tardan los analistas de negocios en preparar los datos de tiempo de tránsito de cinco horas al mes a menos de una hora". Otra fuente de ahorro ha sido la capacidad de "detectar cupones fraudulentos al identificar y hacer coincidir las direcciones de correo electrónico infractoras".
Si bien aprender a usar análisis avanzados ofrece muchos beneficios, también habrá una curva de aprendizaje. Dicho esto, no es demasiado abrumador: según la estimación de Gartner, solo debería llevar una o dos semanas ponerse al día. La mayoría de los proveedores ofrecen capacitación, tutoriales y foros comunitarios con respuestas a preguntas comunes.
3. Asegúrese de que la gobernanza esté configurada
Más problemas de acceso, más problemas (gobernanza de datos). O ese podría ser el caso, a menos que haga de la gobernanza una prioridad. Con más científicos de datos ciudadanos accediendo a más conjuntos de datos, hay más oportunidades para que los datos caigan en las manos equivocadas.
“El gobierno de datos es absolutamente clave”, explica Werner Krebs, director ejecutivo de la consultora de ciencia de datos Acculation. “Debe capacitar a sus empleados para que entiendan que los datos son valiosos y ayudarlos a proporcionarles herramientas y marcos para ayudarlos a recopilarlos”, continúa. Afortunadamente, existen múltiples marcos para organizar esos datos, desde Gestión de calidad total hasta ISO 9001 y "los diversos marcos Six Sigma".
Gartner pone un énfasis similar en el gobierno de datos: "El gobierno adecuado es crucial, al igual que la orientación sobre cómo comprender los datos, sus relaciones y usos apropiados".
Hay mucho valor en permitir que más personas accedan a más datos, pero esas personas deben entender cómo acceder a ellos y cómo mantenerlos seguros (no vaya a leer documentos confidenciales en un área con Wi-Fi público no seguro, por ejemplo ).
4. Asegúrese de que su organización tenga "tutores" que supervisen cómo usa sus datos
Un nuevo rol como científico de datos ciudadano requiere nuevas reglas y roles para administrarlo. Los beneficios que puede obtener de la preparación avanzada de datos definitivamente valen la pena repensar y reorganizar todo el negocio. Dicho esto, no desea deshacerse de los antiguos roles de gestión de datos.
Una regla general para la gestión de datos en la era de los científicos de datos ciudadanos se resume en la vieja canción de las Girl Scouts: haz nuevos amigos, pero conserva los viejos. En otras palabras, mantenga roles como administrador de datos y administrador de base de datos, pero también agregue nuevos roles, como la idea de guardián de Gartner, para asegurarse de que los científicos de datos ciudadanos puedan usar lo que necesitan de manera responsable.
Gartner define el rol de "guardián" como personas que "garantizan que los datos puedan ser industrializados, seguros y escalables". En otras palabras, son personas que supervisan la seguridad de los datos y también se aseguran de que toda la empresa pueda adoptar instancias exitosas de ciencia de datos ciudadana. También cierran la brecha entre los roles tradicionales de gestión de datos (Gartner los llama "operadores") y los científicos de datos ciudadanos que utilizan los datos de nuevas formas ("innovadores").
¿Cómo ha utilizado la ciencia de datos ciudadanos?
¿Juegas el papel de un ciudadano científico de datos? ¿Ha utilizado análisis de datos avanzados para ayudar a su empresa a ahorrar o ganar dinero? Si es así, ¡házmelo saber en los comentarios a continuación!