¿Qué es el aprendizaje automático? Su glosario esencial de inteligencia comercial

Publicado: 2022-05-07

Siempre he visto la limpieza de primavera como demasiado poco y demasiado tarde. Para mí, enero es cuando ordenas, priorizas y comienzas a responder las preguntas del próximo año. Es por eso que elegí enero para responder una pregunta que quizás haya tenido durante un tiempo: ¿qué es el aprendizaje automático?

Responderé eso y también definiré algunos otros términos que necesitará saber para estar al tanto de 2017. Si está interesado en lo que el software de inteligencia empresarial puede hacer por usted, primero deberá conocer estos términos básicos. .

He puesto el aprendizaje automático en primer lugar, ya que es una de las diez tendencias tecnológicas estratégicas principales de Gartner para 2017 , pero el resto de las entradas están ordenadas alfabéticamente.

Aprendizaje automático

Antes del aprendizaje automático, a las computadoras se les tenía que decir (programar) cómo pensar. Con el aprendizaje automático, las computadoras pueden pensar (más o menos) por sí mismas.

Recientemente hablé con Michael Finley, jefe de aprendizaje automático de la empresa de software de BI AnswerRocket , quien me ayudó a elaborar. Antes del aprendizaje automático, la mayoría del software “funcionaba de la forma en que estaba programado: las personas convertían las instrucciones en código de computadora, y la computadora hacía lo que ese código le decía que hiciera”. Un ejemplo muy simple sería una calculadora: alimentaste los números de la calculadora, le dijiste qué hacer (sumar, restar) y la calculadora te dio los resultados. Sin embargo, con el aprendizaje automático, el software puede adaptarse. Finley continúa: "El software con aprendizaje automático no hace lo mismo el día que lo instala que el décimo o el centésimo día que lo ejecuta". Si los valores que se introducen en la computadora cambian, el software se adaptará a esos valores. Una computadora con aprendizaje automático aprende a incorporarlos.

Cortesía del increíble Andre Pinto y Anthill Comics

Finley caracteriza el aprendizaje automático como un software que sabe cómo lidiar con el concepto de "me gusta", como en "Quiero escuchar una canción como la última que acabo de escuchar". El concepto es fácil para las personas, pero es difícil para las computadoras. Finley explicó que las computadoras son buenas para entender qué números son más grandes o más pequeños, y para relacionar números y nombres, pero les cuesta entender la idea de la similitud. El aprendizaje automático ayuda a las computadoras a comprender por qué una cosa es "similar" a otra. La comprensión de la similitud del aprendizaje automático es especialmente útil para predecir los deseos de los clientes.

El aprendizaje automático está detrás de la siguiente canción que escuchas en Pandora, o la película que sugiere Netflix. Los algoritmos de aprendizaje automático de Pandora y Netflix se "alimentan" de sus elecciones (y "me gusta" reales, en el caso de Pandora), y lo usan para predecir qué canciones o programas similares podría disfrutar.

Alimente a esos algoritmos de aprendizaje automático con diferentes datos, y reaccionarán de manera diferente. Si su dieta habitual de películas de terror de repente e inexplicablemente incluye una comedia romántica, los algoritmos ML de Netflix reaccionarán a esos datos y comenzarán a sugerir otras comedias románticas o romance de terror.

Dejando de lado la disminución del gusto por las películas, ¿por qué el aprendizaje automático es importante para las PYMES? Puede ayudarlos a competir con competidores más grandes. El software de BI con aprendizaje automático toma nuevos números cada vez que se actualiza. No está basando la estrategia en los números de un informe anual, la está basando en información casi en tiempo real y algoritmos que saben cómo adaptarse a esos datos cambiantes. Finley explica que la forma tradicional y homogénea en que una empresa escala lo que sea que haga puede revolucionarse con ML:

“Podría haber presentado las mejores prácticas y querer repetir los procesos. Pero, ¿y si pudiera diseñar las mejores prácticas todos los días, si tuviera información para cambiarlas y reformular su estrategia todos los días? Tienes datos gracias a ML que pueden reescribir la estrategia todos los días, y así es como las PYMES realmente se comen el almuerzo de los tipos más grandes".

Para las pymes interesadas en una estrategia empresarial ágil, el aprendizaje automático puede ser más que una forma de mantenerse con vida. Podría ser una forma de comenzar a tomar partes de las cuotas de mercado de los jugadores establecidos.

  • Análisis ad hoc
  • Consulta ad hoc
  • Análisis avanzado
  • Inteligencia artificial
  • Grandes datos
  • Datos contextuales
  • Punto de datos
  • Calidad de datos
  • Visualización de datos
  • Almacén de datos
  • Base de datos
  • Tableros
  • Profundizar
  • ETL
  • metadatos
  • Métrica
  • BI moderno
  • BI tradicional
  • SaaS/software en la nube
  • Parte y pica
  • sql
  • Términos que desea conocer...

Análisis ad hoc

El análisis ad hoc es un análisis cuando lo necesita, a un nivel que el que no es de TI ni un especialista puede entender.

Si la inteligencia de negocios accesible parece algo obvio que desear, no siempre fue posible lograrlo. Durante mucho tiempo, los profesionales de BI tenían que ser capaces de “hablar informática” (es decir, escribir en un lenguaje de codificación) para consultar los programas de inteligencia comercial. ¿No sabía cómo codificar en SQL, R o Python? Pregúntele a alguien en TI que lo haga. Entonces espera. Y luego esperar a que funcionen los programas de inteligencia comercial y luego esperar un poco más para el análisis.

Afortunadamente, BI finalmente ha madurado a análisis ad hoc. : Con este sistema, no necesita esperar al departamento de TI ni al ritmo más lento de producción de informes tradicionales para obtener los datos necesarios. Hace que su trabajo y el de ellos sea más fácil y menos estresante.

Si no tiene personal de TI, el análisis ad hoc resuelve ese problema. El análisis ad hoc también crea un tiempo de comprensión más rápido (esta es otra palabra de moda que puede ver; significa que se necesita menos tiempo para obtener la información que necesita).

Consulta ad hoc

Las "consultas" son preguntas que puede pedirle a su software de inteligencia comercial que responda. Por ejemplo, puede pedirle a su software de BI una lista alfabética de todos los clientes de ojos marrones nacidos desde 1970. Puede llamar a una consulta una pregunta con la misma facilidad, pero ¿con qué frecuencia dice "consulta" en una conversación?

Una consulta ad hoc es aquella que puede solicitar cuando la necesite. Al igual que con los análisis de negocios más antiguos, las consultas más antiguas necesitaban que alguien en TI las hiciera. Las consultas también tendían a realizarse como parte de los informes regulares que obtendría mensual o anualmente. Con el software de BI más antiguo, tendría que hacer esa consulta en un lenguaje de programación. SQL fue un estándar durante mucho tiempo en inteligencia empresarial; en estos días, R y Python son los más populares.

Puede considerar los programas informáticos, incluido el BI, como ramas de una burocracia, desde el DOJ hasta el HHS. Técnicamente están ahí para lograr cosas, pero cada uno tiene su propio lenguaje y funciona de una manera particular. Un programador es como un burócrata que habla el idioma y sabe cómo navegar por cada programa/departamento.

Análisis avanzado

Este término en realidad va más allá de la inteligencia empresarial. La “inteligencia de negocios” tradicionalmente se ha ocupado de analizar lo que ha sucedido. El análisis avanzado va más allá, ya sea pronosticando lo que sucederá en el futuro o analizando detalles y factores que normalmente no están asociados con la inteligencia comercial. Algunos ejemplos de análisis avanzados son la minería de datos y texto , el análisis predictivo , la previsión , el análisis de ubicación , el análisis de sentimientos y el aprendizaje automático.

Inteligencia artificial

El aprendizaje automático es una parte de la IA, pero la IA es un concepto mucho más amplio. La IA incluye todo lo que podría llamarse " inteligencia exhibida por máquinas ". “Inteligencia”, en el sentido de IA, significa la capacidad de hacer algo. Entonces, el entendimiento común de "inteligencia" como saber mucho no es el tipo de inteligencia que se encuentra en la IA.

Las "cosas" que la IA puede hacer ya son variadas. Por ejemplo, Daisy Intelligence usa IA para examinar los datos de los minoristas y luego hace recomendaciones que afirman que pueden "aumentar las ventas en un 5% o más". Si, como yo, disfruta programar tanto como esperar en el DMV, una asistente virtual como Amy , que puede programar reuniones según las preferencias de los asistentes, podría ser su mejor amigo imaginario.

Grandes datos

Los grandes datos son conjuntos de datos extremadamente grandes. Aunque normalmente estoy de acuerdo con Stephen King en que " el camino al infierno está pavimentado con adverbios ", ese "extremadamente" está justificado. Una pequeña cantidad de datos sería, digamos, un libro corto. Un PDF del primer libro de Harry Potter ocupa aproximadamente un megabyte (MB).

Big Data sería algo así como un petabyte de datos. Para continuar con el ejemplo del libro, todo lo escrito, desde el inicio de la historia registrada, es de 50 petabytes . Las mega corporaciones, como Google, son del tipo que maneja petabytes. El sistema Mesa de Google , que monitorea el tráfico de anuncios de Google, rastrea petabytes de datos.

datos contextuales

Los datos contextuales son datos adicionales sobre una persona, un lugar o un evento (que se denominan "entidades" en la jerga de datos). Los datos contextuales ayudan a completar lo que una empresa sabe sobre un cliente potencial e incluso a predecir lo que podría querer.

Aunque no es un negocio, la Universidad de Manchester en Inglaterra utiliza datos contextuales en su proceso de admisión para “ construir una visión completa y redondeada de su logro y potencial ”. Junto con el formulario de admisión del estudiante, la UM considera factores como el código postal del candidato, la calidad de la escuela donde rindió sus exámenes y “ si ha estado bajo cuidado por más de tres meses”.

Para una empresa, los datos contextuales pueden ayudar a las ventas. Para un ejemplo muy amplio, los datos contextuales sobre un cliente anterior, según el clima de su ubicación, podrían generar ingresos. Es más probable que un cliente de Tuscon, Arizona, compre paletas heladas en octubre que uno de International Falls, Minnesota .

Punto de datos

Un punto de datos es un fragmento único de datos. Un punto de datos es cualquier unidad independiente, o dato, entre los datos que rastrea. Un solo punto de datos puede ser cualquier cosa, desde " el tamaño de una inversión " hasta un solo clic en un anuncio que compró en Google. En el caso de Uber, la ubicación es un punto de datos importante, uno tan importante que en realidad lo rastrean una vez que finaliza su viaje .

Si está familiarizado con los indicadores clave de rendimiento , está familiarizado con los puntos de datos. Los KPI miden ciertos tipos de puntos de datos, como los ingresos o el tiempo que lleva completar un proyecto.

Calidad de datos

La calidad de los datos es la medida de la utilidad de sus datos. Los datos de alta calidad están limpios, organizados y disponibles. Si los datos de una biblioteca son sus libros, una biblioteca con datos de alta calidad tendría libros que la población quiere y necesita, en buenas condiciones, archivados en los lugares correctos.

Hay seis dimensiones de la calidad de los datos:

  • Lo completo
  • Unicidad
  • Validez
  • Oportunidad
  • Consistencia
  • Precisión

Visualización de datos

Una visualización de datos es cualquier imagen, elemento visual o gráfico que muestre sus datos. Los gráficos circulares y los gráficos de barras serían los tipos más comunes. Sin embargo, existe una gama mucho más amplia de visualizaciones. Los Criterios de evaluación de Gartner para plataformas de análisis e inteligencia comercial para 2016 (protegido por paywall; vale la pena) clasifica los tipos de gráficos más avanzados como elementos "preferidos" para buscar en su solución de BI. Algunos de esos tipos de gráficos preferidos de mayor calidad para buscar son:

  • Gráficos Marimekko
  • Gráficos X/Y
  • Gráficos de red
  • Diagramas de Pareto
  • Nubes de palabras

Almacén de datos

Un almacén de datos es el sistema informático donde se guardan y organizan los datos de varias bases de datos y sistemas transaccionales. A menudo verá el término con una "empresa" en el frente, ya que necesitará una gran cantidad de datos del tamaño de una empresa para necesitar un almacén de datos.

Base de datos

Una base de datos son datos, organizados para que pueda obtener fácilmente lo que necesita. ¿Has estado alguna vez en IMDB ? Por supuesto que tienes. Eso es una base de datos: películas, actores, directores, productores, todo organizado para facilitar la búsqueda, como cuando necesitas hacer trampa en un juego de seis grados de Kevin Bacon .

Tableros

Esa imagen está antes de esta explicación porque es más fácil mostrar cómo se ve un tablero.

Para una definición formal: un tablero es una representación visual de los datos que está rastreando. Su programa de BI absolutamente necesita tener un tablero. No comprarías un coche sin salpicadero. Lo mismo ocurre con el software de BI.

Cuando compre software de BI, asegúrese de que los paneles de control de su programa tengan estos dos criterios básicos recomendados por Gartner (protegido por paywall; vale la pena):

  • “La capacidad de diseñar tableros con, como mínimo, tipos de gráficos básicos que incluyen tablas, gráficos de barras, gráficos de líneas, gráficos de área y gráficos circulares sin necesidad de opciones, codificación o secuencias de comandos de terceros”.
  • "Lo que ves es lo que obtienes (diseño WYSIWYG)", la capacidad de diseñar un tablero y analizar datos sin saber cómo codificar.

Profundizar

La profundización se refiere a la capacidad de tomar una información general, como las cifras de ventas anuales, y profundizar en ella por mes, semana o incluso día. "Profundizar" significa que puede reducir de lo general a los detalles que a menudo marcan la diferencia entre la información y el conocimiento. Drill down es algo así como la versión de inteligencia empresarial de esa vieja película de "poderes de diez".

ETL

ETL, o extraer, transformar, cargar, tiene lugar entre la recopilación de datos y la colocación de esos datos en el almacén de datos.

La necesidad de "extraer" proviene del hecho de que los datos se recopilan en bases de datos o software ERP antes de que lleguen al almacén de datos. La necesidad de transformar proviene del hecho de que esas múltiples fuentes de datos a menudo están en diferentes formatos y deben transformarse al formato adecuado para almacenarse y buscarse en el almacén de datos. La necesidad de cargar se explica por sí misma; debe colocarlo en el almacén de datos antes de poder buscar y comparar una fuente de datos con otra.

metadatos

Los metadatos son datos sobre datos. Si eso suena, meta, lo es... ¡son metadatos !

Pero en serio.

Los metadatos son información sobre sus datos. Hay tres categorías:

  • Técnico: los detalles técnicos sobre sus datos, como sus modelos, formato y medidas.
  • Negocios: descripciones de los datos en términos fáciles de usar (es decir, en inglés simple)
  • Proceso: datos que le dicen qué se hizo con qué datos y cuándo.

Métrica

"Métrico" es solo una palabra elegante para cualquier cosa que estés midiendo.

¿Estás rastreando tus ganancias netas? Esa es una métrica. ¿Vigila cuántas personas utilizan el software de BI en su empresa? Esa es una métrica, también. ¿Vigilar esa tasa de conversación? Esa es una métrica, también. El truco con las métricas es elegir las que sean mejores para su empresa. Cada empresa tiene necesidades diferentes, y es una buena idea tener en cuenta sus necesidades y prioridades al elegir las métricas .

BI moderno

El término inteligencia empresarial moderna proviene de Gartner , quien lo define así :

Una plataforma de BI moderna admite el desarrollo de contenido analítico habilitado por TI. Está definido por una arquitectura autónoma que permite a los usuarios no técnicos ejecutar de forma autónoma flujos de trabajo analíticos de espectro completo desde el acceso, la ingesta y la preparación de datos hasta el análisis interactivo y el intercambio colaborativo de conocimientos.

En pocas palabras, la BI moderna pone al usuario empresarial en primer lugar. No necesitará depender de alguien de TI, o necesitará depender mucho menos de ellos, para usar un programa de BI moderno. Mientras que los programas de BI tradicionales y más antiguos se configuraron para permitir que la gente de TI solo creara contenido, por ejemplo, los programas de BI modernos facilitan que los usuarios comerciales creen contenido por su cuenta.

BI tradicional

Los programas tradicionales de inteligencia comercial se basan en gran medida en el personal de TI. Por lo general, requieren que los usuarios conozcan SQL (un lenguaje de programación, consulte a continuación) y lleva mucho más tiempo obtener respuestas, ya que debe ingresar manualmente varias consultas en ese idioma. Como tales, son mucho menos ágiles, y expertos como los de Gartner sugieren que los compradores busquen el tipo de funciones que se encuentran en los programas de BI modernos .

SaaS/software en la nube

El software como servicio es un modelo en el que los compradores compran licencias para usar el software, en lugar de comprarlo e instalarlo. La mayoría del software SaaS se realiza a través de Internet (es decir, en la nube), lo que reduce los costos iniciales de compra e instalación. También elimina la necesidad de monitorear los servidores donde se guarda el software; la compañía SaaS realiza un seguimiento de cualquier posible interrupción.

Parte y pica

Cortar y fragmentar grandes conjuntos de datos para mirar los datos desde diferentes perspectivas o mirar ciertas partes con más detalle. Las capacidades de corte y dados son las que, por ejemplo, le permiten verificar los datos por semana, luego por mes y luego por día individual. En lugar de esperar un informe, slice and dice le permite tomar la iniciativa y verificar los datos específicos cuando los necesite.

sql

Pronunciado "secuela", SQL es un lenguaje de programación común que se utiliza para obtener información de las bases de datos. Si habla inglés, la base de datos habla SQL y solo sabrá cómo responder a las preguntas formuladas de esa manera. A menos, por supuesto, que su software de inteligencia comercial tenga consultas en lenguaje natural (NLQ), que le permite hacer preguntas de la misma manera que lo haría con un motor de búsqueda.

Términos que desea conocer...

¿O que crees que beneficiaría a los lectores de esta lista? Házmelo saber en los comentarios a continuación. Idealmente, la sección de comentarios podría convertirse en otro lugar para que las personas soliciten definiciones y yo las proporcione.

Si desea saber cómo estos términos pueden ayudarlo mejor, consulte una de las opciones en el directorio de software de inteligencia comercial de Capterra y comuníquese con un proveedor.