Aprendizaje supervisado vs no supervisado: ¿Qué modelo de aprendizaje automático es adecuado para usted?

Publicado: 2022-05-07

El aprendizaje automático no tiene por qué ser desconcertante. Desglosaremos los dos tipos más comunes y sus casos de uso en este artículo.

Una persona y una máquina que comparten datos entre sí

Como líder empresarial, sabe que la adopción de nueva tecnología puede aliviar los puntos débiles y hacer que su negocio sea más competitivo. Es por eso que durante un año de disrupción, muchas empresas recurrieron a la transformación digital para salir adelante.

También puede ser consciente del potencial de las tecnologías emergentes, como el aprendizaje automático, que pueden hacer que su empresa esté preparada para el futuro. Pero tenga cuidado con el comprador: si no comprende las aplicaciones del aprendizaje automático, corre el riesgo de desperdiciar dinero en resultados inutilizables. Tome el ejemplo a continuación para ver lo que queremos decir.

Para prepararnos para escribir este artículo, utilizamos una herramienta de generación de lenguaje natural (NLG) para ayudarnos a comprender cómo desglosar mejor el aprendizaje supervisado versus el no supervisado. Aquí hay un extracto de nuestra contraparte de NLG:

“Cada modelo de aprendizaje no supervisado proporciona matrices tensorong anticipadas basadas en el coeficiente de correlación, respuesta falsa positiva, datos estadísticamente útiles bastante mínimos (o muy dependientes de ellos), se utiliza para la reducción de la dimensionalidad mediante gráficos y árboles para generar sus propios puntos de datos de límites”.

¿Sentirse confundido? Nosotros también. Pero a pesar de la desconcertante sintaxis de las oraciones de la herramienta NLG, este experimento con inteligencia artificial (IA) no fue del todo inútil. Nos hizo darnos cuenta de que, cuando se trata de obtener los mejores resultados de la IA, es importante encontrar la aplicación correcta, y esa es exactamente la razón por la que escribimos esta guía para ayudarlo.

Hablamos con Thomas Wood, consultor de ciencia de datos de Fast Data Science, y nos ayudó a desglosar el tema en términos fáciles de entender. Con la ayuda de Wood, explicaremos la diferencia entre dos métodos comunes de aprendizaje automático, el aprendizaje supervisado y el no supervisado, y qué casos de uso se adaptan mejor a cada método.

¿Nuevo en el aprendizaje automático? Revise estos conceptos clave antes de sumergirse en el resto de este artículo:

El aprendizaje automático (ML) es un subconjunto de la inteligencia artificial (IA) que resuelve problemas utilizando algoritmos y modelos estadísticos para extraer conocimiento de los datos. En términos generales, todos los modelos de aprendizaje automático se pueden clasificar en aprendizaje supervisado o no supervisado.
Un algoritmo en el aprendizaje automático es un procedimiento que se ejecuta en datos para crear un modelo de aprendizaje automático.
Un modelo en aprendizaje automático es el resultado de un algoritmo de aprendizaje automático que se ejecuta en datos. Es decir, un modelo representa lo que aprendió un algoritmo de aprendizaje automático.

¿Cuáles son las principales diferencias entre el aprendizaje supervisado y no supervisado?

Si tuviéramos que resumirlo en una oración, sería esta: la principal diferencia entre el aprendizaje supervisado y el aprendizaje no supervisado es que el aprendizaje supervisado utiliza datos etiquetados para ayudar a predecir los resultados, mientras que el aprendizaje no supervisado no lo hace.

Sin embargo, existen matices adicionales entre los dos enfoques, que continuaremos aclarando para que pueda elegir el mejor enfoque para su situación.

Cómo funciona el aprendizaje automático supervisado

Como mencionamos anteriormente, el aprendizaje supervisado utiliza datos etiquetados para entrenar el modelo. Pero, ¿qué significa eso en teoría? Veamos algunos ejemplos para comenzar.

Con el aprendizaje supervisado, el modelo recibe tanto entradas como salidas correspondientes. Supongamos que estamos entrenando al modelo para identificar y clasificar diferentes tipos de frutas. En este ejemplo, proporcionará varias imágenes de frutas como entrada, junto con su perfil de forma, tamaño, color y sabor. A continuación, proporcionará al modelo los nombres de cada fruta como salida.

Eventualmente, el algoritmo recogerá un patrón entre las características de las frutas (las entradas) y sus nombres (las salidas). Una vez que esto sucede, el modelo puede recibir una nueva entrada y predecirá la salida por usted. Este tipo de aprendizaje supervisado, llamado clasificación , es el más común .

Cómo funciona el aprendizaje automático no supervisado

Por el contrario, el aprendizaje no supervisado funciona enseñando al modelo a identificar patrones por sí mismo (por lo tanto, no supervisado ) a partir de datos no etiquetados. Esto significa que se proporciona una entrada, pero no una salida.

Para entender cómo funciona esto, continuemos con el ejemplo de la fruta anterior. Con el aprendizaje no supervisado, proporcionará al modelo el conjunto de datos de entrada (las imágenes de las frutas y sus características), pero no proporcionará la salida (los nombres de las frutas).

El modelo utilizará un algoritmo adecuado para entrenarse a sí mismo para dividir las frutas en diferentes grupos según las características más similares entre ellos. Este tipo de aprendizaje no supervisado, llamado agrupación , es el más común.

¿Necesita ejecutar los dos modelos de aprendizaje automático una vez más? Echa un vistazo a este breve vídeo para obtener una explicación de alto nivel:

¿Cuándo se debe utilizar el aprendizaje supervisado frente al aprendizaje no supervisado?

Si debe usar el aprendizaje supervisado o no supervisado depende de sus objetivos y la estructura y el volumen de los datos que tiene disponibles. Antes de tomar una decisión, haga que su científico de datos evalúe lo siguiente:

¿Los datos de entrada son un conjunto de datos etiquetado o no etiquetado? Si no está etiquetado, ¿su equipo puede respaldar el etiquetado adicional?
¿Cuál es la meta que quieres lograr? ¿Está trabajando con un problema recurrente bien definido o el algoritmo deberá predecir nuevos problemas?
¿Existen algoritmos que admitan su volumen y estructura de datos? ¿Tienen la misma dimensionalidad que necesita (número de características o atributos)?

Cuándo usar el aprendizaje automático supervisado

Según Gartner, el aprendizaje supervisado es el tipo de aprendizaje automático más popular y utilizado en escenarios comerciales. Probablemente esto se deba a que, aunque la clasificación de big data puede ser un verdadero desafío en el aprendizaje supervisado, los resultados son muy precisos y confiables (la fuente completa está disponible para los clientes).

Estos son algunos ejemplos de casos de uso para el aprendizaje supervisado. Algunos son específicos de la industria, mientras que otros pueden aplicarse a cualquier organización:

Identificación de factores de riesgo de enfermedades y planificación de medidas preventivas
Clasificar si un correo electrónico es spam o no
Predecir los precios de la vivienda
Predecir la rotación de clientes
Predicción de precipitaciones y condiciones meteorológicas
Averiguar si un solicitante de préstamo es de bajo o alto riesgo
Predicción del fallo de piezas mecánicas en motores de automóviles
Predecir las puntuaciones de participación en las redes sociales y las puntuaciones de rendimiento

Wood compartió con nosotros un ejemplo de cómo usó el aprendizaje supervisado para construir un sistema de clasificación para los correos electrónicos entrantes de un cliente. Con la ayuda de un sistema CRM, los correos electrónicos se categorizaron en grupos que representaban consultas comunes (p. ej., cambio de dirección del cliente, quejas). Wood luego usó estas categorías para entrenar un modelo de modo que cuando reciba un nuevo correo electrónico entrante, sepa a qué categoría asignar ese correo electrónico. Él dice:

“El aprendizaje supervisado fue posible en este caso gracias a la presencia del sistema CRM que proporcionó un conjunto de 'etiquetas' para entrenar el modelo. Sin estos, solo habría sido posible el aprendizaje no supervisado”.

¿Quieres limpiar tu bandeja de entrada? Comience con el software de CRM.

Cuándo usar el aprendizaje automático no supervisado

A diferencia del aprendizaje supervisado, el aprendizaje no supervisado puede manejar grandes volúmenes de datos en tiempo real. Y debido a que el modelo identificará automáticamente la estructura en los datos (clasificación), es útil en los casos en que un ser humano tendría dificultades para encontrar tendencias dentro de los datos por su cuenta.

Por ejemplo, si estuviera tratando de segmentar a los consumidores potenciales en grupos con fines de marketing, un método de agrupación en clústeres no supervisado sería un excelente punto de partida.

Estos son algunos ejemplos de casos de uso para el aprendizaje no supervisado:

Agrupación de clientes por su comportamiento de compra
Encontrar correlaciones en los datos de los clientes (por ejemplo, las personas que compran un bolso de cierto estilo también pueden estar interesadas en un cierto estilo de zapatos)
Segmentación de datos por historial de compras
Clasificar a las personas según diferentes intereses.
Agrupación de inventarios por métricas de fabricación y ventas

Wood nos explicó que una vez trabajó para una compañía farmacéutica con instalaciones de fabricación en todo el mundo. El software que usaba la empresa para registrar los errores que ocurrían en sus instalaciones no tenía un menú desplegable con opciones de errores comunes para elegir.

Debido a esto, los trabajadores de la fábrica documentaron los errores en texto sin formato (ya sea en inglés o en su idioma local). La empresa deseaba conocer las causas de los problemas comunes de fabricación, pero sin una categorización de los errores era imposible realizar un análisis estadístico de los datos.

Wood usó un algoritmo de aprendizaje no supervisado para descubrir puntos en común en los errores. Pudo identificar los temas más importantes y generar estadísticas, como desgloses de gráficos circulares de los problemas de fabricación comunes en la empresa. Madera dice:

"Esto le dio a la empresa una visión general de los problemas de su negocio que, de otro modo, habrían requerido un trabajo manual considerable".

Prepárese para un futuro inteligente: adopte el aprendizaje automático

El aprendizaje automático es una herramienta poderosa que puede ayudarlo a resolver problemas comerciales y tomar decisiones basadas en datos. Esperamos que este artículo le brinde algunas ideas sobre cómo se podría implementar el aprendizaje automático supervisado o no supervisado en su organización.

Si está listo para adoptar la tecnología de aprendizaje automático, sus próximos pasos deben ser evaluar las capacidades de su pila de software actual. Luego, solicite a su(s) proveedor(es) casos de uso de otros clientes en su industria que se alineen con las aplicaciones para las que le gustaría usar el aprendizaje automático.

¿Sientes que hay más que aprender? Consulta estas lecturas relacionadas de Capterra:

¿Qué es el aprendizaje automático? Su glosario esencial de inteligencia comercial
La guía inteligente para pequeñas empresas sobre el aprendizaje automático frente a la inteligencia artificial
Principales aplicaciones de inteligencia artificial para pequeñas empresas

Además, consulte el directorio de software de aprendizaje automático de Capterra, donde puede leer reseñas de usuarios reales y filtrar herramientas por precio o características.