Contenido Exclusivo

Nueve mitos acerca del machine learning

El aprendizaje automático o machine learning está resultando tan útil que es tentador suponer que puede resolver todos los problemas y que se aplica a todas las situaciones. Pero al igual que cualquier otra herramienta, resulta útil en áreas específicas, especialmente para problemas que usted siempre había tenido, pero sabía que nunca podría contratar a suficientes personas para resolverlo, o para problemas con un objetivo claro, aunque sin un método obvio para lograrlo.

Aun así, es probable que todas las organizaciones aprovechen el aprendizaje automático de una manera u otra, ya que el 42% de los ejecutivos le dijeron recientemente a Accenture que esperan que la Inteligencia Artificial (AI) esté detrás de todas sus nuevas innovaciones para 2021.

Sin embargo, usted obtendrá mejores resultados si mira más allá la exageración y evita estos mitos sobre lo que el aprendizaje automático puede o no puede ofrecer.

Mito 1: el aprendizaje automático es IA

El aprendizaje automático y la inteligencia artificial se usan frecuentemente como sinónimos, pero si bien el aprendizaje automático es la técnica más exitosamente lograda en los laboratorios de investigación en el mundo real, AI es un campo amplio que abarca áreas como la visión artificial, la robótica y el procesamiento del lenguaje natural, así como enfoques tales como la satisfacción de restricciones que no involucran el aprendizaje automático.

Mito 2: todos los datos son útiles

Usted requiere datos para el aprendizaje automático, pero no todos los datos son útiles para el machine learning. Para entrenar su sistema, necesita datos representativos que cubran los patrones y resultados que su sistema de aprendizaje automático deberá manejar.

En efecto, necesita datos que no tengan patrones irrelevantes incluidos. Todos los datos que utiliza para la capacitación deben estar bien etiquetados y con las características que coinciden con las preguntas que le hará al sistema de aprendizaje automático, lo cual requiere mucho trabajo.

No suponga que los datos que ya tiene son limpios, claros, representativos o fáciles de etiquetar.

Mito 3: siempre necesitas mucha información

machine-learning-manoLos principales avances realizados recientemente en los campos del reconocimiento de imágenes, la comprensión de lectura de máquina, la traducción de idiomas y otras áreas han sucedido gracias a mejores herramientas, hardware informático como GPU que pueden procesar grandes cantidades de datos en paralelo y grandes conjuntos de datos etiquetados, incluyendo ImageNet y el Stanford Question Answering Dataset.

Pero gracias a un truco llamado “aprendizaje por transferencia”, no siempre se necesita un gran conjunto de datos para obtener buenos resultados en un área específica; en su lugar, puede enseñarle a un sistema de aprendizaje automático cómo aprender utilizando un gran conjunto de datos y luego hacer que transfiera esa capacidad para aprender a su propio conjunto de datos de entrenamiento mucho más pequeño.

Mito 4: Cualquiera puede construir un sistema de aprendizaje automático

Hay muchas herramientas y marcos de código abierto para el aprendizaje automático e innumerables cursos que le muestran cómo usarlos. Sin embargo, el machine learning sigue siendo una técnica especializada; necesita saber cómo preparar datos y particionarlos para el entrenamiento y pruebas, necesita saber cómo elegir el mejor algoritmo y qué heurística usar con él, y cómo convertirlo en un sistema confiable en producción. También necesita monitorizar el sistema para asegurarse de que los resultados sigan siendo relevantes a lo largo del tiempo.

Mito 5: todos los patrones en los datos son útiles

Los modelos de “caja negra” son eficientes, pero no dejan en claro qué patrón han aprendido. Los algoritmos más transparentes e inteligibles, como los Modelos Aditivos Generalizados, aclaran lo que el modelo ha aprendido para que pueda decidir si es útil implementarlos.

Mito 6: el aprendizaje de refuerzo está listo para usar

Prácticamente todos los sistemas de aprendizaje automático en la actualidad usan aprendizaje supervisado; en la mayoría de los casos, están entrenados en conjuntos de datos claramente etiquetados que los humanos han estado involucrados en la preparación. La conservación de estos conjuntos de datos requiere tiempo y esfuerzo, por lo que hay mucho interés en las formas de aprendizaje no supervisadas, especialmente el aprendizaje reforzado (RL), donde un agente aprende por ensayo y error interactuando con su entorno y recibiendo recompensas por el comportamiento correcto.

Mito 7: el aprendizaje automático es imparcial

Debido a que el aprendizaje automático aprende de los datos, replicará cualquier sesgo en el conjunto de datos. Un sistema de aprendizaje automático también puede agregar un sesgo a otro. Entrenar un sistema de aprendizaje automático con marcos populares para representar palabras como vectores que muestran las relaciones entre ellos y aprenderá estereotipos.

Es importante conocer los problemas de sesgo en el aprendizaje automático. Si usted no puede eliminar el sesgo en su conjunto de datos de entrenamiento, use técnicas como regularizar las asociaciones de género entre pares de palabras para reducir el sesgo o agregar elementos no relacionados a las recomendaciones para evitar el ‘filtro burbuja’.

Mito 8: el aprendizaje automático sólo se usa para bien       

El aprendizaje automático potencia las herramientas antivirus, observa el comportamiento de los nuevos ataques para encontrarlos tan pronto como se lanzan. Pero a la par, los piratas informáticos están utilizando el aprendizaje automático para probar las defensas de las herramientas antivirus, así como para crear ataques de phishing a escala, mediante el análisis de grandes cantidades de datos públicos o analizando cuán exitosos fueron los intentos previos de phishing.

Mito 9: el aprendizaje automático reemplazará a las personas

Es común preocuparse de que la inteligencia artificial quite empleos. Lo que hará en realidad será cambiar los trabajos que hacemos y cómo los hacemos, ya que los sistemas de aprendizaje automático mejoran la eficiencia y el cumplimiento y reducen los costos. A la larga, creará nuevos roles en el negocio y hará que algunas posiciones actuales se vuelvan obsoletas.

Pero muchas de las tareas que automatiza el aprendizaje automático simplemente no eran posibles antes, debido a la complejidad o escala. Por ejemplo,  no podría contratar suficientes personas para mirar cada fotografía publicada en las redes sociales para ver si presenta su marca.

El aprendizaje automático ya ha comenzado a crear nuevas oportunidades comerciales –tal como sucedió con las generaciones anteriores a la automatización– y puede liberar empleados para utilizar su experiencia y creatividad.

Mary Branscombe

Lo Más Reciente

La digitalización ofrece mejoras en la gestión de casos en el sector público

Los factores macroeconómicos globales y locales que cambian rápidamente,...

Cómo impulsar el crecimiento de las empresas en la era de la IA

La inteligencia artificial está revolucionando los negocios. Sin embargo,...

Realizan el segundo Foro de Talento en Data Centers

La Asociación Mexicana de Data Centers, MEXDC, realizó el...

Newsletter

Recibe lo último en noticias e información exclusiva.

José Luis Becerra Pozas
José Luis Becerra Pozashttps://iworld.com.mx
Es Editor de CIO Ediworld México. Contáctalo en jbecerra@ediworld.com.mx o en el twitter @CIOMexico.

La digitalización ofrece mejoras en la gestión de casos en el sector público

Los factores macroeconómicos globales y locales que cambian rápidamente, siguen ejerciendo una presión cada vez mayor sobre el sector público de México. El gobierno...

Cómo impulsar el crecimiento de las empresas en la era de la IA

La inteligencia artificial está revolucionando los negocios. Sin embargo, muy pocos empresarios están adaptando sus empresas a este contexto, para lograr un crecimiento. Para...

Chivas Rayadas del Guadalajara consigue gestionar sus activos de TI de manera más eficiente

El Club Deportivo Guadalajara es uno de los más importantes en México. Con más de 500 colaboradores, requería herramientas para auditar su parque informático,...