Fundamentos de IA, ML y Deep Learning para gerentes de productos
-
21 de octubre de 2020

¿Qué es la IA?
En pocas palabras, la IA se utiliza para describir máquinas que imitan la inteligencia a nivel humano mientras realizan funciones cognitivas como el aprendizaje y la resolución de problemas.
El término se clasifica además en dos: "IA fuerte" - la descripción de la cultura pop de la IA donde las máquinas autosuficientes pueden realizar (e incluso superar) a los humanos en funciones cognitivas en tareas variadas y novedosas. Este es el objetivo a largo plazo que los informáticos quieren lograr y que ha mantenido a visionarios como Elon Musk preocupados por el futuro.
Esto es para diferenciarlo de "Narrow AI", que se refiere a sistemas diseñados para una tarea específica. Todas las herramientas de IA actuales son Narrow AI. Estos sistemas como Alpha Go (que venció al maestro chino de Go en 2017) pueden superar a los humanos, pero en tareas muy limitadas, como el complejo juego Go here.
Además, la mayoría de los sistemas de IA actualmente disponibles son esencialmente herramientas de predicción. Ayudan a predecir el resultado dado una determinada información. El modelo de IA toma datos y los usa para generar información relevante del pasado, presente y futuro. Por ejemplo: clasificar una transacción con tarjeta de crédito como fraudulenta, identificar anomalías en radiografías y resonancias magnéticas o recomendar lo que compraría, vería o escucharía en el futuro.
Finalmente, la IA se considera valiosa porque a menudo puede producir predicciones mejores, más rápidas y más baratas que los humanos. De hecho, ahora puede crear su propio software de inteligencia artificial, de manera más eficiente que un ingeniero humano.
¿Y cómo funciona? Aprendizaje automático de bienvenida
La mayoría de los potentes sistemas de inteligencia artificial de la actualidad funcionan con algoritmos de aprendizaje automático. ML es el campo derivado de la ciencia de datos y la informática que permite a las computadoras aprender y realizar tareas sin estar programadas explícitamente para cada regla de decisión.
En pocas palabras, cada modelo de ML utiliza tres tipos de datos:
- datos de entrenamiento para entrenar la IA
- datos de entrada que realizan predicciones en tiempo real
- datos de retroalimentación para mejorar la precisión de predicción de la IA.
Por ejemplo, la IA de imágenes médicas de detección de anomalías se entrena primero en imágenes bien clasificadas de pulmones categorizados como con / sin cáncer de pulmón. Una vez que la máquina aprende la diferencia entre pulmones sanos y pulmones cargados de cáncer, el sistema se pone en producción para predecir si un pulmón no clasificado tiene cáncer o no. Luego, el médico verifica esta información y la IA luego obtiene retroalimentación si realizó la predicción con precisión o no. Si no es así, modifica su propio conjunto de reglas de clasificación.
Las diferentes caras de la IA
Una vez que comience a leer sobre AI / ML, se confundirá con términos variados: procesamiento del lenguaje natural (NLP), redes neuronales, aprendizaje profundo (DL), etc. Si bien las demarcaciones aún no están muy claras, todos estos son un subcampo del aprendizaje automático.
Pero primero, hablemos primero de categorías amplias de AA (ML):
1. Aprendizaje supervisado: en esto, el sistema cuenta con pares de datos de AB claramente etiquetados. Luego, el modelo ML se entrena con estos datos para que pueda establecer una relación causal entre A y B. Una vez perfeccionado, el sistema puede predecir A dado B o viceversa. Se usa comúnmente para problemas de clasificación. Una aplicación diaria de SL es clasificar un correo electrónico entrante como spam o no.
2. Aprendizaje no supervisado: como sugiere el nombre: aquí, a la computadora se le proporcionan datos sin etiquetar y luego se le pide que identifique por sí misma patrones y relaciones inherentes, a diferencia de SL, donde los datos de capacitación están etiquetados por humanos de antemano. Es útil porque, en muchos casos, obtener datos etiquetados a menudo es difícil, costoso y / o requiere mucho tiempo.
Su principal aplicación es la agrupación en clústeres. El análisis de clústeres es el proceso de agrupar datos en diferentes segmentos según las similitudes identificadas por el modelo ML. Un ejemplo bien conocido de agrupación es la identificación de noticias falsas. El modelo ML examina las palabras utilizadas en un artículo y luego las agrupa, lo que ayuda a determinar qué piezas son genuinas y cuáles son noticias falsas.
3. Aprendizaje semi-supervisado: en el mundo real, la mayoría de los conjuntos de datos contienen ruido, emparejamientos incorrectos, una gran cantidad de variables sin etiquetar y un pequeño conjunto de variables bien etiquetadas. Por lo tanto, el aprendizaje semi-supervisado utiliza datos etiquetados y no etiquetados para mejorar la precisión del modelo de aprendizaje. De hecho, la mayoría de los modelos ML en el entorno de producción utilizan una técnica semi-supervisada. Los ejemplos comunes son los sistemas de recomendación, que agrupan a los usuarios en función de sus hábitos de compra similares (artículos, música, películas) y le brindan nuevas sugerencias.
4. Aprendizaje por refuerzo: se trata de aprender de los errores. Aquí, el sistema usa prueba y errores para lograr un objetivo bien definido (maximizar la recompensa) en un entorno dinámico. Influenciado desde el campo de la neurociencia y la psicología, este sistema ML está construido de tal manera que asocia el buen comportamiento con recompensas positivas y el mal comportamiento con negativo, de manera que podamos hacer cumplir el modelo de IA para tomar decisiones "buenas", definiendo lo bueno por el programador.
El algoritmo ( agente ) evalúa una situación actual ( estado ), toma una acción y recibe retroalimentación ( recompensa ) del entorno después de cada acto.
El aprendizaje por refuerzo es la técnica de aprendizaje automático más utilizada y ahora emplea principalmente modelos de aprendizaje profundo.
Un ejemplo del día a día: Recomendación de noticias . A diferencia de los artículos y películas, etc., que están claramente etiquetados por la propia plataforma (Amazon, Netflix, por ejemplo), los artículos de noticias son dinámicos por naturaleza y rápidamente se vuelven irrelevantes. Las preferencias del usuario en los temas también cambian. Aquí, RL proporciona una mayor precisión que SL o USL.
Para comprender mejor RL, tome el caso del comercio impulsado por ML. Aquí, los modelos de aprendizaje por refuerzo actúan en un entorno dinámico del mercado de valores con el objetivo de obtener grandes beneficios (comparados con el índice del mercado). El sistema es recompensado por cada operación rentable y castigado por una que genera pérdidas. A través de varias pruebas y errores, el sistema aprende a superar al mercado y a hacerlo mejor que los comerciantes humanos.
Los campos modernos de vehículos autónomos / autónomos y robótica están impulsados por RL. ¿Has visto una película en blanco y negro restaurada en formato de color? Eso es Aprendizaje por refuerzo profundo (DRL) trabajando para usted. De hecho, DRL tiene la capacidad de generar incluso música original.
Esta bien. ¡Pero qué es aprendizaje profundo, redes neuronales y PNL!
Por supuesto, todos los PM sienten curiosidad por comprender estos temas candentes. Desde chatbots hasta la interfaz cerebro-computadora, están afectando a casi todas las industrias, incluidas las que hasta ahora no se han visto afectadas, como la galería de arte de IA y el descubrimiento de fármacos.
El aprendizaje profundo es un subcampo de ML que se ocupa de algoritmos inspirados en la estructura y función del cerebro. Por lo tanto, las redes neuronales artificiales (ANN) son esencialmente el sistema / arquitecturas informáticas que ayudan a realizar el acto de aprendizaje profundo. Las redes neuronales se clasifican además en redes neuronales profundas , redes neuronales recurrentes y redes neuronales de convolución. Pero por nuestra propia cordura, no nos confundamos.
El Deep Learning puede ser supervisado, no supervisado o reforzado.
Los modelos DL funcionan en capas ANN. A cada capa se le asigna una parte específica de una tarea, y los datos pueden atravesar las capas varias veces para refinar y optimizar el resultado final. Estas capas "ocultas" realizan las tareas algorítmicas que convierten la entrada no etiquetada y no estructurada en una salida significativa.
Las tres capas son: -
Entrada capa de datos de entrada para la - red neuronal .
Ocultos capas - intermedio capa entre la entrada y la salida de la capa donde se realiza todos los cálculos.
Capa de salida : produce el resultado para las entradas dadas.
Pero, ¿por qué Deep Learning? Simplemente porque, los modelos DL superan a los modelos ML tradicionales en precisión y predicción una vez que se alcanza una cantidad umbral de entrada de datos.
El diferenciador clave entre ML y DL es el concepto de extracción de características (FE), el concepto más difícil de enseñar en el campo de la IA a un novato.
En pocas palabras, todos los datos del mundo real consisten en ruido o características redundantes. Por ejemplo, una foto de un automóvil también consta de otros objetos como cielo, árbol, camino, edificios, etc. en el fondo e incluso en primer plano.
Los modelos DL reducen todo el conjunto de características para determinar un subconjunto de características relevantes que contienen la información requerida, de modo que la tarea deseada se pueda realizar utilizando esta representación reducida en lugar de los datos iniciales completos. La extracción de características la realiza un humano en el aprendizaje automático, mientras que el modelo de aprendizaje profundo se resuelve por sí mismo.
Si bien los modelos de aprendizaje profundo superan a otras técnicas de aprendizaje automático, existen limitaciones , ya que requieren un gran volumen de datos, una potencia informática significativa y un entrenamiento sólido de conjuntos de datos.
Finalmente, Deep Learning encuentra sus aplicaciones en una amplia variedad de campos que incluyen visión por computadora , visión artificial , reconocimiento de voz , procesamiento del lenguaje natural (NLP) , reconocimiento de audio , entre otros.
Una de las áreas de uso más populares de DL / NLP es la búsqueda por voz y los asistentes inteligentes activados por voz. Xbox, Skype, Google Now y Siri de Apple están empleando tecnologías DL en sus sistemas para reconocer el habla humana y los patrones de voz.
Las redes neuronales , componente central de DL, son fundamentales para la PNL, lo que ayuda a las computadoras a procesar y analizar una gran cantidad de datos del lenguaje humano. Ayudan a mejorar la traducción automática , el análisis de sentimientos y la recuperación humana. El famoso ejemplo es Google Translate. También están detrás del ambicioso objetivo a largo plazo de los chatbots : reemplazar a los humanos por completo y realizar un flujo natural de conversación similar a la humana.
Además, DL ha revolucionado el campo de la visión por computadora , ya que el reconocimiento de imágenes basado en DL produce resultados más precisos que los participantes humanos. Proporciona a los sistemas informáticos la capacidad de identificar objetos, lugares, personas, escritura y acciones en imágenes. El controvertido ejemplo es la detección y vigilancia de rostros.
Y predicciones . Los modelos DL superan al ML en todos los tipos posibles de predicciones. Desde la predicción de terremotos hasta ataques cardíacos y precios de las acciones, DL permite tomar decisiones de calidad en un entorno dinámico.
El objetivo de este artículo era proporcionar una comprensión fundamental de la IA y la jerga que la rodea. ¡Tenemos la intención de que esto sea solo un punto de partida para su largo y aventurero viaje en el campo! ¡La mejor de las suertes!