Unidad 1.1. Panorama y conceptos
Attention is All You Need
2017 Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser y Illia Polosukhin
Equipo de investigación de Google
CONTENIDOS
Introducción
La cita inicial da título al artículo que en 2017 supuso el nacimiento de todo el boom de aplicaciones y sistemas de IA que hoy en día inundan las redes y tanto impacto están teniendo en todos los sectores económicos y sociales.
Presentó la arquitectura de red neuronal conocida como "Transformer", la cual se ha convertido en la base para muchos desarrollos posteriores en el campo del procesamiento del lenguaje natural (NLP) y, dentro del mismo en la llamada IA Generativa, base de casi todas las aplicaciones de IA que veremos en el curso.
Es además una sentencia muy relacionada con la educación pues sintetiza y expresa la premisa más importante para cualquier alumno que quiera aprender, a saber, la actitud o la atención hacia los temas de estudio. De manera que es perfecta para iniciar este curso en dos temas de gran impacto y relevancia social, como son la IA y la educación.
La llamada IA ha irrumpido abruptamente en el mundo a todos los niveles. Desde que, en 2017 investigadores de Google publicaran el mencionado artículo 'Attention is all you need' el desarrollo y difusión de sistemas de procesamiento del lenguaje natural (NLP) ha sido imparable, liderado por la empresa OpenAI, pero también por otras como DeepMind o Anthropic y por supuesto Microsoft y el propio Google (Bard).
Pero su desarrollo lleva mucho más tiempo, desde siempre el ser humano ha querido construir máquinas que imiten su inteligencia, empezando por dispositivos automáticos y continuando con sistemas de generación de lenguaje y en general el desarrollo de tecnologías procesamiento del lenguaje natural, subcampo de estudio dentro de la IA en general y en particular del llamado Deep Learning o aprendizaje profundo.
Es un camino plagado de fracasos y euforia puntual que sólo recientemente ha culminado en una adopción masiva y un impacto relevante en todos los sectores económicos y sociales.
Finalmente y desde hace algo más de un año los sistemas de procesamiento de lenguaje natural (NLP) y la inteligencia artifical generativa han permitido llevar la IA a todos los ámbitos con éxito creciente. También la robótica y la propia biología (edición genéticao CRISPR, órganos sintétitcos, integración hombre-máquina) han experimentado un cambio sensible en sus posibilidades.
Todo esto hace que el campo de la IA por fín sea el más popular y aplicado en todo el mundo y en todas las empresas y organizaciones.
Los usos y aplicaciones son crecientes y se amplían a diario. También las amenazas están ahí en cuanto al mal uso y las implicaciones en cuanto a privacidad de la información y su utilización ilícita.
Sin embargo debemos asumir y asimilar su existencia y promover el uso ético y estético de estas tecnologías que de manera inevitable van a estar cada vez más presentes en nuestras vidas.
En este curso trataremos de dar una visión completa de todo el ecosistema de la IA abarcando la evolución histórica, los fundamentos que la sustentan y las principales aplicaciones, siempre haciendo especial hincapié en el lado educativo.
Pero no solo eso, también queremos tratar temas más avanzados y tratar el impacto socioeconómico de la IA asi como las consideraciones éticas.
Para empezar el curso introducimos algunos conceptos importantes además de una relación de tecnologías y empresas más importantes en el panorama actual
Conceptos Asociados a la Inteligencia Artificial (IA)
Inteligencia: Es la capacidad de entender, aprender, razonar, tomar decisiones y formar una idea determinada de la realidad.
Artificial: Se refiere a sistemas diseñados para imitar o replicar la inteligencia humana.
Tipos de IA:
- IA Débil (o Estrecha): Especializada en una tarea específica. Ejemplo: Siri.
- IA General: Puede aprender y realizar cualquier tarea intelectual que un ser humano pueda hacer.
- IA Superinteligencia: Supera la inteligencia humana en casi todos los campos.
Tecnologías Relevantes de IA:
-
Aprendizaje Automático (Machine Learning): Técnicas que permiten a las máquinas aprender de datos.
-
Aprendizaje Profundo (Deep Learning): Uso de redes neuronales con múltiples capas para procesar grandes conjuntos de datos.
-
Redes Neuronales Convolucionales (CNN): Especialmente diseñadas para el procesamiento de imágenes.
-
Procesamiento del Lenguaje Natural (NLP): Tecnología que permite a las máquinas leer y comprender el lenguaje humano.
-
Algoritmos de Reforzamiento (Reinforcement Learning): Donde los modelos aprenden a tomar decisiones basadas en recompensas.
-
Visión por Computadora: Permite a las máquinas interpretar y tomar decisiones basadas en imágenes o video.
-
Robótica Autónoma: Robots que pueden aprender y operar en su entorno sin intervención humana.
-
Sistemas de Recomendación: Algoritmos que sugieren productos o contenidos a los usuarios.
-
Redes Generativas Adversarias (GANs): Usadas para generar contenido, como imágenes o texto, que es indistinguible del contenido creado por humanos.
-
Reconocimiento de Voz: Tecnología que convierte la voz en texto y viceversa, permitiendo la interacción verbal con dispositivos.
-
Mecanismos de Atención: Como el modelo "Transformer", que ha revolucionado el NLP con su enfoque "Attention is All You Need".
Principales empresas desarrolladoras y productos de IA:
- Google: Chat de Google Google Bard y ecosistema de IA Deep Mind
- IBM: Tiene chat propio y generador de chatbots IBM Watson Asistente propio y Generador de modelos propios
- Facebook: AI Meta - Entorno para el uso de herramientas de IA y el modelo open source Llama
- Microsoft: Microsoft Copilot - Copilot o asistente de IA de Microsoft y otras soluciones de IA
- Anthropic: Asistente de Chat y Constructor de chatbots Anthropic
- OpenAI: Conocida por modelos como GPT-3/4 OpenAI
- Grok de X Empresa X, antigua Twitter Grok
Sectores más afectados:
- Salud: Diagnóstico y tratamiento personalizado. Ejemplo: IBM Watson Health para análisis genómico.
- Finanzas: Detección de fraudes y asesores financieros automatizados. Ejemplo: Chatbots de atención al cliente en bancos.
- Automoción: Vehículos autónomos. Ejemplo: Tesla con su piloto automático.
- Retail: Personalización de la experiencia del cliente. Ejemplo: Recomendaciones personalizadas en Amazon.
- Educación: Herramientas de tutoría personalizada, chatbots educativos. Ejemplo: Plataformas de aprendizaje adaptativo como DreamBox