Skip to main content

1.3 Plataformas y herramientas

En los últimos años ha habido un desarrollo exponencial de tecnologías vinculadas a la IA en todos los niveles y ámbitos profesionales

Este curso pretende dar una visión completa de las mismas e iniciar al alumno en un uso más profundo y flexible de la IA para adaptarla a sus necesidades y reducir la dependencia.

Aunque se habla de python y librerías asociadas no es en absoluto la idea del curso aprender a programar pero sí ofrecer dicha posibilidad a los alumnos que quieran introducirse en el tema.

EnA esta seccióncontinuación mostramos las principales y más populares plataformas y tecnologíastecnologías. Todas ellas se usan en todo el mundo como referencia y base de pruebas y aprendizaje de IA con modelos y conjuntos de datos propios y ajenos

Modelos de IA:

Entre los modelos de IA más populares se pueden distinguir varios grupos según el tipo de información que procesan y su aplicación principal.

Modelos de lenguaje (LLM)

Están diseñados para comprender y generar texto. Se utilizan en asistentes conversacionales, generación de contenido, programación asistida, traducción o análisis de documentos.
Ejemplos representativos:

  • GPT (OpenAI): base de muchos sistemas conversacionales.

  • BERT (Google): muy utilizado en comprensión del lenguaje y buscadores.

  • LLaMA (Meta): modelo abierto que ha impulsado el ecosistema open source.

  • Mistral, Qwen o Phi: modelos más ligeros que permiten ejecutar IA en local.

Modelos de visión por computador

Están diseñados para analizar imágenes o vídeo. Permiten tareas como reconocimiento de objetos, clasificación de imágenes o detección de patrones visuales.
Ejemplos:

  • CNN (Convolutional Neural Networks): arquitectura clásica para reconocimiento de imágenes.

  • Vision Transformers (ViT): aplican la arquitectura transformer al análisis visual.

  • Modelos de IAdifusión (como Stable Diffusion): generan imágenes a partir de texto.

Modelos de audio y voz

Procesan sonido o lenguaje hablado. Se utilizan para reconocimiento de voz, síntesis de voz o generación de música.
Ejemplos destacados:

  • Whisper (OpenAI): transcripción automática de voz a texto.

  • WaveNet (DeepMind): generación de voz natural.

  • MusicGen o AudioLM: Incluyengeneración grandesde música o audio mediante IA.

Modelos multimodales

Estos modelos lingüísticospueden combinar varios tipos de datos (LLM)texto, paraimagen, audio, etc.). Permiten tareas como describir imágenes, responder preguntas sobre vídeos o interactuar con distintos tipos de contenido al mismo tiempo.
Ejemplos:

  • CLIP (OpenAI): relaciona texto (GPT,e BERT,imágenes.

    etc.),
  • LLaVA: integra modelos de visión (CNN, Diffusion)lenguaje y modelosvisión.

    multimodales
  • Gemini o GPT multimodal: capaces de trabajar con múltiples modalidades de información.

Sistemas avanzados basados en LLM: agentes de IA

Una evolución reciente son los agentes de inteligencia artificial, que combinanutilizan texto e imagen. Los modelos fundacionalesde sonlenguaje gigantescascomo redesnúcleo pre-entrenadasde razonamiento pero además pueden planificar tareas, usar herramientas externas y ejecutar acciones.

Cuando varios agentes especializados colaboran dentro de un mismo sistema coordinado se habla de orquestación de agentes, una de las tendencias más recientes en datosel masivosdesarrollo de aplicaciones avanzadas de inteligencia artificial.

Plataformas de desarrollo y pruebas de modelos

Existen diferentes tipos de plataformas para trabajar con inteligencia artificial, que luegovan sedesde adaptan a tareas específicas (mediante fine-tuning).

  • Plataformas: Hay entornos colaborativos en la nube hasta herramientas que permiten ejecutar modelos de forma local.

    Plataformas de modelos y repositorios de IA

    Son espacios donde investigadores y desarrolladores publican modelos, datasets y demos listas para usar.
    Ejemplos:

    • Hugging Face: uno de los mayores repositorios de IA del mundo, con millones de modelos, datasets y demos interactivos (Spaces).

    • ModelScope o repositorios similares: plataformas que permiten descargar y probar modelos abiertos.

    Frameworks para construir aplicaciones con LLMs

    Facilitan la creación de aplicaciones complejas combinando modelos, bases de datos y herramientas locales.externas.
    Ejemplos:

    Ejemplos
      destacados
    • LlamaIndex: sonespecializado Huggingen Faceintegrar (repositoriodatos propios con modelos de 2Mlenguaje.
    • modelos,
    • demos

      LangChain: y Spaces de IA), LangChain (framework depara encadenado deconectar LLMs con fuentes de datos),datos, APIs o bases de conocimiento.

    •  

      image.png

      Vista de la web de lancghain para programar, explorar y probar modelos
    Entornos de desarrollo en la nube

    Permiten experimentar con IA sin instalar nada en el ordenador, usando notebooks con acceso a GPU o TPU.
    Ejemplos:

    • Google Colab: ynotebooks Kagglede Notebooks (JupyterPython en la nube con GPU/TPUacceso gratuitas),sencillo serviciosa MLGPUs.

    • Kaggle Notebooks: entorno similar, muy utilizado en ciencia de datos y competiciones de IA.

    Plataformas empresariales comode Machine Learning

    Ofrecen infraestructuras completas para entrenar, desplegar y gestionar modelos de IA en producción.
    Ejemplos:

    • AWS SageMaker: oentorno Azurede ML (notebooks integradosdesarrollo y despliegue de modelos en producción),la nube de Amazon.

    • Azure Machine Learning: plataforma de Microsoft para crear y aplicacionesoperar sistemas de IAIA.

      local
    • como
    Ollama o LM Studio (herramientas gratuitas
    Plataformas para correrejecutar LLMsIA open-en local

    Permiten trabajar con modelos abiertos sin depender de servicios en la nube, lo que mejora la privacidad y el control de datos.
    Ejemplos:

    • Ollama: herramienta sencilla para ejecutar modelos open source en PCs).el Laordenador.

      librería
    • LM Studio: interfaz gráfica para descargar y usar LLMs locales.

    Motores de inferencia optimizados

    Son herramientas especializadas para ejecutar modelos grandes de forma eficiente.
    Ejemplos:

    • vLLM destaca como: motor optimizado para servir LLMs con altaalto eficienciarendimiento y bajo consumo de memoriamemoria, muy utilizado en servidores de IA.

    En conjunto, estas plataformas permiten experimentar, desarrollar y rendimiento.

  • desplegar
  • Librerías: Las más usadas incluyen PyTorch (“biblioteca optimizadaaplicaciones de tensoresinteligencia artificial, tanto en entornos educativos y de investigación como en sistemas profesionales a gran escala.

    Técnicas clave

    El uso práctico de los modelos de inteligencia artificial no depende solo del modelo en sí, sino también de una serie de técnicas que permiten adaptarlos, controlarlos o integrarlos con datos propios.

    Prompting (ingeniería de instrucciones)

    Consiste en formular correctamente las instrucciones que se dan al modelo para DLobtener enmejores GPU/CPU”)resultados. Incluye técnicas como zero-shot prompting (pedir una tarea directamente sin ejemplos), TensorFlowfew-shot prompting (plataformamostrar algunos ejemplos para guiar la respuesta) y chain-of-thought prompting, donde se pide al modelo que razone paso a paso para mejorar la calidad de Googlela pararespuesta.

    crear modelos ML ejecutables en cualquier entorno) y Scikit-learn
    RAG (bibliotecaRetrieval-Augmented PythonGeneration)

    Es una técnica que permite a un modelo consultar información externa antes de MLgenerar tradicionalla pararespuesta. regresión,En clasificación, clustering, etc.lugar de códigodepender abierto).

  • solo
  • Técnicasde clave:lo RAGaprendido (Generacióndurante Aumentadael conentrenamiento, Recuperación)el combinamodelo LLMspuede conbuscar búsquedasinformación en bases de datos, documentos o repositorios y utilizar esos datos externascomo paracontexto. anclarSe lasutiliza respuestascon frecuencia en informaciónsistemas actualizada.de Elconsulta fine-sobre documentos, asistentes empresariales o aplicaciones de “hablar con tus datos”.

    Fine-tuning es(ajuste reentrenarfino)
    parcialmente

    Consiste en volver a entrenar un modelo pre-entrenadofundacional utilizando datos específicos para especializarlo en datosuna específicos.tarea Promptconcreta. engineeringPor ejemplo, un modelo general puede ajustarse con documentos médicos, legales o educativos para mejorar su precisión en ese ámbito.

    Embeddings y búsqueda semántica

    Los modelos pueden transformar textos en representaciones numéricas llamadas embeddings que capturan el significado del contenido. Esto permite realizar búsquedas semánticas, encontrar documentos relacionados o agrupar información similar aunque no contengan exactamente las mismas palabras.

    Uso de herramientas externas

    Los modelos pueden conectarse con APIs, bases de datos, buscadores o programas externos para ampliar sus capacidades. De esta forma pueden consultar información actualizada, realizar cálculos o ejecutar acciones fuera del propio modelo.

    Agentes de inteligencia artificial y orquestación de agentes

    Una evolución reciente consiste en diseñarutilizar conlos cuidadomodelos lasde instrucciones al modelo. Métodos recienteslenguaje como LoRAagentes (Low-Rank Adaptation) añaden matricescapaces de planificar tareas, tomar decisiones y utilizar herramientas de forma autónoma. En sistemas más avanzados, varios agentes especializados pueden colaborar entre sí bajo rango a un LLM para adaptarlo con muy pocos parámetros (ganando eficienciasistema de memoria). En general, las aproximaciones PEFT (“Parameter-Efficient Fine-Tuning”) ajustan solo unos pocos parámetros extra del modelo, congelando el resto,coordinación, lo que reducese drásticamenteconoce loscomo costosorquestación de cómputoagentes. yEste almacenamiento.

  • enfoque
  • permite construir aplicaciones de IA más complejas capaces de resolver tareas largas o procesos completos de trabajo.

    Infraestructura y hardware:

    Hay

    El aceleradores especializados para IA. GPUs (p.ej. NVIDIA H100/A100) son procesadores paralelos versátiles con gran memoria (80–141 GB)desarrollo y fuerte ecosistema (CUDA, PyTorch). TPUs (Google TPU v6e, etc.) son ASICsuso de tensor optimizados para cargassistemas de inferenciainteligencia enartificial nube:requiere p.ej.una v6einfraestructura ofreceinformática ~2 PFLOPS FP16 por ~$2.70/h, pero solo están en Google Cloud (Google Drive, Colab). NPUs (Unidadescapaz de Procesamientoprocesar Neural)grandes integradas en SoCs de móviles/PCs (por ejemplo, el Apple Neural Engine en iPhones/Mac) ofrecen muy alta eficiencia energética: la 5ª generación de Apple NPU alcanza ~15.8 TFLOPS FP16. FPGAs y ASICs (como Google Edge TPU) permiten IA embebida con baja latencia, aunque son menos flexibles y a menudo caros. Los aceleradores neuromórficos (Intel Loihi, IBM TrueNorth) son experimentales para IA inspirada en el cerebro. Cada hardware tiene su costo/rendimiento: las GPUs de consumo cuestan cientos de euros, TPUs cobran por hora en nube, NPUs vienen “incluidas” en dispositivos móviles, FPGAs/ASICs son especializados (educativamente poco comunes), etc.

  • Ejecución de modelos: Se puede en la nubeen local o en el edge. La nube (Colab, AWS, Azure) ofrece escalabilidad y cero instalación, pero implica costos y dependencia de Internet. En local (PC o servidores propios) hay más controlvolúmenes de datos y ceroejecutar latenciamodelos complejos. Dependiendo del tipo de red,aplicación, peroesta requiereinfraestructura disponerpuede ir desde ordenadores personales hasta centros de datos especializados.

    Procesadores especializados

    Los modelos de IA suelen ejecutarse en hardware adecuado.optimizado Enpara elcálculos edgeparalelos. Las unidades de procesamiento gráfico (móviles, IoT)GPU) se priorizahan rapidez y privacidad (los datos no salen del dispositivo). Por ejemplo, la startup española Multiverse destaca que ejecutar IAconvertido en el dispositivoestándar (“edge”)para mejora la eficiencia energéticaentrenar y laejecutar privacidad.

  • redes
  • Datos y conjuntos: La calidad de los datos es crucial. Existen repositorios abiertos (Hugging Face Datasets, Kaggle Datasets, conjuntos académicos como ImageNet, UCI, NOAA, etc.) en múltiples disciplinas. Hay que asegurar la ética (consentimiento de datos, evitar sesgos, transparencia) y cumplir normativas de gobernanza (GDPR en Europa, futuras leyes de IA).
  • Hugging Face

    Hugging Face ofrece el Model Hub, repositorio público con millones de modelos preentrenados (textuales, vision, multimodales) y conjuntos de datos. También proporciona Spaces, un directorio de aplicaciones de IA interactivas compartidas. La biblioteca Transformers de HF permite cargar, ajustar o servir estos modelos bajo PyTorch o TensorFlow. Por ejemplo, hay APIs para clasificación de texto, traducción, generación de imágenes, etc. HF dispone de planes gratuitos (por ejemplo: almacenar modelos públicos gratis) y servicios de inferencia pagos (~$0.033/hora por endpoint dedicado), lo cual se detalla en su página de precios. Esta plataforma es muy usada en investigación y educaciónneuronales, ya que facilitapueden accederrealizar a modelos sin grandes recursos propios.

    LangChain

    LangChain es un frameworkmiles de códigooperaciones abiertosimultáneamente. También existen otros aceleradores como las TPU (Python/JavaScript) diseñado para crear aplicaciones que combinan LLMs con fuentes de datos externas. Permite “encadenar” pasos: por ejemplo, recibe la consulta del usuario, la procesa o traduce si es necesario, luego realiza una búsqueda o recuperación de información relevante en bases de datos o documentos, y finalmente alimenta al LLM con ese contexto para generar una respuesta informada. Así, LangChain facilita construir agentes de IA o chatbots especializados (ej. un chatbot médico que primero busca en un repositorio de investigaciones antes de responder). Es modular y extensible, y su propósito educativo es mostrar cómo integrar datos reales en aplicaciones basadas en LLMs.

    Google Colab

    Google Colab es un servicio de notebooks Jupyter en la nube (no hay que instalar nada local) que combina código ejecutable, texto enriquecido e imágenes en un mismo documento. Proporciona un entorno “listo para usar” con Python y bibliotecas de ML preinstaladas, facilitando la colaboración entre usuarios (compartición de notebooks vía Google Drive). Una ventaja clave es que Colab regala cómputo acelerado: acceso gratuito a GPUs (por ejemplo NVIDIA Tesla T4) y TPUs (Google’s Tensor Processing Units). Estodesarrolladas permitepor entrenarGoogle o inferirlos modeloschips sinespecializados invertirpara IA integrados en hardwaredispositivos costoso.móviles.

    Colab tiene límites de uso (tiempo de sesión, RAM) en el plan gratuito,
    Servidores y ofrece versiones Pro de pago para mayor capacidad. Por su sencillez, es muy popular en educación científica, permitiendo a profesores y alumnos ejecutar experimentos de IA sin infraestructura local.

    Kaggle Notebooks

    Kaggle (plataforma de cienciacentros de datos de

    Las Google) también ofrece notebooks colaborativos en la nube. Al igualempresas que Colab,desarrollan proveenmodelos GPUsfundacionales gratuitassuelen (ej.utilizar NVIDIAgrandes Tesla P100) y un entorno de Python listo, pero están más orientados a análisis de datos (con acceso directo a datasets de la comunidad) y a la competencia en proyectos de ciencia de datos. Son gratuitos y fáciles de usar para docentes que guían prácticas de análisiscentros de datos con IA.

    miles

    AWSde SageMakerGPUs conectadas entre sí. Estas infraestructuras permiten entrenar modelos con billones de parámetros utilizando enormes cantidades de datos. Los centros de datos modernos también incluyen sistemas de almacenamiento de alto rendimiento y Azureredes ML

    de

    Sonalta serviciosvelocidad para mover grandes volúmenes de información entre máquinas.

    Computación en la nube

    Muchos proyectos de AWSinteligencia (Amazon)artificial yutilizan Microsoft respectivamente. Permiten el entrenamiento, ajuste, despliegue y monitorizaciónservicios de modelos de ML a escala industrial. Por ejemplo, Azure Machine Learning es “un serviciocomputación en la nube que acelerapermiten acceder a hardware potente sin necesidad de comprarlo. Plataformas como AWS, Google Cloud o Microsoft Azure ofrecen instancias con GPU o TPU que se pueden alquilar por horas para entrenar o ejecutar modelos de IA.

    Infraestructura local

    Además de la nube, cada vez es más común ejecutar modelos de inteligencia artificial en equipos locales. Ordenadores personales con GPUs modernas pueden ejecutar modelos abiertos de tamaño medio, especialmente si están optimizados para uso local. Esto permite mayor control sobre los datos y administrareduce la dependencia de servicios externos.

    Optimización y eficiencia

    Debido al gran consumo de recursos de los modelos actuales, han surgido técnicas para mejorar su eficiencia, como la cuantización de modelos, la reducción de precisión o el ciclouso de vidamotores delde aprendizajeinferencia automático”.optimizados. OfreceEstas notebookstécnicas integrados,permiten interfacesejecutar gráficasmodelos (Designer) y soporte para frameworks abiertos (PyTorch, TensorFlow, Scikit-learn). SageMaker similarmente. Ambos requieren pago según recursos usados (CPUs/GPUsgrandes en lahardware nube),más porlimitado, lo quefacilitando su uso educativoen sueleentornos limitarseeducativos, dispositivos personales o aplicaciones empresariales.

    Conjuntos de datos

    Los modelos de inteligencia artificial se entrenan a institucionespartir de grandes colecciones de datos que contienen ejemplos del tipo de información que el sistema debe aprender a procesar. Estos datasets constituyen uno de los elementos fundamentales del desarrollo de la IA, ya que la calidad, diversidad y tamaño de los datos influyen directamente en el rendimiento del modelo.

    Datos de texto

    En el caso de los modelos de lenguaje, los conjuntos de datos suelen estar formados por grandes colecciones de textos procedentes de libros, artículos científicos, páginas web, código fuente o conversaciones. Estos datos permiten a los modelos aprender patrones del lenguaje, estructuras gramaticales y relaciones entre conceptos.

    Datos de imagen

    Los modelos de visión por computador se entrenan con presupuestobases de datos de imágenes etiquetadas que indican qué aparece en cada fotografía. Estos datasets permiten que los modelos aprendan a reconocer objetos, personas o escenas. Algunos conjuntos de datos muy conocidos incluyen millones de imágenes clasificadas en distintas categorías.

    Datos de audio y voz

    Los sistemas de reconocimiento o generación de voz utilizan grabaciones de audio acompañadas de transcripciones. Con estos datos los modelos aprenden a relacionar sonidos con palabras o a generar voz sintética con características naturales.

    Datos multimodales

    En los últimos años se han desarrollado datasets que combinan diferentes tipos de información, como imágenes con descripciones en texto, vídeos con subtítulos o audio con anotaciones. Estos conjuntos de datos permiten entrenar modelos capaces de comprender varias modalidades de información al planmismo gratuitotiempo.

    inicial.
    Datos Suespecializados ventajao de dominio

    Además de los grandes datasets generales, también existen conjuntos de datos específicos para un ámbito concreto, como medicina, derecho, finanzas o educación. Estos datasets se utilizan para especializar modelos mediante técnicas como el fine-tuning o para construir sistemas de consulta basados en RAG.

    Calidad y preparación de los datos

    Antes de utilizar un dataset en un modelo de IA, los datos suelen pasar por procesos de limpieza, filtrado y anotación para eliminar errores, duplicados o información irrelevante. También es importante considerar aspectos como el sesgo de los datos, la escalabilidadprivacidad y los derechos de uso, ya que estos factores pueden influir en el comportamiento y la integración con servicios empresariales (basesfiabilidad de datos,los web services), aunque a costasistemas de mayorinteligencia complejidadartificial.

      Fuentes de datasets

      Existen diversas plataformas donde investigadores y costo.

      desarrolladores

      Ollamapueden yencontrar LMconjuntos Studio

      de

      Estasdatos para proyectos de inteligencia artificial. Algunas de las más utilizadas son herramientasKaggle, localesque ofrece miles de datasets y competiciones de ciencia de datos; Google Dataset Search, un buscador especializado en localizar conjuntos de datos públicos en internet; y repositorios como Hugging Face, que además de modelos incluye colecciones de datasets preparados para correrentrenamiento modelosy experimentación.

      Bibliotecas python

      Para los que se animen a programar estas son las librerías más populares de lenguajeamplio uso en PCsel sinmundo dependerdel desarrollo de nube. Ollama (CLI/API) e LM Studio (aplicación de escritorio) permiten descargar y ejecutar LLMs open-source en Windows, Mac o Linux. Son gratuitas para uso personal. Por ejemplo, LM Studio anuncia: “Run AI models, locally and privately”, soportando modelos como gpt-oss, Qwen3 o Gemma3 en tu propio hardware. La figura ilustra su interfaz tipo IDE para inferir con un modelo en local. Al usarlos, los datos permanecen en tu dispositivo, lo que protege la privacidad. Estas plataformas son útiles en entornos educativos donde no se desea o no se puede usar la nube.IA

      vLLM

      PyTorch

      vLLM esEs una biblioteca deorientada inferencia desarrollada inicialmente en la Universidad de Berkeley (ahora con soporte de NVIDIA) diseñada para servir LLMs con gran rendimiento y eficiencia de memoria. Permite procesar muchas solicitudes en paralelo, optimiza la gestión de memoria de las llaves-valor de atención, y utiliza técnicas de cuantización (INT4/INT8, FP8). Se integra con modelos de Hugging Face y soporta GPUs (NVIDIA, AMD, Intel) e incluso CPUs, y hasta TPUs mediante plugins. vLLM ofrece un servidor API compatible con OpenAI para inferencia, ideal para montar demos educativas de IA de forma eficiente.

      Bibliotecas python

      • PyTorch: Es una biblioteca de tensores optimizada paraal aprendizaje profundo sobreque GPUs/CPUs.permite Ofrecetrabajar uncon tensores y entrenar redes neuronales utilizando CPU o GPU. Se caracteriza por su modo de ejecución ansiosoflexible, (fácilmuy utilizado en investigación, y por su ecosistema de usarherramientas enespecializadas investigación)como yTorchVision herramientaspara visión por computador o TorchAudio para procesamiento de audio. También ofrece utilidades para producción (TorchScript,como TorchServe).TorchScript PyTorcho cuentaTorchServe.

        con
        TensorFlow
        un ecosistema rico (TorchVision, TorchAudio) para visión, audio y NLP, y está soportado por principales nubes (AWS, GCP, Azure).
      • TensorFlow:

        Es una plataforma dedesarrollada por Google de extremo a extremo para ML.crear Lay página oficial destaca que “TensorFlow facilita la creación dedesplegar modelos de AAaprendizaje queautomático puedende ejecutarseforma encompleta. cualquierIncluye entorno”.APIs Poseesencillas API intuitivas (como Keras)Keras para diseñar redes neuronales y bibliotecasherramientas auxiliaresadicionales (TFX,para distintos entornos, como TensorFlow Lite para móviles,dispositivos etc.).móviles TensorFlowo tambiénTFX permitepara exportarsistemas de producción. Los modelos apueden otrosexportarse en diferentes formatos (SavedModel, TFLite) para desplegarlosejecutarse en servidores o dispositivosdispositivos.

        móviles.
      • Scikit-learn:
        Biblioteca

        Es una de las bibliotecas más utilizadas en Python de propósito general para aprendizaje automático clásico. BrindaProporciona implementaciones eficientes de algoritmos de regresión, clasificación, clustering y reducción de dimensionalidad. Como señala IBM, “Scikit-learn es una de las bibliotecas de machine learning más utilizadas” en Python. Aunque no está diseñada para redes neuronales profundas, es indispensablemuy utilizada en ciencia de datos para tareas de cienciapreprocesamiento, evaluación de datosmodelos (preprocesamiento,y validaciónexperimentación cruzada, métricas) en educación.

      educativa.