1.3 Plataformas y herramientas
En los últimos años ha habido un desarrollo exponencial de tecnologías vinculadas a la IA en todos los niveles y ámbitos profesionales
Este curso pretende dar una visión completa de las mismas e iniciar al alumno en un uso más profundo y flexible de la IA para adaptarla a sus necesidades y reducir la dependencia.
Aunque se habla de python y librerías asociadas no es en absoluto la idea del curso aprender a programar pero sí ofrecer dicha posibilidad a los alumnos que quieran introducirse en el tema.
EnA esta seccióncontinuación mostramos las principales y más populares plataformas y tecnologíastecnologías. Todas ellas se usan en todo el mundo como referencia y base de pruebas y aprendizaje de IA con modelos y conjuntos de datos propios y ajenos
Modelos de IA:
Entre los modelos de IA más populares se pueden distinguir varios grupos según el tipo de información que procesan y su aplicación principal.
Modelos de lenguaje (LLM)
Están diseñados para comprender y generar texto. Se utilizan en asistentes conversacionales, generación de contenido, programación asistida, traducción o análisis de documentos.
Ejemplos representativos:
-
GPT (OpenAI): base de muchos sistemas conversacionales.
-
BERT (Google): muy utilizado en comprensión del lenguaje y buscadores.
-
LLaMA (Meta): modelo abierto que ha impulsado el ecosistema open source.
-
Mistral, Qwen o Phi: modelos más ligeros que permiten ejecutar IA en local.
Modelos de visión por computador
Están diseñados para analizar imágenes o vídeo. Permiten tareas como reconocimiento de objetos, clasificación de imágenes o detección de patrones visuales.
Ejemplos:
-
CNN (Convolutional Neural Networks): arquitectura clásica para reconocimiento de imágenes.
-
Vision Transformers (ViT): aplican la arquitectura transformer al análisis visual.
-
Modelos de
IAdifusión (como Stable Diffusion): generan imágenes a partir de texto.
Modelos de audio y voz
Procesan sonido o lenguaje hablado. Se utilizan para reconocimiento de voz, síntesis de voz o generación de música.
Ejemplos destacados:
-
Whisper (OpenAI): transcripción automática de voz a texto.
-
WaveNet (DeepMind): generación de voz natural.
-
MusicGen o AudioLM:
Incluyengeneracióngrandesde música o audio mediante IA.
Modelos multimodales
Estos modelos lingüísticospueden combinar varios tipos de datos (LLM)texto, paraimagen, audio, etc.). Permiten tareas como describir imágenes, responder preguntas sobre vídeos o interactuar con distintos tipos de contenido al mismo tiempo.
Ejemplos:
-
CLIP (OpenAI): relaciona texto
(GPT,eBERT,imágenes.etc.), -
LLaVA: integra modelos de
visión (CNN, Diffusion)lenguaje ymodelosvisión.multimodales -
Gemini o GPT multimodal: capaces de trabajar con múltiples modalidades de información.
Sistemas avanzados basados en LLM: agentes de IA
Una evolución reciente son los agentes de inteligencia artificial, que combinanutilizan texto e imagen. Los modelos fundacionalesde sonlenguaje gigantescascomo redesnúcleo pre-entrenadasde razonamiento pero además pueden planificar tareas, usar herramientas externas y ejecutar acciones.
Cuando varios agentes especializados colaboran dentro de un mismo sistema coordinado se habla de orquestación de agentes, una de las tendencias más recientes en datosel masivosdesarrollo de aplicaciones avanzadas de inteligencia artificial.
Plataformas de desarrollo y pruebas de modelos
Existen diferentes tipos de plataformas para trabajar con inteligencia artificial, que luegovan sedesde adaptan a tareas específicas (mediante fine-tuning).
Plataformas de modelos y repositorios de IA
Son espacios donde investigadores y desarrolladores publican modelos, datasets y demos listas para usar.
Ejemplos:
-
Hugging Face: uno de los mayores repositorios de IA del mundo, con millones de modelos, datasets y demos interactivos (Spaces).
-
ModelScope o repositorios similares: plataformas que permiten descargar y probar modelos abiertos.
Frameworks para construir aplicaciones con LLMs
Facilitan la creación de aplicaciones complejas combinando modelos, bases de datos y herramientas locales.externas.
Ejemplos:
- LlamaIndex:
sonespecializadoHuggingenFaceintegrar(repositoriodatos propios con modelos de2Mlenguaje. -
demosLangChain:
y Spaces de IA), LangChain (frameworkdeparaencadenado deconectar LLMs con fuentes dedatos),datos, APIs o bases de conocimiento. -
Vista de la web de lancghain para programar, explorar y probar modelos
Entornos de desarrollo en la nube
Permiten experimentar con IA sin instalar nada en el ordenador, usando notebooks con acceso a GPU o TPU.
Ejemplos:
-
Google Colab:
ynotebooksKaggledeNotebooks (JupyterPython en la nube conGPU/TPUaccesogratuitas),sencilloserviciosaMLGPUs. -
Kaggle Notebooks: entorno similar, muy utilizado en ciencia de datos y competiciones de IA.
Plataformas empresariales comode Machine Learning
Ofrecen infraestructuras completas para entrenar, desplegar y gestionar modelos de IA en producción.
Ejemplos:
-
AWS SageMaker:
oentornoAzuredeML (notebooks integradosdesarrollo y despliegue de modelos enproducción),la nube de Amazon. -
Azure Machine Learning: plataforma de Microsoft para crear y
aplicacionesoperar sistemas deIAIA.local
Plataformas para correrejecutar LLMsIA open-en local
Permiten trabajar con modelos abiertos sin depender de servicios en la nube, lo que mejora la privacidad y el control de datos.
Ejemplos:
-
Ollama: herramienta sencilla para ejecutar modelos open source en
PCs).elLaordenador.librería -
LM Studio: interfaz gráfica para descargar y usar LLMs locales.
Motores de inferencia optimizados
Son herramientas especializadas para ejecutar modelos grandes de forma eficiente.
Ejemplos:
-
vLLM
destaca como: motor optimizado para servir LLMs conaltaaltoeficienciarendimiento y bajo consumo dememoriamemoria, muy utilizado en servidores de IA.
En conjunto, estas plataformas permiten experimentar, desarrollar y rendimiento.
Técnicas clave
El uso práctico de los modelos de inteligencia artificial no depende solo del modelo en sí, sino también de una serie de técnicas que permiten adaptarlos, controlarlos o integrarlos con datos propios.
Prompting (ingeniería de instrucciones)
Consiste en formular correctamente las instrucciones que se dan al modelo para DLobtener enmejores GPU/CPU”)resultados. Incluye técnicas como zero-shot prompting (pedir una tarea directamente sin ejemplos), TensorFlowfew-shot prompting (plataformamostrar algunos ejemplos para guiar la respuesta) y chain-of-thought prompting, donde se pide al modelo que razone paso a paso para mejorar la calidad de Googlela pararespuesta.
RAG (bibliotecaRetrieval-Augmented PythonGeneration)
Es una técnica que permite a un modelo consultar información externa antes de MLgenerar tradicionalla pararespuesta. regresión,En clasificación, clustering, etc.lugar de códigodepender abierto).
Fine-tuning
Consiste en volver a entrenar un modelo pre-entrenadofundacional utilizando datos específicos para especializarlo en datosuna específicos.tarea Promptconcreta. engineeringPor ejemplo, un modelo general puede ajustarse con documentos médicos, legales o educativos para mejorar su precisión en ese ámbito.
Embeddings y búsqueda semántica
Los modelos pueden transformar textos en representaciones numéricas llamadas embeddings que capturan el significado del contenido. Esto permite realizar búsquedas semánticas, encontrar documentos relacionados o agrupar información similar aunque no contengan exactamente las mismas palabras.
Uso de herramientas externas
Los modelos pueden conectarse con APIs, bases de datos, buscadores o programas externos para ampliar sus capacidades. De esta forma pueden consultar información actualizada, realizar cálculos o ejecutar acciones fuera del propio modelo.
Agentes de inteligencia artificial y orquestación de agentes
Una evolución reciente consiste en diseñarutilizar conlos cuidadomodelos lasde instrucciones al modelo. Métodos recienteslenguaje como LoRAagentes (Low-Rank Adaptation) añaden matricescapaces de planificar tareas, tomar decisiones y utilizar herramientas de forma autónoma. En sistemas más avanzados, varios agentes especializados pueden colaborar entre sí bajo rango a un LLM para adaptarlo con muy pocos parámetros (ganando eficienciasistema de memoria). En general, las aproximaciones PEFT (“Parameter-Efficient Fine-Tuning”) ajustan solo unos pocos parámetros extra del modelo, congelando el resto,coordinación, lo que reducese drásticamenteconoce loscomo costosorquestación de cómputoagentes. yEste almacenamiento.
Infraestructura y hardware:
El aceleradores especializados para IA. GPUs (p.ej. NVIDIA H100/A100) son procesadores paralelos versátiles con gran memoria (80–141 GB)desarrollo y fuerte ecosistema (CUDA, PyTorch). TPUs (Google TPU v6e, etc.) son ASICsuso de tensor optimizados para cargassistemas de inferenciainteligencia enartificial nube:requiere p.ej.una v6einfraestructura ofreceinformática ~2 PFLOPS FP16 por ~$2.70/h, pero solo están en Google Cloud (Google Drive, Colab). NPUs (Unidadescapaz de Procesamientoprocesar Neural)grandes integradas en SoCs de móviles/PCs (por ejemplo, el Apple Neural Engine en iPhones/Mac) ofrecen muy alta eficiencia energética: la 5ª generación de Apple NPU alcanza ~15.8 TFLOPS FP16. FPGAs y ASICs (como Google Edge TPU) permiten IA embebida con baja latencia, aunque son menos flexibles y a menudo caros. Los aceleradores neuromórficos (Intel Loihi, IBM TrueNorth) son experimentales para IA inspirada en el cerebro. Cada hardware tiene su costo/rendimiento: las GPUs de consumo cuestan cientos de euros, TPUs cobran por hora en nube, NPUs vienen “incluidas” en dispositivos móviles, FPGAs/ASICs son especializados (educativamente poco comunes), etc.
Procesadores especializados
Los modelos de IA suelen ejecutarse en hardware adecuado.optimizado Enpara elcálculos edgeparalelos. Las unidades de procesamiento gráfico (móviles, IoT)GPU) se priorizahan rapidez y privacidad (los datos no salen del dispositivo). Por ejemplo, la startup española Multiverse destaca que ejecutar IAconvertido en el dispositivoestándar (“edge”)para mejora la eficiencia energéticaentrenar y laejecutar privacidad.
Hugging Face
Hugging Face ofrece el Model Hub, repositorio público con millones de modelos preentrenados (textuales, vision, multimodales) y conjuntos de datos. También proporciona Spaces, un directorio de aplicaciones de IA interactivas compartidas. La biblioteca Transformers de HF permite cargar, ajustar o servir estos modelos bajo PyTorch o TensorFlow. Por ejemplo, hay APIs para clasificación de texto, traducción, generación de imágenes, etc. HF dispone de planes gratuitos (por ejemplo: almacenar modelos públicos gratis) y servicios de inferencia pagos (~$0.033/hora por endpoint dedicado), lo cual se detalla en su página de precios. Esta plataforma es muy usada en investigación y educaciónneuronales, ya que facilitapueden accederrealizar a modelos sin grandes recursos propios.
LangChain
LangChain es un frameworkmiles de códigooperaciones abiertosimultáneamente. También existen otros aceleradores como las TPU (Python/JavaScript) diseñado para crear aplicaciones que combinan LLMs con fuentes de datos externas. Permite “encadenar” pasos: por ejemplo, recibe la consulta del usuario, la procesa o traduce si es necesario, luego realiza una búsqueda o recuperación de información relevante en bases de datos o documentos, y finalmente alimenta al LLM con ese contexto para generar una respuesta informada. Así, LangChain facilita construir agentes de IA o chatbots especializados (ej. un chatbot médico que primero busca en un repositorio de investigaciones antes de responder). Es modular y extensible, y su propósito educativo es mostrar cómo integrar datos reales en aplicaciones basadas en LLMs.
Google Colab
Google Colab es un servicio de notebooks Jupyter en la nube (no hay que instalar nada local) que combina código ejecutable, texto enriquecido e imágenes en un mismo documento. Proporciona un entorno “listo para usar” con Python y bibliotecas de ML preinstaladas, facilitando la colaboración entre usuarios (compartición de notebooks vía Google Drive). Una ventaja clave es que Colab regala cómputo acelerado: acceso gratuito a GPUs (por ejemplo NVIDIA Tesla T4) y TPUs (Google’s Tensor Processing Units). Estodesarrolladas permitepor entrenarGoogle o inferirlos modeloschips sinespecializados invertirpara IA integrados en hardwaredispositivos costoso.móviles.
Servidores y ofrece versiones Pro de pago para mayor capacidad. Por su sencillez, es muy popular en educación científica, permitiendo a profesores y alumnos ejecutar experimentos de IA sin infraestructura local.
Kaggle Notebooks
Kaggle (plataforma de cienciacentros de datos
de
Las Google) también ofrece notebooks colaborativos en la nube. Al igualempresas que Colab,desarrollan proveenmodelos GPUsfundacionales gratuitassuelen (ej.utilizar NVIDIAgrandes Tesla P100) y un entorno de Python listo, pero están más orientados a análisis de datos (con acceso directo a datasets de la comunidad) y a la competencia en proyectos de ciencia de datos. Son gratuitos y fáciles de usar para docentes que guían prácticas de análisiscentros de datos con IA.
AWSde SageMakerGPUs conectadas entre sí. Estas infraestructuras permiten entrenar modelos con billones de parámetros utilizando enormes cantidades de datos. Los centros de datos modernos también incluyen sistemas de almacenamiento de alto rendimiento y Azureredes ML
de Sonalta serviciosvelocidad para mover grandes volúmenes de información entre máquinas.
Computación en la nube
Muchos proyectos de AWSinteligencia (Amazon)artificial yutilizan Microsoft respectivamente. Permiten el entrenamiento, ajuste, despliegue y monitorizaciónservicios de modelos de ML a escala industrial. Por ejemplo, Azure Machine Learning es “un serviciocomputación en la nube que acelerapermiten acceder a hardware potente sin necesidad de comprarlo. Plataformas como AWS, Google Cloud o Microsoft Azure ofrecen instancias con GPU o TPU que se pueden alquilar por horas para entrenar o ejecutar modelos de IA.
Infraestructura local
Además de la nube, cada vez es más común ejecutar modelos de inteligencia artificial en equipos locales. Ordenadores personales con GPUs modernas pueden ejecutar modelos abiertos de tamaño medio, especialmente si están optimizados para uso local. Esto permite mayor control sobre los datos y administrareduce la dependencia de servicios externos.
Optimización y eficiencia
Debido al gran consumo de recursos de los modelos actuales, han surgido técnicas para mejorar su eficiencia, como la cuantización de modelos, la reducción de precisión o el ciclouso de vidamotores delde aprendizajeinferencia automático”.optimizados. OfreceEstas notebookstécnicas integrados,permiten interfacesejecutar gráficasmodelos (Designer) y soporte para frameworks abiertos (PyTorch, TensorFlow, Scikit-learn). SageMaker similarmente. Ambos requieren pago según recursos usados (CPUs/GPUsgrandes en lahardware nube),más porlimitado, lo quefacilitando su uso educativoen sueleentornos limitarseeducativos, dispositivos personales o aplicaciones empresariales.
Conjuntos de datos
Los modelos de inteligencia artificial se entrenan a institucionespartir de grandes colecciones de datos que contienen ejemplos del tipo de información que el sistema debe aprender a procesar. Estos datasets constituyen uno de los elementos fundamentales del desarrollo de la IA, ya que la calidad, diversidad y tamaño de los datos influyen directamente en el rendimiento del modelo.
Datos de texto
En el caso de los modelos de lenguaje, los conjuntos de datos suelen estar formados por grandes colecciones de textos procedentes de libros, artículos científicos, páginas web, código fuente o conversaciones. Estos datos permiten a los modelos aprender patrones del lenguaje, estructuras gramaticales y relaciones entre conceptos.
Datos de imagen
Los modelos de visión por computador se entrenan con presupuestobases de datos de imágenes etiquetadas que indican qué aparece en cada fotografía. Estos datasets permiten que los modelos aprendan a reconocer objetos, personas o escenas. Algunos conjuntos de datos muy conocidos incluyen millones de imágenes clasificadas en distintas categorías.
Datos de audio y voz
Los sistemas de reconocimiento o generación de voz utilizan grabaciones de audio acompañadas de transcripciones. Con estos datos los modelos aprenden a relacionar sonidos con palabras o a generar voz sintética con características naturales.
Datos multimodales
En los últimos años se han desarrollado datasets que combinan diferentes tipos de información, como imágenes con descripciones en texto, vídeos con subtítulos o audio con anotaciones. Estos conjuntos de datos permiten entrenar modelos capaces de comprender varias modalidades de información al planmismo gratuitotiempo.
Datos Suespecializados ventajao de dominio
Además de los grandes datasets generales, también existen conjuntos de datos específicos para un ámbito concreto, como medicina, derecho, finanzas o educación. Estos datasets se utilizan para especializar modelos mediante técnicas como el fine-tuning o para construir sistemas de consulta basados en RAG.
Calidad y preparación de los datos
Antes de utilizar un dataset en un modelo de IA, los datos suelen pasar por procesos de limpieza, filtrado y anotación para eliminar errores, duplicados o información irrelevante. También es importante considerar aspectos como el sesgo de los datos, la escalabilidadprivacidad y los derechos de uso, ya que estos factores pueden influir en el comportamiento y la integración con servicios empresariales (basesfiabilidad de datos,los web services), aunque a costasistemas de mayorinteligencia complejidadartificial.
Fuentes de datasets
Existen diversas plataformas donde investigadores y costo.
Ollamapueden yencontrar LMconjuntos Studio
de Estasdatos para proyectos de inteligencia artificial. Algunas de las más utilizadas son herramientasKaggle, localesque ofrece miles de datasets y competiciones de ciencia de datos; Google Dataset Search, un buscador especializado en localizar conjuntos de datos públicos en internet; y repositorios como Hugging Face, que además de modelos incluye colecciones de datasets preparados para correrentrenamiento modelosy experimentación.
Bibliotecas python
Para los que se animen a programar estas son las librerías más populares de lenguajeamplio uso en PCsel sinmundo dependerdel desarrollo de nube. Ollama (CLI/API) e LM Studio (aplicación de escritorio) permiten descargar y ejecutar LLMs open-source en Windows, Mac o Linux. Son gratuitas para uso personal. Por ejemplo, LM Studio anuncia: “Run AI models, locally and privately”, soportando modelos como gpt-oss, Qwen3 o Gemma3 en tu propio hardware. La figura ilustra su interfaz tipo IDE para inferir con un modelo en local. Al usarlos, los datos permanecen en tu dispositivo, lo que protege la privacidad. Estas plataformas son útiles en entornos educativos donde no se desea o no se puede usar la nube.IA
vLLM
PyTorch
vLLM esEs una biblioteca deorientada inferencia desarrollada inicialmente en la Universidad de Berkeley (ahora con soporte de NVIDIA) diseñada para servir LLMs con gran rendimiento y eficiencia de memoria. Permite procesar muchas solicitudes en paralelo, optimiza la gestión de memoria de las llaves-valor de atención, y utiliza técnicas de cuantización (INT4/INT8, FP8). Se integra con modelos de Hugging Face y soporta GPUs (NVIDIA, AMD, Intel) e incluso CPUs, y hasta TPUs mediante plugins. vLLM ofrece un servidor API compatible con OpenAI para inferencia, ideal para montar demos educativas de IA de forma eficiente.
Bibliotecas python
PyTorch: Es unabiblioteca de tensoresoptimizada paraal aprendizaje profundosobrequeGPUs/CPUs.permiteOfrecetrabajaruncon tensores y entrenar redes neuronales utilizando CPU o GPU. Se caracteriza por su modo de ejecuciónansiosoflexible,(fácilmuy utilizado en investigación, y por su ecosistema deusarherramientasenespecializadasinvestigación)comoyTorchVisionherramientaspara visión por computador o TorchAudio para procesamiento de audio. También ofrece utilidades para producción(TorchScript,comoTorchServe).TorchScriptPyTorchocuentaTorchServe.conTensorFlow
un ecosistema rico (TorchVision, TorchAudio) para visión, audio y NLP, y está soportado por principales nubes (AWS, GCP, Azure).TensorFlow:Es una plataforma
dedesarrollada por Googlede extremo a extremoparaML.crearLaypágina oficial destaca que “TensorFlow facilita la creación dedesplegar modelos deAAaprendizajequeautomáticopuedendeejecutarseformaencompleta.cualquierIncluyeentorno”.APIsPoseesencillasAPI intuitivas (comoKeras)Keras para diseñar redes neuronales ybibliotecasherramientasauxiliaresadicionales(TFX,para distintos entornos, como TensorFlow Lite paramóviles,dispositivosetc.).móvilesTensorFlowotambiénTFXpermiteparaexportarsistemas de producción. Los modelosapuedenotrosexportarse en diferentes formatos(SavedModel, TFLite)paradesplegarlosejecutarse en servidores odispositivosdispositivos.móviles.Scikit-learn
:BibliotecaEs una de las bibliotecas más utilizadas en Python
de propósito generalpara aprendizaje automático clásico.BrindaProporciona implementacioneseficientesde algoritmos de regresión, clasificación, clustering y reducción de dimensionalidad.Como señala IBM,“Scikit-learn es una de las bibliotecas de machine learning más utilizadas”en Python.Aunque no está diseñada para redes neuronales profundas, esindispensablemuy utilizada en ciencia de datos para tareas decienciapreprocesamiento, evaluación dedatosmodelos(preprocesamiento,yvalidaciónexperimentacióncruzada, métricas) en educación.
