Alibaba lanza su propia IA y asegura que supera a DeepSeek y ChatGPT

Alibaba lanza su propia IA y asegura que supera a DeepSeek y ChatGPT

Alibaba responde a la revolución de la IA con Qwen2.5-VL, su modelo más avanzado hasta la fecha

La inteligencia artificial avanza a pasos agigantados, y en la carrera por dominar esta tecnología, China no se queda atrás. Apenas unos meses después de que DeepSeek sacudiera el mercado con su IA de código abierto, ahora es Alibaba Cloud quien entra en escena con un modelo que promete superar a sus competidores más fuertes, incluyendo a ChatGPT y DeepSeek-V3.

La compañía anunció el lanzamiento de Qwen2.5-VL, una IA multimodal que puede analizar documentos extensos, comprender videos de varias horas y ejecutar tareas de manera autónoma en smartphones y computadoras. Según Alibaba, su modelo supera en casi todos los aspectos a GPT-4o, DeepSeek-V3 y Llama-3.1-405B.

Una IA que lo entiende todo

La gran apuesta de Alibaba con Qwen2.5-VL es su capacidad para procesar múltiples tipos de información con mayor precisión. A diferencia de otros modelos, puede leer y analizar documentos complejos con textos en varias orientaciones, gráficos, fórmulas químicas, tablas y hasta partituras musicales. Esto abre un abanico de posibilidades para aplicaciones en sectores como la educación, la investigación científica y la gestión documental.

Pero su poder no se queda ahí. Alibaba ha mejorado su sistema de reconocimiento de imágenes, lo que le permite identificar objetos, productos, animales, monumentos e incluso escenas de películas y series. Además, incorpora una precisión avanzada en el análisis de coordenadas espaciales, lo que lo hace útil en vigilancia, tráfico y logística.

El salto al vídeo y la autonomía

Uno de los avances más revolucionarios de Qwen2.5-VL es su capacidad para comprender vídeos largos y extraer información clave en segundos. Gracias a su codificación temporal, puede identificar momentos específicos, aprender secuencias de eventos y hasta comprender la velocidad y dinámica de una escena.

Esta característica lo posiciona como un competidor directo de Operator, el asistente autónomo recientemente lanzado por OpenAI. Alibaba apuesta a que su IA no solo sea un asistente pasivo, sino un agente inteligente capaz de tomar decisiones por sí mismo, ejecutando tareas en computadoras y teléfonos sin necesidad de intervención humana.

Una arquitectura optimizada y abierta al público

Alibaba no solo ha mejorado el rendimiento de su modelo, sino que también ha optimizado su velocidad de entrenamiento e inferencia. Su arquitectura se basa en transformadores de visión (ViT), lo que permite un procesamiento más eficiente de imágenes y videos.

Además, la compañía ha puesto el modelo base a disposición de desarrolladores en plataformas como Hugging Face y ModelScope, con tres versiones de diferentes tamaños (3B, 7B y 72B), adaptadas a distintas necesidades.

El futuro de Qwen2.5-VL

Alibaba no piensa detenerse aquí. La compañía adelantó que en el futuro próximo seguirá mejorando las capacidades de razonamiento y resolución de problemas de su IA, integrando nuevas modalidades para convertir a Qwen en un modelo aún más completo.

Con este lanzamiento, Alibaba deja claro que no se conformará con ser un espectador en la carrera de la inteligencia artificial. Su mensaje es claro: China tiene el talento y los recursos para liderar el futuro de la IA, y su innovación va más allá de DeepSeek y OpenAI.