El modelo chino que desafía las restricciones de GPU y revoluciona la IA

El modelo chino que desafía las restricciones de GPU y revoluciona la IA

Hace poco más de tres semanas, una novedad sacudió los cimientos de la industria de la inteligencia artificial (IA) en China: el lanzamiento de DeepSeek, un modelo desarrollado por la compañía High-Flyer. Lo que comenzó como un anuncio discreto, pronto se convirtió en un símbolo del afán de innovación del gigante asiático. La razón es simple: DeepSeek combina código abierto con tarifas de acceso muy bajas a través de su API, una característica que no solo ha llamado la atención de expertos, sino que también podría disparar la adopción de la IA en múltiples sectores.

Mientras el Ministerio de Industria y Tecnología de la Información de China mantiene sin oficializar sus nuevas medidas, numerosas restricciones sobre la exportación de GPU de vanguardia fabricadas por empresas estadounidenses, como NVIDIA o AMD, ya han empezado a impactar en el mercado chino. Bajo este contexto, DeepSeek surge como una posible solución para las compañías del país, que buscan nuevas herramientas y alternativas ante la escasez de hardware especializado.

En paralelo, Huawei y otras empresas locales llevan años preparando sus propias GPU para IA. Los chips Ascend AI de Huawei, por ejemplo, han sido refinados durante más de un lustro con la intención de igualar o incluso superar el rendimiento de los modelos A100 y H100 de NVIDIA. Sin embargo, la estrategia de Huawei no pasa tanto por rivalizar en el campo del entrenamiento de los modelos —un proceso que, según la firma, sucede en contadas ocasiones—, sino en dominar la inferencia, la fase en la que la IA procesa peticiones y genera respuestas. “El entrenamiento es importante, pero ocurre pocas veces. Huawei se enfoca principalmente en la inferencia, que nos dará acceso a más clientes”, explica Georgios Zacharopoulos, investigador sénior de IA en el laboratorio de Huawei en Zúrich.

La apuesta por la inferencia también se ve reflejada en compañías como Hygon, EnFlame, Tsingmicro o Moore Threads, que han asegurado que sus soluciones serán compatibles con DeepSeek. La auténtica baza de estas firmas chinas es precisamente ofrecer GPU competitivas en tareas de inferencia, un aspecto muy valorado por empresas como ByteDance. Y es que, tal y como señala Lian Jye Su, analista jefe de la consultora tecnológica Omdia, las GPU chinas tienen serias dificultades para competir con NVIDIA en el entrenamiento de la IA, pero las cargas de trabajo por inferencia se muestran más permisivas y se benefician, sobre todo, de un enfoque más localizado y concreto. De ahí que DeepSeek haya encendido la mecha hacia una IA más barata y accesible, y que China parta con una ventaja cada vez más clara.