DeepSeek, la IA china que superó en descargas a la aplicación ChatGPT
Modelo de código abierto sorprendió a la industria por su escaso coste de fabricación y de entrenamiento, y que fue elaborado con procesadores de baja capacidad debido a las restricciones impuestas por Estados Unidos.
Agencia EFE - Medios Regionales
La aplicación del modelo chino de inteligencia artificial (IA) generativa DeepSeek R-1 se situó en las últimas horas del domingo en el primer puesto en las listas de descargas gratuitas de la tienda de aplicaciones móviles App Store tanto en China como en Estados Unidos, superando al popular ChatGPT.
El modelo DeepSeek-R1, lanzado el pasado 20 de enero, es, según la empresa desarrolladora, comparable con el modelo o1 de OpenAI, la firma creadora del ChatGPT, en la resolución de problemas matemáticos, la programación y la inferencia del lenguaje natural.
Dicho modelo es una creación de DeepSeek, una empresa china de modelos de inteligencia artificial respaldada por la empresa de inversión cuantitativa Huanfang Quant, recogió el diario local The Paper.
Costes reducidos
La herramienta, de código abierto, generó la semana pasada un notable impacto en la comunidad internacional de desarrolladores y en el sector tecnológico debido a su eficiencia y bajo costo.
Según la empresa, el modelo fue entrenado durante 55 días con un presupuesto de 5,57 millones de dólares, utilizando un conjunto de 2.048 unidades de procesadores gráficos H800 del fabricante de chips estadounidense Nvidia, una versión de capacidad reducida diseñada para el mercado chino ante las restricciones de ventas al gigante asiático en este campo impuestas por Estados Unidos.
Este costo representa menos de una décima parte del gasto en el entrenamiento del modelo 4o de OpenAI, informa el rotativo.
Según DeepSeek, el R1 utilizó técnicas avanzadas de aprendizaje automático en la etapa posterior a su entrenamiento, lo que permitió mejorar notablemente su capacidad para realizar tareas complejas con pocos datos previamente clasificados.
Además, la compañía ha hecho públicos los detalles técnicos del proceso de entrenamiento, permitiendo a otros usuarios utilizarlos como base para desarrollar otras herramientas.
Las comparativas de precios se basan en el cálculo de tókenes, donde 1.000 tókenes equivalen aproximadamente a 750 palabras en inglés. DeepSeek ofrece servicios de interfaz de programación de aplicaciones (API) a un costo de 1 yuan (0,14 dólares) por millón de tókenes de entrada y 16 yuanes (2,2 dólares) por millón de tókenes de salida.
En comparación, el modelo o1 de OpenAI tiene un precio de 15 dólares por millón de tókenes de entrada y 60 dólares por millón de tókenes de salida.
Competencia con ee. uu.
El lanzamiento del DeepSeek-R1 se produjo en la misma semana que el anuncio por parte del presidente estadounidense, Donald Trump, del proyecto Stargate, que busca invertir hasta 500.000 millones de dólares en los próximos cuatro años para construir hasta veinte nuevos centros de datos para apoyar proyectos de IA.
"El enfoque tecnológico de DeepSeek desafía el dominio de Estados Unidos en IA, demostrando que sus restricciones de la venta de semiconductores a China han sido ineficaces", declaró el profesor de estudios de inteligencia en la Universidad de Nanjing, Li Baiyang, al rotativo local Global Times.
Por su parte, el experto Tian Feng indicó al mismo medio que los resultados de DeepSeek, con costos de entrenamiento más bajos, junto con su enfoque de código abierto, "redefinirán las reglas de desarrollo para la IA".
Se han lanzado en el mercado chino más de 200 modelos de lenguaje de gran tamaño (LLM), algunos desarrollados por gigantes tecnológicos del país, como el 'Doubao' de Bytedance, 'Jiutian' de China Mobile, 'Wenxin Yiyan' de Baidu, 'Tongyi Qianwen' de Alibaba, 'Pangu' de Huawei Cloud, y 'Lanxin' de Vivo.
La República Popular China reguló en 2023 estos servicios, que deberán respetar "los valores socialistas fundamentales" y tendrán prohibido "generar contenidos que atenten contra la seguridad nacional, la unidad territorial y la estabilidad social".
Efecto bursátil
La irrupción por sorpresa de DeepSeek hace tambalear el liderazgo de firmas estadounidenses como Nvidia, cuyas acciones se hundían el lunes más del 17% en bolsa antes de la apertura de Wall Street y las fuertes pérdidas que registraban las empresas relacionadas con el sector llevaron al tecnológico Nasdaq a caer más del 3,3%.
Dentro de los valores europeos, el fabricante neerlandés de máquinas de chips ASML se precipitaba en bolsa más del 8%, mientras que otra compañía como Infineon caía casi 4%. Además, otras empresas no tecnológicas, pero relacionadas con el sector, también bajaban con fuerza: Schneider Electric se desplomaba más del 10%, Siemens casi el 5% y SAP el 2,19%.
Los analistas de Janus Henderson han explicado que la aparición de "un enfoque potencialmente más eficiente del procesamiento de la IA cuestiona la necesidad de los miles de millones de dólares de inversión previstos en infraestructura y propiedad intelectual".
"La IA se ha considerado un área de desarrollo muy compleja, y se considera que los que están a la vanguardia tienen ventajas tecnológicas que les permitirán seguir creciendo a un ritmo rápido en el futuro. El alto crecimiento de las ganancias esperadas se ha utilizado para justificar valoraciones muy elevadas, lo que los deja muy expuestos a cualquier decepción. La competencia siempre pareció la mayor amenaza, pero también la más difícil de evaluar para los inversores", han añadido los especialistas.
55 días estuvo bajo entrenamiento esta inteligencia artificial de código abierto.
20 de enero: la firma de inversión cuantitativa Huanfang Quant lanzó su DeepSeek-R1.