menu_open Columnists
We use cookies to provide some features and experiences in QOSHE

More information  .  Close

DeepSeek revela a Silicon Valley como un tigre de papel

9 0
yesterday

Las ballenas son los animales más grandes de todo el planeta, con especímenes que alcanzan hasta 30 metros de longitud y un peso de doscientas toneladas. A pesar de su tamaño colosal, se desplazan en el agua con una gracia y discreción tal que, a menudo, los marinos no advierten su presencia hasta que están demasiado cerca. Por eso resulta providencial que el logo de DeepSeek, la empresa de IA china que está revolucionando el sector tecnológico tenga una ballena como su logo.

En febrero de 2025, esta compañía, lanzó un nuevo modelo de inteligencia artificial generativa que resultó ser comparable a los modelos de empresas como OpenAI, Google, Meta y Anthropic. La principal diferencia radica en que DeepSeek afirma haber desarrollado su modelo a una fracción del coste que han invertido las grandes tecnológicas. La prohibición estadounidense de exportar los mejores chips de IA de NVidia significa que DeepSeek ha logrado lo que muchos creían imposible: construir y entrenar uno de los modelos de IA más impresionantes utilizando los chips disponibles en China que creíamos obsoletos: un verdadero "momento Sputnik".

DeepSeek logró completar el entrenamiento en solo dos meses a un costo de $5.6 millones de dólares, una fracción de las sumas que supuestamente gastaron OpenAI, Google y Meta. A pesar de su extremo bajo coste, las puntuaciones de DeepSeek en los benchmarks de rendimiento de IA demuestran que es tan bueno, si no mejor, que los modelos más recientes de vanguardia de las principales empresas estadounidenses. Es casi tan bueno como el modelo o1 de OpenAI en el "índice de calidad de análisis artificial", una clasificación independiente de análisis de IA, y supera a los modelos de Google, Anthropic y Meta. NVidia vendía sus chips H100 con un margen de beneficio del 1000% debido a la creencia que sólo con estos chips se podría alcanzar la calidad de modelos de las tecnológicas americanas. Según el informe técnico de DeepSeek, su modelo se entrenó utilizando GPUs NVidia H800, similares a las H100, pero diseñadas específicamente para el mercado chino y así cumplir con las restricciones de exportación estadounidenses.

El nuevo modelo fue anunciado en un informe técnico en diciembre, pero fue publicado (con todos los detalles mencionados) el 21 de enero de 2025.........

© Aporrea