Estos últimos días han sido muy intensos en cuanto a avances de la Inteligencia Artificial. Si eres una de esas personas que no ha parado de escuchar el nombre «DeepSeek» por todos lados pero no entiendes muy bien por qué tanta revolución, este es tu sitio ideal.
Los antecedentes: DeepSeek v3
En diciembre de 2024, DeepSeek dio su primer gran golpe sobre la mesa con el lanzamiento de «DeepSeek v3«, un modelo Open Source (es decir, gratuito) que se atrevía a competir de tú a tú con los gigantes privados como GPT-4 de OpenAI y Claude 3.5 Sonnet de Anthropic.
Si bien en su momento los benchmarks eran impresionantes, este modelo no causó tanta sensación porque seguía una tendencia que ya veíamos con Llama 3.2 de Meta: los modelos gratuitos estaban acortando peligrosamente la distancia con los modelos privados.
La verdadera revolución: DeepSeek r1
Un mes después, en enero de 2025, DeepSeek volvió a sorprender al mundo con DeepSeek r1, su modelo de razonamiento avanzado. Lo más impactante: también es completamente gratuito y de código abierto, permitiendo que cualquier usuario pueda descargarlo y personalizarlo.
El contexto geopolítico
Para entender la magnitud de este logro, necesitamos algo de contexto histórico. Desde 2022, Estados Unidos ha estado limitando sistemáticamente la exportación de tarjetas gráficas a China, buscando mantener su ventaja competitiva tecnológica. Estas restricciones han sido cada vez más severas, lo que explica por qué la mayoría de los grandes modelos de lenguaje han surgido de fabricantes estadounidenses, con escasa presencia incluso europea.
Sin embargo, ¿han conseguido estas limitaciones frenar a los ingenieros chinos? ¡En absoluto! Y aquí es donde radica lo verdaderamente revolucionario: DeepSeek ha logrado construir modelos más inteligentes y capaces que los grandes referentes del sector, a pesar de contar con muchos menos recursos que gigantes como OpenAI, Anthropic o Google.
El impacto en el mercado
Las repercusiones no se han hecho esperar: NVIDIA, líder en la fabricación de tarjetas gráficas y la compañía más valiosa del mundo el año pasado gracias al boom del entrenamiento de modelos de IA, ha sufrido una significativa caída en su valor bursátil.
El futuro de la IA después de DeepSeek
¿Cómo va a evolucionar la IA después de este movimiento estratégico chino? Desde mi punto de vista personal, este cambio de paradigma abre un mundo de posibilidades:
- Mayor democratización: Compañías con conocimientos técnicos pero recursos limitados podrán ahora competir en el desarrollo de modelos de IA.
- Accesibilidad: El año 2025 veremos una integración mucho más amplia de la IA en diversos casos de uso, superando lo visto en 2024, gracias a la reducción significativa de costos.
- Homogeneización del rendimiento: Con el tiempo, la elección entre diferentes modelos de IA se volverá más indiferente, ya que todos alcanzarán niveles similares de rendimiento en los benchmarks. La verdadera diferenciación vendrá de cómo los ingenieros adaptemos estos modelos a casos de uso específicos.