¿Qué es DeepSeek, la IA china que superó a ChatGPT en Estados Unidos y generó millonarias pérdidas para Nvidia?
El modelo de inteligencia artificial desarrollado en China ha logrado superar a ChatGPT en descargas debido a su tecnología de código abierto, sus funciones gratuitas y su destacado rendimiento que amenaza Estados Unidos.
DeepSeek, una startup china con sede en Hangzhou, ha irrumpido con fuerza en la industria tecnológica al superar a gigantes como OpenAI y posicionar su chatbot como la aplicación gratuita más descargada en la App Store de Estados Unidos. Su éxito radica en el modelo de razonamiento R1, una solución de código abierto que combina eficiencia y accesibilidad. Este avance ha generado preocupación en el mercado y provocó una caída significativa en las acciones de Nvidia ante el temor de que este modelo de bajo costo reduzca la demanda de sus GPU de alta gama.
DeepSeek R1, lanzado el 10 de enero de 2025, se destaca por ofrecer un rendimiento equiparable a los modelos avanzados de OpenAI, pero de manera completamente gratuita. Esta estrategia ha atraído a millones de usuarios y programadores. A diferencia de OpenAI, que cobra hasta US$200 mensuales por sus suscripciones premium, la IA china elimina este costo al integrar sus soluciones directamente en aplicaciones y plataformas web, consolidándose como una alternativa accesible y eficiente.
Lanzado el 10 de enero de 2025, el modelo R1 de DeepSeek ofrece un rendimiento comparable a los modelos avanzados de OpenAI de forma gratuita. Foto: DeepSeek
¿Qué es DeepSeek, el disruptor chino en inteligencia artificial que superó a ChatGPT?
El éxito de DeepSeek en el mercado estadounidense es un hito. El modelo R1 fue clasificado como el tercero más potente a nivel global, según Chatbot Arena, un proyecto de evaluación desarrollado por la Universidad de California, Berkeley. Este reconocimiento lo posiciona solo detrás de los modelos Gemini de Google, pero por delante de los de OpenAI.
¿Qué hace que DeepSeek sea tan innovador? Su modelo optimizado utiliza 37.000 millones de parámetros activos, frente a los 1.800 millones de los modelos tradicionales. Esto permite que sus algoritmos operen con GPU convencionales, como las diseñadas para videojuegos, lo que reduce significativamente los costos de hardware. El entrenamiento del modelo R1 costó solo 6 millones de dólares, un contraste frente a los más de 100 millones necesarios para desarrollar modelos como GPT-4.
DeepSeek ha sido clasificado como el tercer modelo de inteligencia artificial más potente a nivel global, utilizando 37.000 millones de parámetros activos. Foto: DeepSeek
La carrera tecnológica en inteligencia artificial entre Estados Unidos y China
El ascenso de DeepSeek representa un nuevo capítulo en la competencia tecnológica entre China y Estados Unidos. Mientras Estados Unidos mantiene restricciones severas en la exportación de chips avanzados como las GPU A100 y H100 de Nvidia, China ha impulsado su autosuficiencia tecnológica con desarrollos innovadores como los modelos de DeepSeek.
Según Angela Zhang, profesora de Derecho de la Universidad del Sur de California, estas restricciones pueden estar "fomentando la innovación en China" al obligar a las empresas a optimizar sus recursos. El modelo R1, desarrollado en solo dos meses, es un claro ejemplo de cómo la eficiencia puede compensar la falta de recursos computacionales.
Además, DeepSeek ha provocado una sacudida en los mercados financieros. Empresas como Nvidia y Oracle registraron caídas significativas en sus valores tras el anuncio del éxito de DeepSeek, mientras el Nasdaq 100 experimentó su mayor descenso desde 2022. Marc Andreessen, un destacado capitalista de riesgo, comparó este avance con el "momento Sputnik" de la carrera espacial.