- Los últimos estudios de Bain & Company, muestran que, a pesar de las afirmaciones de DeepSeek, aún persisten varias incertidumbres como el verdadero costo de entrenamiento y propiedad intelectual, en particular en relación con las fuentes y los métodos utilizados.
Febrero 2025 – DeepSeek, una start-up china de inteligencia artificial, causó gran revuelo internacional al lanzar su modelo de código abierto, DeepSeek R1, con menos de 200 empleados y el respaldo del fondo High-Flyer. En cuestión de días, se convirtió en la aplicación más descargada en las tiendas de aplicaciones de EE. UU., generó más de 700 derivados de código abierto (y la cifra sigue aumentando) y fue incorporada a las plataformas como Microsoft, AWS y Nvidia.
Lo que distingue a este modelo es la perspectiva de eficiencia de costos, pues afirman haberlo entrenado por solo 6 millones de dólares utilizando 2000 unidades de procesamiento gráfico (GPU) Nvidia H800. El rendimiento de esta herramienta parece basarse en una serie de innovaciones de ingeniería que reducen significativamente los precios de inferencia y, al mismo tiempo, mejoran el costo de capacitación.
Para Marcial Rapela, socio y responsable de la oficina de Bain & Company en Chile, esta tecnología trajo muchas sorpresas. “Más allá de la arquitectura, DeepSeek ha mejorado la forma en que maneja los datos. Su método reduce los costos computacionales, evita el desperdicio de recursos en información redundante y ha incorporado técnicas de escasez lo que mejora tanto la velocidad como la eficiencia. Hasta ahora, estos resultados no son sorprendentes; ya que coinciden con las tendencias más amplias en materia de eficiencia de la IA. Pero llama la atención que una start-up china de código abierto haya logrado cerrar o al menos reducir significativamente la brecha de rendimiento con los principales modelos propietarios”.
Para los directores ejecutivos, este episodio no tiene que ver tanto con una empresa en particular, sino con lo que significa para el futuro de la IA. La lección es clara: el ritmo de la innovación es rápido e iterativo, y los avances pueden surgir de lugares más inesperados.
Al respecto, la consultora aclaró que, ante este tipo de disrupciones, hay que evitar reaccionar exageradamente. Si bien el modelo en sí no es una amenaza existencial para las empresas de IA tradicionales, expone la rápida disminución de los costos de IA. Ante esto, las empresas deben prepararse para un mundo en el que la inferencia de IA sea significativamente más barata, lo que permitirá una adopción más amplia y una nueva dinámica competitiva.
Los verdaderos ganadores de la IA serán aquellos que la utilicen para redefinir sus ofertas principales, no solo para reducir costos. Los CEOs deben impulsar a sus organizaciones más allá de la automatización, dirigiendo sus esfuerzos hacia la innovación impulsada por la IA, ya sea en el desarrollo de productos, la personalización del cliente o servicios completamente nuevos.