Silicon Valley se enfrenta ahora a una técnica de desarrollo de IA que podría cambiar radicalmente la clasificación. La destilación es la idea de que un equipo pequeño, prácticamente sin recursos, puede crear un modelo de IA avanzado extrayendo conocimiento de uno más grande. Aunque la empresa emergente china de IA DeepSeek no inventó el método, su uso de la técnica sacudió el mercado de valores y despertó al mundo de la IA a su potencial disruptivo.
¿Qué es la destilación?
La destilación ahora permite que las empresas emergentes y los laboratorios de investigación menos capitalizados compitan en la vanguardia más rápido que nunca. Los avances de DeepSeek también marcaron el comienzo de un nuevo orden de código abierto, basado en la creencia de que la transparencia y la accesibilidad impulsan la innovación más rápido que la investigación a puerta cerrada. Esa combinación (la nueva tracción de la destilación y el aumento de la popularidad del código abierto) supone un gran desafío para las ventajas competitivas que tenían los principales actores de la IA. Este vídeo también incluye la entrevista completa de Bosa con el director ejecutivo de Glean, Arvind Jain.
¿Qué impacto puede tener?
La destilación facilita que startups y laboratorios con menos recursos compitan al nivel de los gigantes tecnológicos. Google fue pionero en esta técnica, pero otras marcas como DeepSeek han logrado aplicarla también de manera efectiva, generando gran interés en el mercado financiero. En apenas dos meses, DeepSeek superó avances de OpenAI con un presupuesto de menos de 6 millones de dólares. Este proceso permite la creación de modelos de razonamiento avanzados, como Sky T1, por apenas 450 dólares y en menos de 19 horas.
Sky T1 es un modelo de lenguaje de inteligencia artificial de código abierto desarrollado por investigadores de la Universidad de California. Este modelo, enfocado en tareas de razonamiento, destaca por su alto rendimiento y su asequible coste de entrenamiento y tiempo, como mencionamos en el párrafo anterior. Las principales características de Sky T1 son la accesibilidad (código abierto), la optimización y la sostenibilidad (al minimizar el tiempo y coste de entrenamiento)
Desarrollos como Sky T1 demuestran que se han registrado casos donde la destilación ha producido modelos altamente eficientes con costos mínimos. Además, de crear un modelo comparable a OpenAI O1 por un coste inferior. Otros ejemplos son Stanford y la Universidad de Washington, que generaron S1 en 26 minutos y con menos de 50 dólares en créditos de computación. Esto plantea dudas sobre la sostenibilidad de la ventaja competitiva de las grandes empresas de IA. Microsoft y OpenAI investigan si DeepSeek utilizó ilegalmente su tecnología, lo que subraya la controversia en torno a la destilación.
DeepSeek y su papel con el código abierto
Otro cambio paradigmático que ha traído DeepSeek es la proliferación del código abierto. La publicación de modelos como V3 y R1 permite a cualquiera descargarlos, usarlos y modificarlos, lo que desafía la estrategia de código cerrado que empresas como OpenAI han defendido. La disponibilidad de estos modelos genera presión en las grandes compañías para reducir costos y aumentar la accesibilidad.
Sam Altman, CEO de OpenAI, admitió en Reddit que su empresa podría haber estado en el lado equivocado de la historia al optar por el código cerrado. La caída en los costos de ejecución de IA también ha impactado en la industria. Por ejemplo, DeepSeek R1 cuesta solo 2.19 dólares por millón de tokens, en comparación con los 60 dólares de OpenAI O1. Esta reducción de costos favorece a startups y desarrolladores que antes dependían de proveedores costosos como OpenAI, Google y Anthropic.
AGI a Cualquier Costo
A pesar del avance del código abierto y la destilación, los gigantes de la IA no han cambiado su estrategia de momento. OpenAI busca recaudar 40 mil millones de dólares de SoftBank, Meta, Microsoft, Google y Amazon para desarrollar IA de siguiente generación. Estas empresas continúan apostando por la inteligencia artificial general (AGI), destinando sumas colosales a la investigación y desarrollo.
La paradoja de Jevons explica cómo el aumento en la eficiencia de un recurso provoca un mayor uso del mismo, lo que refuerza la inversión en IA. Empresas como Nvidia han recuperado su valor tras la caída inicial causada por DeepSeek, y las compañías Fortune 100 ya consideran cambiar su estrategia de IA para reducir costos en APIs como ChatGPT de OpenAI.
Para OpenAI, el objetivo es alcanzar la superinteligencia artificial (ASI), que supere a la inteligencia humana en creatividad y resolución de problemas. La destilación mejora la eficiencia, pero no genera los avances disruptivos necesarios para lograr la AGI o ASI, por lo que la competencia por dominar esta tecnología sigue siendo feroz.
Un cambio de paradigma
Arvind Jain, CEO de Glean, comparte su visión sobre el cambio de paradigma en IA, “Antes se creía que solo grandes empresas podían desarrollar modelos avanzados, pero la destilación ha demostrado que startups pueden competir con modelos eficientes y accesibles. Empresas que antes dependían de los LLMs de OpenAI ahora pueden elegir entre diversas opciones en el mercado”.
Glean, al igual que otras empresas, está probando modelos como DeepSeek y OpenAI, evaluando costos, rendimiento y seguridad. Aunque OpenAI sigue siendo un referente, la destilación ha democratizado el acceso a la IA, permitiendo que cualquier empresa optimice sus procesos con modelos más baratos y eficientes.
La IA está evolucionando rápidamente, y la destilación ha cambiado la manera en que las empresas adoptan estos modelos. OpenAI y otras compañías tendrán que ajustar sus estrategias para seguir siendo competitivas en este entorno cambiante.