OpenAI da un giro radical y lanza modelos de IA de código abierto

OpenAI ha tomado una decisión histórica al lanzar dos modelos de inteligencia artificial de código abierto, gpt-oss-120b y gpt-oss-20b, después de años de mantener un control estricto sobre sus desarrollos. Este cambio se produce en un contexto competitivo donde empresas como DeepSeek han demostrado que pueden ofrecer capacidades similares a las de OpenAI a un coste mucho más bajo. La presión por adaptarse a un ecosistema global en evolución ha llevado a la compañía liderada por Sam Altman a reconocer que su enfoque anterior ya no es sostenible.

Un cambio inesperado en la estrategia de OpenAI

Desde el lanzamiento de GPT-2 en 2019, OpenAI había rechazado la idea de liberar sus modelos, citando preocupaciones de seguridad. Sin embargo, el desarrollo de competidores, especialmente en Asia, ha empujado a la empresa a reconsiderar su postura. En enero, la llegada de DeepSeek R1 al mercado, con capacidades de razonamiento a un costo reducido, marcó un punto de inflexión que intensificó la presión sobre OpenAI.

Altman ha admitido que la empresa estaba “en el lado equivocado de la historia”, lo que llevó al lanzamiento de sus nuevos modelos. El gpt-oss-120b contiene 117.000 millones de parámetros, pero solo activa un 4,4% de ellos, gracias a su arquitectura basada en Mixture of Experts (MoE). Esto le permite ejecutarse en una única GPU de 80 GB.

Rendimiento y limitaciones de los nuevos modelos

La versión ligera, gpt-oss-20b, activa un 17,2% de sus parámetros y es capaz de funcionar incluso en portátiles con 16 GB de RAM, aunque su rendimiento es limitado. En pruebas, el gpt-oss-120b obtuvo una puntuación de 58 en el Índice de Inteligencia y 2622 en Codeforces, superando a otros modelos ligeros, aunque sin alcanzar la potencia de los más avanzados, como GPT-4.

Ambos modelos tienen la capacidad de razonar en cadena sin supervisión directa, lo que aumenta su transparencia. Sin embargo, presentan tasas de alucinación más altas que sus versiones propietarias, con un 49% y 53% frente al 16% de GPT-4-o.

Un lanzamiento estratégico en un nuevo contexto

A pesar de su apertura, OpenAI ha decidido no compartir los datos de entrenamiento y ha limitado las funciones del modelo a tareas de texto, excluyendo capacidades multimodales. Los modelos están disponibles bajo la licencia Apache 2.0 en plataformas como Hugging Face y se integran en herramientas como Ollama y LM Studio.

Como parte de esta transición, OpenAI ha lanzado un Red Teaming Challenge, ofreciendo 500.000 dólares en premios para identificar posibles riesgos de seguridad asociados a sus nuevos modelos. Este movimiento no solo responde a la presión competitiva, sino también a un contexto político donde la administración Trump ha instado a las empresas tecnológicas estadounidenses a adoptar un enfoque más abierto.

OpenAI busca validar sus modelos en entornos reales mediante colaboraciones con socios como Orange, Snowflake y AI Sweden, evaluando la sostenibilidad económica de este enfoque abierto.

El lanzamiento de estos modelos de código abierto representa un cambio significativo en la historia de la inteligencia artificial, donde OpenAI, anteriormente símbolo del hermetismo, acepta que el futuro de la IA debe ser también abierto. Este movimiento redefine el mapa tecnológico, situando el código abierto en el centro de la innovación global.