DeepSeek: quién está detrás de la alternativa china a ChatGPT

DeepSeek se encuentra actualmente en la cima de la potencia de las IAs gracias a un desarrollo más pulido y concienzudo que el de sus rivales.

Donald Trump, el recién nombrado presidente de los Estados Unidos, ha lanzado su ambicioso plan para dominar el futuro de la IA. El Proyecto Stargate de 500.000 millones de dólares es una apuesta increíblemente ambiciosa por hacerse con el mercado.

Pero ahora, una IA de China parece haber puesto en entredicho el planteamiento de una política dela que se cree que podría colapsar antes de comenzar a echar a andar. Y es que, de acuerdo con Wired esta IA hace todo con el mismo rendimiento que o1 de OpenAI pero con una fracción de su coste.

Deep Seek es una IA o modelo de lenguaje de origen chino y de código abierto que ha saltado a la palestra recientemente por su increíble capacidad para igualar a OpenAI y su modelo más potente, o1, pero con una pequeñísima fracción de su gasto.

La idea surgió de un fondo de cobertura chino y está dirigida por Liang Wenfeng, su fundador, que ha enfocado los recursos en desarrollar una IA general artificial con la calidad en mente en lugar de la velocidad para comercializarla. Esto es muy interesante, porque ha preferido ir más lento en la carrera por alcanzar la supuesta inteligencia artificial general (AGI), pero hacerla mucho más fiable para los usuarios y con un enfoque más colaborativo.

Porque, uno de sus puntos fuertes es que es parcialmente de código abierto en todos sus modelos, lo que permite entender cómo funciona y cuáles son los puntos que podrían ayudar a potenciarla.

La falta de medios agudiza el ingenio

Hasta ahora, el objetivo de la mayoría de IAs era hacerlo todo más grande para así tener más potencia y poder analizarlo todo de una forma mucho más eficiente. Sin embargo, Estados Unidos vetó a China del hardware necesario para llevar a su IA a un nuevo nivel, o esa era la intención. Realmente han conseguido hacer que la IA sea más eficiente.

Desde 2022, China no tiene acceso a chips avanzados con tecnología propietaria de EE. UU. lo que hizo que se vieran obligados a optimizar sus métodos de entrenamiento para llevarlos a un nuevo nivel.

El equipo de desarrollo, lleno de jóvenes talentos recién salidos de universidades técnicas en Pekín o Tsinghua han hecho lo que a priori parecía imposible, batir de la nada a Estados Unidos con un enfoque de código abierto y con la capacidad de ser más eficiente en su uso. Y es que solo costaría un 5% del precio total de las soluciones de IA que ofrece OpenAI.

Y es que, hasta ahora, las IAs chinas se habían quedado rezagadas respecto al potencial de Estados Unidos, pero parece que esto ha cambiado con el lanzamiento de la versión R1 de DeepSeek. Para ello, utilizaron sistemas con esquemas de comunicación personalizados entre chips para que los modelos consumieran mucho menos recursos. Las tecnologías clave para esto han sido la Multi-head Latent Attention (MLA) y la Mixture-of-Experts.

Aunque pueda parecer baladí, DeepSeek es un golpe sobre la mesa que demuestra que la IA puede dar mucho de sí sin esa potencia bruta desenfrenada que se ha tratado de vender como algo inevitable en la carrera por tener el modelo más potente.

LA VANGUARDIA

Comparte en Facebook