DeepSeek, el nuevo modelo chino de inteligencia artificial (IA), ha sacudido el mundo digital tras saltar a la cima de descargas de aplicaciones en Apple Store.
29/01/2025 8:15
Escuchar esta nota
DeepSeek, el nuevo modelo chino de inteligencia artificial (IA), fue lanzado el 20 de enero y rápidamente cautivó a los adeptos de la informática antes de llamar la atención de toda la industria tecnológica y del mundo.
El presidente de Estados Unidos, Donald Trump, calificó el fenómeno como una "llamada de alarma" para las empresas de ese país que deberán concentrarse en "competir para ganar".
Lo que hace a DeepSeek tan especial es la afirmación de sus creadores de que fue producida a una fracción del costo de otros modelos en la vanguardia de la industria como el ChatGPT de OpenAI, porque utiliza menos chips de tecnología avanzada.
¿Qué es DeepSeek?
En términos sencillos, DeepSeek es un chatbot potenciado por IA, como ChatGPT. Es una aplicación gratuita que se puede descargar de la tienda Apple Store, donde DeepSeek afirma que está diseñada "para contestar tus preguntas y realzar tu vida eficientemente", publica la BBC en un extenso reportaje.
Pero el modelo de IA que lo impulsa -llamado R1- tiene unos 670.000 millones de parámetros, lo que lo convierte en el mayor modelo de lenguaje de fuente abierta hasta la fecha, según Anil Ananthaswamy, autor de Why Machines Learn: The Elegant Math behind Modern AI ("Por qué aprenden las máquinas: Las elegantes matemáticas detrás de la IA moderna").
Se dice que es tan potente como el modelo O1 de OpenAI, que potencia a ChatGPT, en matemáticas, codificación y razonamiento. También se afirma que es capaz de hacer todo eso de manera mucho más barata; sus desarrolladores afirman que construirla costó U$6 millones, un presupuesto austero comparado con los miles de millones invertidos por las empresas de IA en EE.UU.
No está claro cómo lo consiguieron. El fundador de DeepSeek supuestamente almacenó avanzados chips A100 de Nvidia antes de que su exportación a China fuera prohibida en septiembre de 2022. Los expertos creen que esta provisión, que algunos estiman en 50.000, le permitió construir un modelo de IA tan potente al parear estos chips con otros más baratos y menos sofisticados.
¿Cómo se compara con ChatGPT o Gemini?
DeepSeek se ve y se siente como cualquier otro chatbot, aunque se inclina más hacia la conversación. Al igual de ChatGPT de OpenIA o Gemini de Google, puedes abrir la aplicación (o su sitio web) y hacerle preguntas sobre cualquier cosa, y el chat se esfuerza por darte una respuesta. Sus respuestas son extensas, pero no emite una opinión aunque le pidas directamente por una.
El chatbot suele empezar su respuesta diciendo que el tema es "altamente subjetivo" -ya se trate de política (¿Es Donald Trump un buen presidente?) o de refrescos (¿Cuál sabe mejor, Pepsi o Coca-Cola?). Ni siquiera se compromete a decir si es mejor o no que su rival ChatGPT, pero sí hizo una comparación de los pros y contras de ambas inteligencias artificiales. ChatGPT hizo exactamente lo mismo, usando un lenguaje similar.
DeepSeek indica que fue entrenada con datos hasta octubre de 2023 y, aunque la app parece tener acceso a información actualizada, la versión web no lo tiene. Eso es parecido a las primeras versiones de ChatGPT y probablemente es un intento similar de protección, para evitar que el chatbot lance información incorrecta a la web en tiempo real.
También puede responder bastante rápido, aunque actualmente está un poco frenada bajo la carga de tantos usuarios corriendo a probarlo desde que se volvió viral.
ChatGPT y Gemini tienden a promover sus servicios de subscripción, que pueden rondar los US$20 mensuales, para información más detallada, mientras que DeepSeek es gratis aunque más limitado.
¿Quién está detrás de DeepSeek?
DeepSeek fue fundada en diciembre de 2023 por Liang Wenfeng y lanzó su primer modelo de lenguaje amplio de IA el año siguiente. No es mucho lo que se sabe de Liang, graduado de la Universidad de Zhejiang en ingeniería de información electrónica y ciencias computacionales. Pero ahora se encuentra en el centro de la atención internacional. Recientemente se lo ha visto en una reunión organizada por el primer ministro de China, Li Qiang, para discutir el creciente protagonismo de DeepSeek en la industria de IA.
A diferencia de muchos de los empresarios de IA estadounidenses que vienen de Silicon Valley, Liang tiene antecedentes en el sector financiero. Es director ejecutivo de un fondo de protección llamado High-Flyer, que usa IA para analizar datos financieros con miras a tomar decisiones de inversión, lo que se conoce como comercio cuantitativo. En 2019, High-Flyer se convirtió en el primer fondo cuantitativo en China en recaudar más de 100.000 millones de yuanes (US$13 millones).
En un discurso que dio ese año, Liang declaró: "Si EE.UU. puede desarrollar su sector de comercio cuantitativo, ¿por qué no China?". En una inusual entrevista el año pasado, señaló que el sector de IA de China "no puede continuar siendo un seguidor". "Solemos decir que hay una brecha de uno o dos años entre la IA china y la de EE.UU., pero la brecha real está entre la originalidad y la imitación. Si eso no cambia, China seguirá siendo un seguidor". Cuando se le preguntó por qué el modelo DeepSeek sorprendió a tantos en Silicon Valley, respondió: "Su sorpresa viene de ver una empresa china entrar en el juego como innovadora, no simplemente una seguidora".
Mira la programación en Red Uno Play
03:00
04:00
04:55
05:55
06:00
07:00
03:00
04:00
04:55
05:55
06:00
07:00