• El Board AI
  • Posts
  • ¿Qué es todo lo que pasa con DeepSeek?

¿Qué es todo lo que pasa con DeepSeek?

La compañía china revolucionó el mundo de la IA durante los últimos días.

¡Buenos días!

Hoy lunes, un envío especial:

1️⃣ DeepSeek llegó para revolucionar… ¿Qué significa esto?

1️⃣ La entrada de DeepSeek al ruedo 🥷 

Imagen: DeepSeek

Desde hace algunas semanas, DeepSeek, una empresa china que era desconocida hace un tiempo, se ha llevado la atención en el mundo IA.

¿La razón? DeepSeek publicó sus modelos más recientes en los últimos días, sorprendiendo al mundo entero con su calidad y bajo precio:

1️⃣ El nuevo modelo de DeepSeek, R1, funciona tan bien como o1, el modelo más avanzado de OpenAI cuando se mide en evaluaciones estándares de la industria.

2️⃣ A su vez, entrenar a DeepSeek R1 costó aproximadamente 40% menos que otros modelos de OpenAI.

3️⃣ Los tokens de uso de DeepSeek R1 son hasta 25 veces más baratos que los de o1, de Open AI.

En resumen, DeepSeek desarrolló un modelo mucho más barato, de manera ultra-eficiente, y haciéndolo a su vez muy accesible a los consumidores finales (una buena noticia, pues la competencia abarata los precios, y vuelve más accesible la tecnología).

Comparación del funcionamiento de DeepSeek R1 y el costo de sus tokens vs. otros modelos.

La clave de todo esto también es el origen de DeepSeek: China 🇨🇳

Mientras las compañías más grandes del mundo (OpenAI, Meta, Anthropic) han gastado millones de dólares en desarrollar sus modelos, y el gobierno de EE.UU se ha esforzado en proteger los avances locales, una compañía china, puso a todo Occidente a usar su modelo (y cuestionar los de los demás competidores).

¿Qué sigue?

A partir de este punto, los caminos son varios.

Primero, esto pone contra la pared a empresas como OpenAI para ser más eficientes en sus desarrollos, y abre la puerta a que millones de consumidores en el mundo accedan a un modelo mucho más barato pero igual de eficiente.

Por otro lado, muchos expertos se cuestionan la relevancia de empresas como NVIDIA (de la cual salen las GPUs con las que se entrenan los modelos, y que son bastante caros), pues DeepSeek logró hacerlo con unidades menos potentes y desactualizadas, debido a las sanciones comerciales de EE.UU. a China, que no permiten acceder a lo último de estas tecnologías.

DeepSeek llegó para retar a los grandes jugadores, y promete quedarse a dar la pelea.

Buen lunes, inicio de semana 🙌