Únase a nuestros boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo en la cobertura de IA del frente industrial. Obtenga más información


Se ha producido el lanzamiento del modelo racional Deepseek R1 Ondas de choque en toda la industria de la tecnologíaEl signo más obvio de repente Ventas de las principales acciones de IA. La ventaja de los laboratorios de IA bien financiados como Opanai y Andric no parece ser muy firme, ya que Deepseek ha podido construir su competidor O1 en parte del costo.

Si bien algunos laboratorios de IA están actualmente en crisis, esta es a menudo una buena noticia para el sector corporativo.

Aplicaciones baratas, aplicaciones adicionales

Como hemos dicho antes, una de las tendencias para ver para 2025 es una caída continua en el costo de usar modelos de IA. Las empresas son conscientes de que los precios continuos deben usarse para usar prototipos con los últimos modelos de IA, independientemente del precio.

Esa tendencia vio un gran cambio de paso. Costos de OpenAI O1 Un millón de tokens de salida $ 60 Contra Deepseek R1 por un millón de 19 2.19. Además, si le preocupa enviar sus datos a los servidores chinos, puede acceder a R1 en proveedores basados ​​en EE. UU. Juntos Y GalletasEl precio de $ 8 y $ 9 por millón de tokens respectivamente, respectivamente, una gran oferta en comparación con O1.

De hecho, el O1 aún es más borde que R1, pero no es suficiente para justificar la diferencia en un precio tan grande. Además, las habilidades de R1 son suficientes para la mayoría de las aplicaciones corporativas. Además, se espera que los modelos más avanzados y eficientes sean lanzados en los próximos meses.

Espere los efectos de segundo lugar en el mercado general de IA. Por ejemplo, el CEO de Operai, Sam Aldman, anunció que los usuarios gratuitos de Saadgift pronto se acercarían al O3-Mini. Aunque no se refiere abiertamente al R1, se dice que el anuncio se realizó poco después de que se lanzó el R1.

Más innovación

El R1 todavía deja muchas preguntas; por ejemplo, hay muchos informes de que la Openiaa ha enseñado al modelo Deepseek en salidas de modelos de lenguaje grande (LLM). Pero si su informe en papel y su informe técnico son correctos, Deepseek ha podido crear una muestra, que coincide con el arte sofisticado cuando reduce los costos y elimina algunas de las actividades técnicas que requieren mucha mano de obra manual.

Si otros pueden reproducir los resultados de Deepseek, esta puede ser una buena noticia para los laboratorios y empresas de IA marginadas por el obstáculo financiero de la innovación en este campo. Las empresas pueden esperar una invención rápida y más productos de IA para alimentar sus aplicaciones.

¿Qué sucede con los miles de millones de dólares gastados en comprar grandes aceleraciones de hardware de tecnología? Todavía no hemos alcanzado el techo con IA, por lo que las compañías tecnológicas líderes pueden hacer sus recursos más. La IA más asequible, de hecho, aumenta la necesidad de mucho tiempo en el medio.

Pero lo más importante, el R1 es una prueba de que todo no es vinculante con grandes grupos y bases de datos. Con las chuletas de ingeniería correctas y la buena habilidad, puede superar los límites de posibles.

Código abierto para el éxito

Para ser claros, el R1 no está completamente abierto, porque Deepseek solo ha liberado pesas, pero no el código o los detalles completos de los datos de capacitación. Sin embargo, este es un gran éxito para la comunidad de código abierto. Desde el lanzamiento de Deepseek R1, se han lanzado más de 500 descendientes en la cara abrazada, y el modelo ha sido descargado millones de veces.

Esto también proporcionará más flexibilidad sobre dónde ejecutar sus modelos para las empresas. Además de todo el modelo de 671 mil millones de tamaño, hay versiones filtradas de la R1 que ayudan a las empresas a ejecutar el modelo en una variedad de hardware, que van desde 1.500 millones a 70 mil millones de parámetros. Además, a diferencia del O1, R1 revela su cadena de pensamiento completa, y los desarrolladores tienen la mejor comprensión del comportamiento del modelo y la capacidad de guiarlo en la dirección deseada.

Al atrapar modelos cerrados, podemos esperar actualizar la determinación de compartir conocimiento e investigación, para que todos puedan beneficiarse de los avances de la IA.


Source link