A diferencia de los LLM tradicionales, estos modelos SR toman tiempo extra para crear respuestas y este tiempo extra a menudo aumenta el rendimiento de las matemáticas, la física y la ciencia. Y este último modelo abierto se está volviendo a OpenAi rápidamente.

Por ejemplo, Deepeek Informes R1 supera el O1 de OpenAI en varios puntos de referencia y pruebas AIME (Prueba lógica matemática), Matemáticas-500 (Una colección de problemas de palabras), y Swe-Bench Verificado (Herramienta de evaluación de programación). Como generalmente mencionamos, los puntos de referencia de IA deben tomarse con grano de sal y estos resultados aún no se han verificado de forma independiente.

Los resultados de referencia Deepseek R1 creados por Deepeek.

Los resultados de referencia Deepseek R1 creados por Deepeek.


Crédito:

Sésido profundo


Crujido tecnológico Informes Tres laboratorios chinos-Deepsek, Alibaba y Moonshot AIS Como-La ahora se han lanzado los modelos, comparan las capacidades de O1, DeepSek obtendrá la primera vista previa de R1 en noviembre.

Pero viene con captura mientras se ejecuta en el nuevo modelo de Deepsek Versión de nube-anfitrión– Dado que el origen de los chinos, Tianonman no crea respuestas R1 sobre factores específicos como Square o Taiwán autónomo, debe formarse “.Invertir los principales valores socialistas,“De acuerdo con las reglas de Internet china. Este filtrado proviene de la capa de moderación adicional. El modelo no es un problema si el modelo se ejecuta localmente fuera de China.

A pesar de la posible censura, investigador de IA en la Universidad George Mason, Dean Ball, Escribió en x“El desempeño impresionante de los modelos de destilación de Deepseek (pequeñas versiones de R1) significa que la mayoría de los racionalistas competentes continuarán expandiéndose generalizados y podrán ejecutar en el hardware local lejos de cualquier administración de control de arriba hacia abajo”.

Source link