El modelo O3 de OpenAI tiene una prueba de lógica de IA, pero todavía no es AGI

28 enero 2025

Operai declara la práctica de progreso para su nuevo modelo O3 AI

Rock Tenis / Alami

El nuevo Modelo de Inteligencia Artificial de O3 de O3 ARC Challenge ha obtenido una puntuación alta en la prestigiosa prueba de razonamiento de IA, que ha sido anotada por algunos fanáticos de la IA que la inteligencia general artificial de O3 (AGI) ha logrado. Aunque los gerentes de ARC Challenge describieron el O3 como un hito importante, advirtieron que no ganaría un gran regalo de competencia, y fue solo un paso en el camino hacia el AGI, lo cual fue una palabra para la futura IA de OT. con inteligencia humana.

El modelo O3 es el último de una serie de lanzamientos de IA que se deducen de modelos de idiomas grandes que energizan ChatGPT. “Es una función de fase sorprendente e importante en las capacidades de IA, que muestra la capacidad de adaptar la novela, que nunca se ha visto en los modelos de familia GPT”. Francois ColetteEl principal creador del ingeniero y el desafío de arco en Google, un Blog.

¿Qué hizo realmente el modelo O3 de Operai?

Diseño de colette Corpus abstracto y lógico (ARC) Desafío en 2019 para probar qué tan bien AIS puede encontrar las muestras correctas que conectan los pares de cuadrículas de color. Tales rompecabezas visuales están destinados a demostrar un aspecto de inteligencia general con capacidades lógicas básicas. Pero si arroja suficiente potencia informática en los rompecabezas, el programa de no condición también les permitirá arreglarlos a través de la fuerza bruta. Para evitar esto, también se requieren presentaciones de puntajes oficiales para cumplir ciertas restricciones en el poder informático de competencia.

El nuevo modelo O3 de OpenAI se lanzará a principios de 2025-Arc-Arc Challenge Examen “semiprivado” de su puntaje de progreso oficial del 75.7 por ciento, que se utiliza para clasificar a los competidores en la tabla de clasificación pública. El costo de la computación de su práctica para cada trabajo de rompecabezas visual es de aproximadamente $ 20, que es un límite competitivo de menos de $ 10,000. Sin embargo, existe un límite de potencia informática más estricto para la dura prueba “privada” utilizada para determinar los ganadores del gran premio, que es equivalente a gastar solo 10 centavos para cada tarea, lo que no está abierto.

El modelo O3 ha logrado una puntuación no oficial del 87.5 por ciento al aplicar aproximadamente 172 veces más potencia informática que en la puntuación oficial. .

Pero para alcanzar su puntaje no oficial, el costo de O3 ha aumentado a miles de dólares para resolver cada trabajo. Los gerentes de desafío solicitaron que OpenA no publique costos informáticos precisos.

¿Estos instrumentos O3 muestran que AGI ha llegado?

No, dijeron que los gerentes de ARC Challenge no consideran a la AGI como un indicador de derrotar el punto de referencia competitivo.

El modelo O3 no pudo resolver más de 100 tareas de rompecabezas visuales, aunque el puntaje no oficial de OpenAI se ha aplicado a una gran cantidad de potencia informática, dijo el organizador de ARC Challenge Mike Nap en la compañía de software Japier en las redes sociales. Correo INCÓGNITA.

En las redes sociales Correo En el bluesky, Melania Michelle Lo siguiente declaró sobre el progreso de O3 en el Instituto Santa Fe en Nuevo México, “la computación de fuerza bruta derrota la ventaja original”.

“El nuevo modelo está muy impresionado y representa un gran hito cuando se dirige hacia AGI, no creo que sea AGI – O3 son tareas muy simples (desafíos ARC)”. Colette en otra x Correo.

Sin embargo, Colette explica cómo sabemos al realizar inteligencia a nivel humano a través de algún tipo de AGI. “El ejercicio que crea las tareas más difíciles para los seres humanos comunes, pero la IA es simplemente imposible”, dijo en una publicación de blog.

Thomas Dieterich Oregon representa otra forma de identificar la Universidad Estatal AGI. “Esas estructuras tienen todos los componentes funcionales necesarios para el conocimiento humano”, dijo. “A través de esta medición, los sistemas comerciales de IA tienen memoria episódica, planificación, razonamiento lógico y, lo más importante, no hay metaconcección”.

Entonces, ¿qué significa realmente el alto puntaje de O3?

En comparación con los primeros desarrollos explosivos de 2023, el modelo O3 viene con un progreso lento en los últimos modelos de IA para la industria tecnológica e investigadores de IA 2024.

Aunque no gana el desafío ARC, el puntaje alto de O3 indica que los modelos de IA pueden derrotar el punto de referencia competitivo en el futuro cercano. Colette dijo que muchas ofertas oficiales de baja computadora ya han obtenido más del 81 por ciento del comité de prueba de evaluación privada, más allá de su puntaje no oficial.

El Deterich también piensa que es “un salto muy impresionante en el rendimiento”. Sin embargo, advirtió que es imposible predecir cómo impresionar la puntuación más alta, sin saber más cómo los modelos O1 y O3 de los modelos O1 y O3 de Opray. Por ejemplo, si el arco de O3 puede practicar problemas por adelantado, facilitará su práctica. “Tenemos que esperar una replicación de código abierto para comprender la importancia total de esto”, dijo Dieterich.

Los gerentes de ARC Challenge ya están buscando comenzar las segundas y difíciles pruebas de referencia en 2025. También mantendrán el desafío del Premio ARC 2025 hasta que alguien haya ganado un gran regalo y su solución son fuentes abiertas.

Cosas:

Inteligencia artificial/ / / / / /
AI

Source link

El modelo O3 de OpenAI tiene una prueba de lógica de IA, pero todavía no es AGI

¿Qué hizo realmente el modelo O3 de Operai?

¿Estos instrumentos O3 muestran que AGI ha llegado?

Entonces, ¿qué significa realmente el alto puntaje de O3?

Noticias de hoy

Programa de animación de Ventures Ridiculoso de Don Houser y juego...

Los mejores teléfonos Android para 2025

Money de estilo de vida y consejos expertos sobre cómo evitarlo

Congo dice que el ejército en Goma mató a 773 personas...

Joe Saldana ‘Emilia Perez’ Coster Carla Sofia Gascon reacciona al debate

Dejar x será una decisión difícil para las empresas

El modelo O3-Mini de OpenAI está saliendo

Según los editores, los mejores anillos inteligentes para la salud

Los agentes reducen el gasto estatal para las elecciones presidenciales 2026

Notas de enlaces de NYT de hoy, respuestas para el 2...

El oficial del Tesoro se retira después de una confrontación con...

Idea fácil de reinicio del hogar de expertos

Nicho principal: evolución del turismo halal en la industria de viajes...

War vecina de la casa de vacaciones de Peter Gav

Categoría