Anthropic Lanza su LLM 'Más Inteligente' Hasta la Fecha: Comparación con OpenAI y DeepSeek
La industria de la inteligencia artificial está dividida entre muchas empresas que compiten por mantenerse a la vanguardia de la tecnología. El progreso a menudo se mide en comparación con los competidores, como en el caso de Anthropic con su nuevo modelo Claude 3.7 Sonnet.
Un Paso Adelante: Anthropic, startup de IA respaldada por Jeff Bezos, anunció el modelo el lunes en su sitio web. La compañía con sede en San Francisco lo llamó su "más inteligente" hasta la fecha.
Anthropic afirma que el modelo tiene capacidades mejoradas para la codificación y el desarrollo web front-end. También permite un modo de "pensamiento extendido", que ofrece un mejor rendimiento que su modelo estándar, aunque tarda más en dar respuesta a una solicitud.
Además, Anthropic señaló un cambio en sus prioridades respecto a las fortalezas del modelo: "...en el desarrollo de nuestros modelos de razonamiento, hemos optimizado un poco menos para problemas matemáticos y de competencia de ciencias de la computación, y en su lugar hemos cambiado el enfoque hacia tareas del mundo real que reflejan mejor cómo las empresas realmente utilizan LLMs," según el anuncio.
Cómo se Compara: Al compararlos, los modelos de lenguaje grande suelen ser más competentes en algunas tareas y menos en otras. OpenAI, dirigido por Sam Altman, y DeepSeek, una empresa con sede en Hangzhou, China, que ha causado revuelo en los mercados financieros con su altamente eficiente LLM, son algunos de los competidores de Anthropic.
Anthropic realizó un análisis comparativo del Claude 3.7 Sonnet frente a los modelos insignia de OpenAI y DeepSeek.
El modelo con modo de pensamiento extendido supera a los modelos o1 y o3-mini de OpenAI y al modelo R1 de DeepSeek prácticamente en todas las categorías, excepto en la resolución de problemas matemáticos. En particular, Claude 3.7 Sonnet se destaca en codificación, superando fácilmente a otros modelos. También es fuerte en razonamiento a nivel de posgrado e interacciones con sistemas externos.
También Leer:
- EXCLUSIVA: 3 ETFs Posicionados para el Avance Cuántico de Microsoft
Imagen: Shutterstock
inteligencia, modelo, comparación