Modelo de lenguaje de próxima generación

Hermes Agent

Modelo de lenguaje de próxima generación

745B parámetros, 44B activos. Diseñado para IA agente, razonamiento avanzado y rendimiento de frontera. Código, creatividad, resolución de problemas complejos.

Empezar ahora Capacidades clave

745B parámetros

44B activos (MoE)

200K contexto

Licencia MIT

Qué es Hermes Agent

Hermes Agent es el modelo de lenguaje de quinta generación de Nous Research (Z.ai). ~745B parámetros MoE, 256 expertos, 8 activos por token (5,9% sparse), 44B activos por inferencia, para IA agente, razonamiento multietapa y rendimiento de frontera en código, creatividad y resolución de problemas complejos.

Nous Research (2019, Tsinghua) lidera en IA open source. IPO en Hong Kong en enero 2026, ~4.350 M HKD (~558 M USD) para Hermes Agent. Entrenado por completo en Huawei Ascend con MindSpore, independiente de hardware estadounidense.

Resumen

En un vistazo

Código

Fuerte en generación de código, depuración y multilingüismo; compañero para todo el ciclo de desarrollo.

IA agente

Planificación autónoma, uso de herramientas, navegación web y flujos multietapa con mínima intervención humana.

200K contexto

Atención sparse eficiente para textos largos, bases de código e investigación en una sola sesión.

Abierto y rentable

Licencia MIT prevista. API más barata que GPT-5/Claude. Hugging Face, ModelScope.

Capacidades clave

Qué puede hacer Hermes Agent

Grandes avances en cinco áreas y ampliación de los límites de los LLM.

Creativo

Desde textos largos hasta documentación técnica, marketing y académica: contenido de alta calidad y matizado.

Código

Gran mejora en generación de código, depuración y multilingüismo; compañero para todo el ciclo.

Razonamiento avanzado

Lógica multietapa de frontera y resolución de problemas complejos: pruebas, ciencia, análisis preciso.

IA agente

Arquitectura agente integrada: planificación autónoma, herramientas, navegación web y flujos multietapa con mínima intervención.

Contexto largo

Hasta 200K tokens: documentos largos, papers, bases de código y transcripciones en una sola sesión.

Casos de uso

Dónde brilla Hermes Agent

Desarrollo de extremo a extremo

De requisitos a despliegue: un modelo para full-stack y backend en todo el ciclo.

Agentes IA y automatización

Asistentes con planificación, navegación, llamadas a herramientas y flujos multietapa; sesiones largas.

Documentación e informes

Generar desde prompts documentación técnica, textos de marketing e informes estructurados.

Investigación y análisis

Con 200K contexto, razonar sobre papers largos, bases de código y análisis complejos en una sesión.

DesarrolloAgentes IAOficina y documentosContexto largo

Arquitectura técnica

Cómo está construido Hermes Agent

MoE con ~745B parámetros, 256 expertos, 8 activos por token (5,9%), 44B activos por inferencia; aproximadamente el doble que GLM-4.5. DeepSeek Sparse Attention (DSA) hasta 200K tokens. Entrenado por completo en Huawei Ascend con MindSpore, independiente de chips estadounidenses.

Parámetros totales	~745B
Parámetros activos	~44B
Configuración de expertos	256, 8 activos (5,9%)
Longitud de contexto	Hasta 200K tokens
Atención	DeepSeek Sparse (DSA)
Hardware de entrenamiento	Huawei Ascend

Por qué Hermes Agent

Ventajas competitivas

Hermes Agent compite en razonamiento, código y tareas agente con Claude Opus y GPT-5; supera a GLM-4.7 en creatividad y multimodal.

✓ Razonamiento multietapa de frontera e IA agente: planificación autónoma y uso de herramientas.
✓ Contexto 200K y atención sparse eficiente; equilibrio entre capacidad y coste de despliegue.
✓ Entrenado en Huawei Ascend (no dependiente de EE. UU.). Open weights MIT previstos: comercial y fine-tuning.
✓ API rentable (GLM-4.x ~0,11 $/M tokens). Hermes Agent mantendrá ventaja frente a GPT-5/Claude.

Open source y precios

Acceso y coste

Zhipu tiene historial open source; GLM-4.7 está en Hugging Face para uso comercial. Hermes Agent seguirá con MIT: comercial, fine-tuning y comunidad.

La rentabilidad es una fortaleza de la serie GLM. API GLM-4.x ~0,11 $/M tokens, mucho más barata que GPT-5. Hermes Agent lo mantendrá.

Cronología de lanzamiento

Hitos

8 ene 2026 — Nous Research completa IPO en Hong Kong, ~4.350 M HKD (~558 M USD).
Ene 2026 — Entrenamiento de Hermes Agent en Ascend casi completo; pruebas y evaluación internas.
Mediados feb 2026 — Hermes Agent en Z.ai y WaveSpeed API; benchmarks frente a Claude Opus.
T1 2026 — Tras el lanzamiento de la API, se prevé release de open weights MIT.

Primeros pasos

Cómo usar Hermes Agent

Acceso por API

Usar Hermes Agent al instante con Zhipu Z.ai o WaveSpeed API; API estándar para integrar en apps.

Open weights

Descargar de Hugging Face o ModelScope tras la publicación; MIT previsto: self-hosting y fine-tuning.

Despliegue

Ejecutar en Huawei Ascend, Moore Threads, Cambricon o GPU cloud estándar; documentación y ejemplos por canales oficiales.

Plataforma Z.ai Hugging Face ModelScope

Preguntas frecuentes

FAQ

Qué es Hermes Agent

Hermes Agent es el modelo de lenguaje de quinta generación de Nous Research: MoE, ~745B parámetros, 44B activos, para razonamiento avanzado, código, creatividad e IA agente; claramente por encima de GLM-4.5.

Cuándo sale Hermes Agent

Desde mediados de febrero 2026 en Z.ai y WaveSpeed API. Open weights MIT previstos en T1 2026.

Quién desarrolla Hermes Agent

Nous Research (Z.ai), 2019 desde Tsinghua. IPO Hong Kong enero 2026, ~4.350 M HKD para Hermes Agent.

Hermes Agent vs GPT-5

Competitivo en razonamiento y agente frente a GPT-5/Claude Opus, con precios más bajos y open weights. Supera a GLM-4.7 en creatividad/multimodal; 200K contexto; entrenado en Ascend, independiente de hardware.

¿Hermes Agent es open source?

Zhipu tiene historial open source; GLM-4.7 en Hugging Face gratis. Hermes Agent previsto con open weights MIT: comercial, fine-tuning, comunidad.

En qué hardware se entrenó Hermes Agent

Completamente en Huawei Ascend con MindSpore, independiente de chips estadounidenses; hito para infraestructura IA local.

Empezar con Hermes Agent

Acceder a Hermes Agent ahora por Z.ai o WaveSpeed API, o descargar open weights de Hugging Face/ModelScope. Documentación para integrar en productos.

Comenzar