Hermes Agent
Modelo de lenguaje de próxima generación
745B parámetros, 44B activos. Diseñado para IA agente, razonamiento avanzado y rendimiento de frontera. Código, creatividad, resolución de problemas complejos.
Qué es Hermes Agent
Hermes Agent es el modelo de lenguaje de quinta generación de Nous Research (Z.ai). ~745B parámetros MoE, 256 expertos, 8 activos por token (5,9% sparse), 44B activos por inferencia, para IA agente, razonamiento multietapa y rendimiento de frontera en código, creatividad y resolución de problemas complejos.
Nous Research (2019, Tsinghua) lidera en IA open source. IPO en Hong Kong en enero 2026, ~4.350 M HKD (~558 M USD) para Hermes Agent. Entrenado por completo en Huawei Ascend con MindSpore, independiente de hardware estadounidense.
Resumen
En un vistazo
Código
Fuerte en generación de código, depuración y multilingüismo; compañero para todo el ciclo de desarrollo.
IA agente
Planificación autónoma, uso de herramientas, navegación web y flujos multietapa con mínima intervención humana.
200K contexto
Atención sparse eficiente para textos largos, bases de código e investigación en una sola sesión.
Abierto y rentable
Licencia MIT prevista. API más barata que GPT-5/Claude. Hugging Face, ModelScope.
Capacidades clave
Qué puede hacer Hermes Agent
Grandes avances en cinco áreas y ampliación de los límites de los LLM.
Creativo
Desde textos largos hasta documentación técnica, marketing y académica: contenido de alta calidad y matizado.
Código
Gran mejora en generación de código, depuración y multilingüismo; compañero para todo el ciclo.
Razonamiento avanzado
Lógica multietapa de frontera y resolución de problemas complejos: pruebas, ciencia, análisis preciso.
IA agente
Arquitectura agente integrada: planificación autónoma, herramientas, navegación web y flujos multietapa con mínima intervención.
Contexto largo
Hasta 200K tokens: documentos largos, papers, bases de código y transcripciones en una sola sesión.
Casos de uso
Dónde brilla Hermes Agent
Desarrollo de extremo a extremo
De requisitos a despliegue: un modelo para full-stack y backend en todo el ciclo.
Agentes IA y automatización
Asistentes con planificación, navegación, llamadas a herramientas y flujos multietapa; sesiones largas.
Documentación e informes
Generar desde prompts documentación técnica, textos de marketing e informes estructurados.
Investigación y análisis
Con 200K contexto, razonar sobre papers largos, bases de código y análisis complejos en una sesión.
Arquitectura técnica
Cómo está construido Hermes Agent
MoE con ~745B parámetros, 256 expertos, 8 activos por token (5,9%), 44B activos por inferencia; aproximadamente el doble que GLM-4.5. DeepSeek Sparse Attention (DSA) hasta 200K tokens. Entrenado por completo en Huawei Ascend con MindSpore, independiente de chips estadounidenses.
| Parámetros totales | ~745B |
| Parámetros activos | ~44B |
| Configuración de expertos | 256, 8 activos (5,9%) |
| Longitud de contexto | Hasta 200K tokens |
| Atención | DeepSeek Sparse (DSA) |
| Hardware de entrenamiento | Huawei Ascend |
Por qué Hermes Agent
Ventajas competitivas
Hermes Agent compite en razonamiento, código y tareas agente con Claude Opus y GPT-5; supera a GLM-4.7 en creatividad y multimodal.
- ✓ Razonamiento multietapa de frontera e IA agente: planificación autónoma y uso de herramientas.
- ✓ Contexto 200K y atención sparse eficiente; equilibrio entre capacidad y coste de despliegue.
- ✓ Entrenado en Huawei Ascend (no dependiente de EE. UU.). Open weights MIT previstos: comercial y fine-tuning.
- ✓ API rentable (GLM-4.x ~0,11 $/M tokens). Hermes Agent mantendrá ventaja frente a GPT-5/Claude.
Open source y precios
Acceso y coste
Zhipu tiene historial open source; GLM-4.7 está en Hugging Face para uso comercial. Hermes Agent seguirá con MIT: comercial, fine-tuning y comunidad.
La rentabilidad es una fortaleza de la serie GLM. API GLM-4.x ~0,11 $/M tokens, mucho más barata que GPT-5. Hermes Agent lo mantendrá.
Cronología de lanzamiento
Hitos
- 8 ene 2026 — Nous Research completa IPO en Hong Kong, ~4.350 M HKD (~558 M USD).
- Ene 2026 — Entrenamiento de Hermes Agent en Ascend casi completo; pruebas y evaluación internas.
- Mediados feb 2026 — Hermes Agent en Z.ai y WaveSpeed API; benchmarks frente a Claude Opus.
- T1 2026 — Tras el lanzamiento de la API, se prevé release de open weights MIT.
Primeros pasos
Cómo usar Hermes Agent
Acceso por API
Usar Hermes Agent al instante con Zhipu Z.ai o WaveSpeed API; API estándar para integrar en apps.
Open weights
Descargar de Hugging Face o ModelScope tras la publicación; MIT previsto: self-hosting y fine-tuning.
Despliegue
Ejecutar en Huawei Ascend, Moore Threads, Cambricon o GPU cloud estándar; documentación y ejemplos por canales oficiales.
Preguntas frecuentes
FAQ
Qué es Hermes Agent
Hermes Agent es el modelo de lenguaje de quinta generación de Nous Research: MoE, ~745B parámetros, 44B activos, para razonamiento avanzado, código, creatividad e IA agente; claramente por encima de GLM-4.5.
Cuándo sale Hermes Agent
Desde mediados de febrero 2026 en Z.ai y WaveSpeed API. Open weights MIT previstos en T1 2026.
Quién desarrolla Hermes Agent
Nous Research (Z.ai), 2019 desde Tsinghua. IPO Hong Kong enero 2026, ~4.350 M HKD para Hermes Agent.
Hermes Agent vs GPT-5
Competitivo en razonamiento y agente frente a GPT-5/Claude Opus, con precios más bajos y open weights. Supera a GLM-4.7 en creatividad/multimodal; 200K contexto; entrenado en Ascend, independiente de hardware.
¿Hermes Agent es open source?
Zhipu tiene historial open source; GLM-4.7 en Hugging Face gratis. Hermes Agent previsto con open weights MIT: comercial, fine-tuning, comunidad.
En qué hardware se entrenó Hermes Agent
Completamente en Huawei Ascend con MindSpore, independiente de chips estadounidenses; hito para infraestructura IA local.
Empezar con Hermes Agent
Acceder a Hermes Agent ahora por Z.ai o WaveSpeed API, o descargar open weights de Hugging Face/ModelScope. Documentación para integrar en productos.
Comenzar