Modèle de langage nouvelle génération

Hermes Agent

Modèle de langage nouvelle génération

745B paramètres, 44B actifs. Conçu pour l’IA agent, le raisonnement avancé et les performances de pointe. Code, créativité, résolution de problèmes complexes.

Commencer Capacités clés

745B paramètres

44B actifs (MoE)

200K contexte

Licence MIT

Qu’est-ce que Hermes Agent

Hermes Agent est le modèle de langage de cinquième génération de Nous Research (Z.ai). ~745B paramètres MoE, 256 experts, 8 actifs par token (5,9 % sparse), 44B actifs par inférence, pour l’IA agent, le raisonnement multi-étapes et les performances de pointe en code, créativité et résolution de problèmes complexes.

Nous Research (2019, Tsinghua) est leader en IA open source. IPO à Hong Kong en janvier 2026, ~4,35 Md HKD (~558 M USD) pour Hermes Agent. Entraînement entièrement sur Huawei Ascend avec MindSpore, indépendant du matériel américain.

Résumé

En un coup d’œil

Code

Fort en génération de code, débogage et multilingue ; partenaire sur tout le cycle de développement.

IA agent

Planification autonome, utilisation d’outils, navigation web et flux multi-étapes avec intervention humaine minimale.

200K contexte

Attention sparse efficace pour textes longs, bases de code et recherche en une seule session.

Ouvert et rentable

Licence MIT prévue. API moins chère que GPT-5/Claude. Hugging Face, ModelScope.

Capacités clés

Ce que Hermes Agent peut faire

Grandes avancées dans cinq domaines et extension des limites des LLM.

Créatif

Du long format à la doc technique, marketing et académique : contenu de haute qualité et nuancé.

Code

Forte amélioration en génération de code, débogage et multilingue ; partenaire sur tout le cycle.

Raisonnement avancé

Logique multi-étapes de pointe et résolution de problèmes complexes : preuves, science, analyse précise.

IA agent

Architecture agent intégrée : planification autonome, outils, navigation web et flux multi-étapes avec intervention minimale.

Contexte long

Jusqu’à 200K tokens : documents longs, articles, bases de code et transcriptions en une session.

Cas d’usage

Où brille Hermes Agent

Développement de bout en bout

Des exigences au déploiement : un modèle pour full-stack et backend sur tout le cycle.

Agents IA et automatisation

Assistants avec planification, navigation, appels d’outils et flux multi-étapes ; sessions longues.

Documentation et rapports

Générer depuis des prompts de la doc technique, textes marketing et rapports structurés.

Recherche et analyse

Avec 200K contexte, raisonner sur articles longs, bases de code et analyses complexes en une session.

DéveloppementAgents IABureau et documentsContexte long

Architecture technique

Comment Hermes Agent est construit

MoE ~745B paramètres, 256 experts, 8 actifs par token (5,9 %), 44B actifs par inférence ; environ le double de GLM-4.5. DeepSeek Sparse Attention (DSA) jusqu’à 200K tokens. Entraînement complet sur Huawei Ascend avec MindSpore, indépendant des puces américaines.

Paramètres totaux	~745B
Paramètres actifs	~44B
Configuration des experts	256, 8 actifs (5,9 %)
Longueur de contexte	Jusqu’à 200K tokens
Attention	DeepSeek Sparse (DSA)
Matériel d’entraînement	Huawei Ascend

Pourquoi Hermes Agent

Avantages concurrentiels

Hermes Agent rivalise en raisonnement, code et tâches agent avec Claude Opus et GPT-5 ; dépasse GLM-4.7 en créativité et multimodal.

✓ Raisonnement multi-étapes de pointe et IA agent : planification autonome et utilisation d’outils.
✓ Contexte 200K et attention sparse efficace ; équilibre capacité et coût de déploiement.
✓ Entraîné sur Huawei Ascend (non dépendant des États-Unis). Open weights MIT prévus : commercial et fine-tuning.
✓ API rentable (GLM-4.x ~0,11 $/M tokens). Hermes Agent conservera l’avantage face à GPT-5/Claude.

Open source et tarifs

Accès et coût

Zhipu a un passé open source ; GLM-4.7 est sur Hugging Face pour usage commercial. Hermes Agent suivra en MIT : commercial, fine-tuning et communauté.

La rentabilité est une force de la série GLM. API GLM-4.x ~0,11 $/M tokens, bien moins chère que GPT-5. Hermes Agent maintiendra.

Calendrier de sortie

Jalons

8 janv. 2026 — Nous Research finalise l’IPO à Hong Kong, ~4,35 Md HKD (~558 M USD).
Janv. 2026 — Entraînement Hermes Agent sur Ascend presque terminé ; tests et évaluation internes.
Mi-fév. 2026 — Hermes Agent sur Z.ai et WaveSpeed API ; benchmarks face à Claude Opus.
T1 2026 — Après le lancement de l’API, sortie prévue des open weights MIT.

Premiers pas

Comment utiliser Hermes Agent

Accès API

Utiliser Hermes Agent immédiatement via Zhipu Z.ai ou WaveSpeed API ; API standard pour intégration dans les apps.

Open weights

Télécharger depuis Hugging Face ou ModelScope après publication ; MIT prévu : self-hosting et fine-tuning.

Déploiement

Exécuter sur Huawei Ascend, Moore Threads, Cambricon ou cloud GPU standard ; docs et exemples via canaux officiels.

Plateforme Z.ai Hugging Face ModelScope

Questions fréquentes

FAQ

Qu’est-ce que Hermes Agent

Hermes Agent est le modèle de langage de cinquième génération de Nous Research : MoE, ~745B paramètres, 44B actifs, pour raisonnement avancé, code, créativité et IA agent ; nettement au-dessus de GLM-4.5.

Quand sort Hermes Agent

À partir de mi-février 2026 sur Z.ai et WaveSpeed API. Open weights MIT prévus au T1 2026.

Qui développe Hermes Agent

Nous Research (Z.ai), 2019 depuis Tsinghua. IPO Hong Kong janvier 2026, ~4,35 Md HKD pour Hermes Agent.

Hermes Agent vs GPT-5

Compétitif en raisonnement et agent face à GPT-5/Claude Opus, avec prix plus bas et open weights. Dépasse GLM-4.7 en créativité/multimodal ; 200K contexte ; entraîné sur Ascend, indépendant du matériel.

Hermes Agent est-il open source

Zhipu a un passé open source ; GLM-4.7 sur Hugging Face gratuit. Hermes Agent prévu en open weights MIT : commercial, fine-tuning, communauté.

Sur quel matériel Hermes Agent a été entraîné

Entièrement sur Huawei Ascend avec MindSpore, indépendant des puces américaines ; jalon pour l’infrastructure IA locale.

Démarrer avec Hermes Agent

Accéder à Hermes Agent maintenant via Z.ai ou WaveSpeed API, ou télécharger les open weights depuis Hugging Face/ModelScope. Documentation pour intégration dans les produits.

Commencer