Ollama Cloud × Claude Code La connexion qui fait sauter la limite de tokens
Le guide pas à pas pour connecter Ollama Cloud à Claude Code et à Hermès Agent, sans toucher une ligne de code, et sans revivre mes quatre heures de galère.
- →4 heures perdues avant de trouver la bonne méthode, toi, ça va te prendre 15 minutes
- →20$/mois pour Ollama Cloud, contre 100€+/mois pour passer sur un plan Claude Max
- →0 ligne de code à écrire : cinq commandes à copier-coller, et c'est tout
Une connexion. Deux agents IA. Zéro développeur requis.
Ce guide te donne la méthode exacte que j'ai fini par trouver après une matinée entière à me battre contre des erreurs en boucle : comment connecter Ollama Cloud à Hermès Agent et à Claude Code (via l'extension Cline), pour ne plus jamais être bloqué quand ton abonnement Claude Pro est à sec. Toutes les commandes sont dedans, prêtes à copier-coller.
Je documente publiquement mon apprentissage de l'IA depuis environ un mois, sans background de développeur.
Ce matin-là, je voulais faire une chose qui semblait simple : configurer Hermès Agent pour qu'il utilise Ollama Cloud, un service que je paye déjà 20$/mois, et pouvoir m'en servir à la fois avec mon assistant de code et mon agent personnel.
Trois à quatre heures plus tard, j'avais l'impression de m'être battu contre un mur.
Voici ce qui s'est passé, et surtout ce que ça m'a appris.
1. Le piège du faux terminal
Tout a commencé avec une erreur impossible à comprendre : « aucune information de connexion valide trouvée. » Pas de bouton retour. Pas d'explication claire. Pas de chemin évident.
Mon réflexe a été d'aller corriger ça directement dans mon éditeur de code, VS Code, en tapant des commandes dans la fenêtre que je pensais être un terminal.
Sauf qu'en réalité, je n'étais pas dans un vrai terminal. J'étais resté coincé dans une sorte de chat avec un modèle d'IA, une interface qui ressemblait énormément à un terminal, mais qui n'en était pas un.
Je donnais donc des instructions comme si j'agissais sur mon système. Mais rien ne se passait réellement.
C'est un peu comme demander à un GPS de recalculer l'itinéraire alors que tu es en train de parler dans le vide : ça donne l'impression que quelque chose se passe, mais la voiture n'a pas bougé d'un centimètre.
Résultat : j'ai cru modifier une configuration qui n'a jamais réellement été modifiée. Et cette confusion m'a suivi pendant toute la suite.
2. Le mot de passe qui a fui
En essayant de débloquer la situation, j'ai fait une erreur classique. J'ai copié-collé une clé d'accès directement dans une conversation.
Une clé d'accès, c'est une sorte de mot de passe technique. Et dans mon cas, il y avait de l'argent derrière.
Par sécurité, la clé a fini par être désactivée. Le problème, c'est que j'ai continué à essayer de la faire fonctionner alors qu'elle était déjà inutilisable.
La leçon est simple : une clé d'accès, c'est comme la clé de ta maison. Tu ne la montres pas. Tu ne la copies pas n'importe où. Et si elle a été exposée, tu la considères comme grillée.
3. L'erreur qui s'est incrustée
Le vrai problème est arrivé ensuite. À un moment, en suivant des instructions pour réparer la situation, j'ai enregistré une mauvaise configuration dans Hermès.
Cette configuration pointait vers un autre fournisseur, OpenRouter, au lieu de repartir proprement vers Ollama Cloud.
Le souci, c'est qu'elle s'est incrustée tellement profondément que même après avoir supprimé des dossiers, désinstallé, puis réinstallé l'application, Hermès revenait encore vers la mauvaise configuration.
Comme un GPS buggé qui te ramène toujours à la même adresse, même quand tu changes de destination.
J'ai désinstallé. Réinstallé. Supprimé des fichiers. Relancé. Et à chaque fois, je pensais repartir de zéro. Sauf que non. Une trace persistait quelque part.
4. Ce qui a fini par débloquer la situation
Au final, ce n'est pas l'interface visuelle qui m'a sauvé. Elle continuait à me renvoyer dans la même boucle.
Ce qui m'a débloqué, ce sont deux commandes tapées directement dans le vrai terminal, une fois que j'étais sûr d'être au bon endroit :
rm -rf ~/.hermes : cette commande m'a permis de supprimer complètement l'ancienne configuration Hermès.
Puis : hermes model. Cette commande a forcé Hermès à me redemander explicitement quel fournisseur et quel modèle utiliser, au lieu de deviner tout seul et de repartir sur la mauvaise configuration.
Ces deux commandes m'ont sorti de la boucle. Après plusieurs heures de blocage.
5. Ce que je retiens
Avant de taper une commande, il faut vérifier où on est réellement. Un prompt qui ressemble à un terminal n'est pas forcément un terminal. Si les réponses ressemblent à des explications plutôt qu'à des résultats système, tu es probablement au mauvais endroit.
Autre leçon : ne jamais partager une clé d'accès en clair. Même par accident. Même dans un outil de confiance. Une fois exposée, il faut la considérer comme compromise.
J'ai aussi compris qu'une interface graphique peut parfois bloquer en boucle, alors qu'une simple commande permet de reprendre la main.
Et surtout : une mauvaise configuration peut survivre à une suppression ou à une réinstallation. Si le même problème revient après un « reset », c'est souvent qu'il faut chercher plus profond.
6. La vraie leçon
Le plus intéressant, ce n'est pas vraiment Ollama Cloud. Ce n'est même pas Hermès Agent. Le vrai sujet, c'est ce moment où l'on commence à penser : « Je ne suis pas fait pour ça. »
Surtout quand même l'IA qui nous accompagne propose d'abandonner la solution qu'on veut vraiment utiliser. Mais parfois, l'outil ne voit pas encore le bon chemin. Et si la solution est importante pour toi, ça vaut le coup d'insister.
Hier, les bonnes explications existaient déjà. Mais elles étaient cachées dans des communautés techniques, dans des vidéos difficiles à trouver, ou derrière des mots-clés que je ne connaissais pas encore.
Maintenant que j'ai trouvé le chemin, je vais le documenter simplement, et c'est exactement l'objet du guide qui suit.
Cette première étape n'a pas été capturée en image, je l'avais collée en texte brut dans ma conversation avec l'IA. La voici reconstituée à l'identique (clés d'accès masquées) pour que tu comprennes exactement le piège.
>>> echo "HERMES_OLLAMA_API_KEY='••••••••••••••••••••'" >> ~/.hermes/.env It looks like you're setting an environment variable for the HERMES OLLAMA API KEY in your `.env` file... This means that you're setting the HERMES OLLAMA API KEY environment variable to the specified value in your `.env` file. >>> nano ~/.hermes/.env It looks like you're opening the `.env` file in the `nano` editor! ... You can use the `nano` editor to view, edit, or delete environment variables as needed.
Ce prompt >>> n'était pas mon terminal, c'était le mode conversationnel d'Ollama, qui ressemble à s'y méprendre à un vrai shell. Mes commandes echo et nano n'ont jamais été exécutées : l'IA me répondait juste en anglais, sur un ton très technique, des explications sur ce que ces commandes auraient fait si elles avaient tourné pour de vrai. J'ai donc cru avoir enregistré ma clé Ollama dans le fichier .env de Hermès, alors que rien n'avait réellement été écrit.
La philosophie le truc que les tutos n'expliquent jamais
Tape « Ollama Cloud tutorial » et tu tombes presque exclusivement sur des vidéos qui installent un modèle gratuit en local, directement sur la machine de la personne. Logique : c'est gratuit, et ça fait une belle démo. Le problème, c'est que si ton PC n'est pas une station de calcul, le local n'est juste pas une option pour toi. Et là, plus aucun tuto.
Penser qu'« utiliser l'IA en agent » veut dire choisir un seul fournisseur et s'y tenir. En réalité, chaque agent (Claude Code, Hermès Agent) peut se brancher sur plusieurs fournisseurs, et c'est exactement ce qui te sauve quand l'un d'eux est à sec.
Ollama Cloud n'est pas un concurrent de Claude. C'est une soupape de sécurité. Tu gardes ton abonnement Claude Pro pour le travail exigeant, et Ollama Cloud comme deuxième moteur pour ne jamais être bloqué par tes tokens, sans payer un plan Max plus cher.
Claude Pro seul : environ 20€/mois, tokens limités, blocages possibles de plusieurs heures.
Claude Max : 100€+/mois, plus de marge, mais toujours un seul fournisseur.
Claude Pro + Ollama Cloud : environ 40$/mois au total, deux fournisseurs, jamais bloqué.
Vérifie que tu as : un compte Ollama avec le forfait Cloud (ou le tier gratuit pour tester), et Hermès Agent et/ou Claude Code avec l'extension Cline déjà installés. Ce guide part du principe que les apps existent déjà sur ta machine, on va juste les connecter correctement.
Le système complet connecter Ollama Cloud à tes deux agents
Récupère ta clé API Ollama Cloud
ollama.com · 2 minutesVa sur ollama.com/settings/api-keys, connecté à ton compte avec le forfait Cloud. Génère une clé et copie-la quelque part en sécurité, tu vas l'utiliser deux fois dans ce guide.
Ne colle jamais cette clé dans une conversation IA, un chat, ou un message visible par d'autres. Si elle fuite, elle peut être désactivée automatiquement, et tu repars de zéro.
Connecte Ollama Cloud à Hermès Agent
Terminal · 5 minutesSi Hermès Agent est déjà installé et qu'il te bloque sur un écran de configuration buggé (l'erreur classique : « No usable credentials found for ollama-cloud »), ignore complètement l'interface graphique. Ouvre un terminal et tape ces deux commandes, l'une après l'autre :
rm -rf ~/.hermes hermes model
La première commande supprime toute configuration corrompue. La seconde force Hermès à te demander explicitement quel fournisseur utiliser, au lieu de deviner et de se planter.
No Ollama Cloud API key configured. OLLAMA_API_KEY (or Enter to cancel): [colle ta clé ici] API key saved. Base URL [https://ollama.com/v1]: [Entrée] Found 43 model(s) from Ollama Cloud Select default model: → minimax-m3
Colle ta clé au moment demandé, laisse l'URL par défaut (appuie juste sur Entrée), et choisis un modèle dans la liste. Pour une utilisation généraliste (pas du code, juste de la conversation), minimax-m3 est un bon choix par défaut.
Garde d'abord https://ollama.com/v1, c'est la valeur par défaut, tu n'as qu'à appuyer sur Entrée. Si jamais Hermès n'arrive pas à se connecter avec cette URL, relance hermes model et remplace-la par https://api.ollama.com à la place.
Si tu relances hermes après ça et que tu retombes sur une erreur ou une boucle de setup, le fichier de config est probablement corrompu. Supprime à nouveau ~/.hermes et recommence directement avec hermes model, sans repasser par l'interface graphique.
Connecte Ollama Cloud à Claude Code (Cline)
Cline · 3 minutesSi tu n'as pas encore Cline, installe-le d'abord : dans VS Code, ouvre l'onglet Extensions (l'icône de blocs dans la barre latérale), cherche « Cline », et clique sur Installer.
Une fois installé, ouvre les réglages de l'extension Cline (l'icône d'engrenage), puis va dans API Configuration → Act Mode. Remplis les champs comme ceci :
Mettre https://ollama.com/v1 comme Base URL. Ça ne fonctionne pas avec Cline, l'erreur affichée est « path '/v1/api/chat' not found ». La bonne URL est https://api.ollama.com, avec le préfixe api.
Avant : bloqué dès que les tokens Claude Pro étaient épuisés, parfois plusieurs heures à attendre le rechargement. Maintenant : je bascule sur Ollama Cloud dans Cline en changeant juste le provider, sans interrompre mon travail.
Choisis le bon modèle
43 modèles disponiblesOllama Cloud donne accès à des dizaines de modèles. Si tu codes (ou si Cline code pour toi), un modèle orienté code comme kimi-k2.7-code ou qwen3-coder fonctionne bien. Si tu veux juste discuter, demander des analyses, ou piloter Hermès au quotidien, un modèle généraliste comme minimax-m3 suffit largement, c'est celui que j'utilise par défaut.
C'est un modèle très polyvalent, idéal si tu n'es pas développeur et que tu veux juste parler à une IA et la laisser gérer le reste. Sur plusieurs benchmarks publiés par MiniMax, il talonne Claude Sonnet 4.6 et reste à peine derrière Opus 4.8 sur certains domaines, pour une fraction du coût (détails sur minimax.io). Dans mon usage perso au quotidien (discussion, analyse, pilotage de Hermès), je ne sens pas de différence flagrante avec Claude sur ce type de tâches.
Les 5 règles d'or pour ne plus jamais être bloqué par un fournisseur IA
-
Vérifie toujours où tu tapes.
Un prompt qui ressemble à un terminal n'en est pas forcément un. Si les réponses ressemblent à des explications plutôt qu'à un résultat technique, tu es au mauvais endroit.
-
Une clé exposée est une clé morte.
Si tu colles une clé API en clair quelque part par accident, considère-la grillée et génères-en une nouvelle tout de suite. Ne perds pas de temps à déboguer une clé déjà révoquée.
-
CLI avant interface graphique.
Quand un écran de configuration boucle sur la même erreur, la solution est presque toujours une commande terminal, pas un clic supplémentaire.
-
Garde deux fournisseurs, pas un.
Claude Pro pour le travail exigeant, Ollama Cloud comme deuxième moteur. Le jour où l'un est à sec, l'autre prend le relais sans interrompre ton travail.
-
Documente l'erreur exacte, jamais ton interprétation.
« Ça ne marche pas » ne se débogue pas. Le message d'erreur complet, copié-collé, oui.
Et si on parlait de ton projet ?
Ce guide couvre la configuration technique. Mais chaque situation est unique, ta stack est peut-être différente, ton workflow aussi, ou tu veux optimiser quelque chose qu'on n'a pas abordé ici.
Parlons de ce que tu veux construire.
Un appel rapide pour comprendre ton contexte, te montrer comment adapter ça à tes outils, et tracer la feuille de route ensemble.
Réserve 15 minutes avec moi →Gratuit. Sans engagement.
