Modèles

N’importe quel serveur compatible OpenAI fait l’affaire. Mais pour un agent, tous les modèles ne se valent pas : le nerf de la guerre, c’est le tool calling.

Le vrai critère : le tool calling

Au lancement, Mini-claude vérifie deux choses sur votre modèle :

La taille (via /api/show d’Ollama) : sous 7B, on bascule en chat seul, pas d’appel d’outils. Pratique pour tester l’UI, pas pour du vrai travail d’agent.
Le tool calling natif (via une sonde au démarrage) : certains modèles annoncent la capacité tools mais écrivent en réalité leurs appels en texte brut au lieu du champ structuré. Mini-claude en récupère beaucoup via un parseur de secours, mais ils restent peu fiables sur les tâches multi-étapes. Quand c’est détecté, vous voyez weak tool calling dans l’en-tête.

Vérifiés pour le tool calling natif

ollama pull mistral:7b     # agent solide, appels natifs, ~5 Go
ollama pull qwen3:8b       # récent, bon en code et en outils
ollama pull llama3.1:8b    # tool use fiable

Le cas qwen2.5-coder

qwen2.5-coder sur Ollama est un excellent modèle de code, mais son template de chat n’émet pas d’appels d’outils natifs, il les écrit en texte. Ça en fait un piètre agent malgré un grand talent de codeur. Le parseur de secours gère les demandes simples à un seul outil, mais les audits/refactors complexes seront capricieux.

Chat seul (outils désactivés)

llama3.2:3b, phi4-mini, tout modèle sous 7B. Utile pour discuter ou tester, pas pour piloter des outils.

Quand le tool calling est faible : `/audit`

Même sans tool calling fiable, /audit [chemin] fonctionne : Mini-claude rassemble lui-même les données du projet (arborescence + README + manifeste) et ne demande au modèle que de synthétiser. N’importe quel modèle en est capable. Voir Commandes slash.

Changer à chaud

Ouvrez le sélecteur avec /model ou changez directement avec /model mistral:7b. Voir Commandes slash.

Contribuer Mémoire projet