Vibe coding avec Mammouth.ai pour une carte des LLM - Rock Robot

Zut je dois faire mon article linkedin mais je suis chez la famille avec juste mon ordinateur portable. Je veux faire une carte qui présente différents modèles sur une carte.

Le problème c'est que je n'ai pas de donnée... et que je ne sais pas emcore comment je vais intégrer ça dans une carte.

Pour génerer des données, j'ai testé la fonction Recherche de Mistral.ai, on peut en faire jusau'à 5 par mois gratuitement, et, des fois, ça marche pas mal : c'est un petit agent qui peut faire plein de recherches sur Internet et vous proposer une synthèse. Et c'est vraiment un agent : il lance autant de recherches qu'il a besoin. Pas comme la fonction "recherche sur le web" qui fait une pauvre recherche.

Donc notre petit Mistral nation arrive à me faire un Geojson pas trop mal, il arrive même à me placer les modèles sur la carte... mais le modèle a une cutoff en 2024 et du coup exit GLM, Kimi qui font le buzz cette année.

Bon, finalement une petite requête csur chatgpt me donne un Geojson de depart un peu plus exploitable.

Maitenant il reste à faire le viewer de carte. Je veux l'intégrer sur mon site mais je ne sais pas trop par quel bout le prendre. C'est pas très grave, c'est l'occasion de tester les agent de code.

Alors j'ai commencé à regarder Open Code plus Ollama mais là je suis chez la famille sur mon portable... donc pas de vrai carte graphique. Je voulais voir ce qu'on peut utiliser sur une machine un peu standard. Donc on va commencer par un service SaaS

Donc j'ai sortie mamouth.ai et son agent de code https://info.mammouth.ai/fr/docs/mammouth-code/ (c'est un fork d'OpenCode pour simplifier le déployement).

J'ai voulu testé Qwen3.5 30B-A3B (oui le 3.6 est déjà sorti mais il n'est pas diponible sur mammouth.ai aujourd'hui), c'est un relativement gros modèle mais en mixture of expert donc il fait 10x de calcul pour un résultat similaire à du 30B. J'aurais pu utiliser un modèle Claude de chez Anthropic, mais le but c'est de tester des solutions Open Source avant tout.

Le coût : avec un abonnement starter mammouth inclus $2 d'appels à des API. On peut en acheter plus hein. Mais là le but c'est de tester le vibe coding.

Donc au bout de mon quota de $2, j'ai un service qui marche mal, le gros de la structure est faite certes mais la moitié de ce que j'ai demandé ne marche pas et je n'ai plus de crédit parce que Qwen relançait en boucle la même opération. Ce n'est pas très grave parce que Mammouth a détecté un problème en causant un rate limite.

Mais quand même le petit agent a quand même bien dégrossi le travail, j'ai appris plein de trucs sur Pelican, le moteur de site statique que j'utilise. L'interface ne marche pas mais elle est propre... bien plus propre que ce que j'aurais fait dans un premier jet.

Alors mon impression : c'est pas mal pour dégrossir mais il faut être patient car c'est un peu lent et que ça va vite couter cher.