Q: Pourquoi une agence IA à Toulon plutôt qu'à Paris ?

Tarifs 30 à 40% inférieurs aux agences IA parisiennes, même expertise technique (modèles open weights, agents, RAG, fine-tuning), et matériel local que peu d'agences ont (notre DGX Spark coûte le prix d'une voiture, on a fait le pari). Proximité aussi : RDV en présentiel à La Farlède, réactivité. On travaille avec des clients à Marseille, Nice, Paris, mais pour les entreprises du Var, on est à 20 minutes maximum.

Question 1

OpenAI, Mistral en local, Anthropic : qui choisir ?

Accepted Answer

Ça dépend de trois choses. Confidentialité de vos données : si vos prompts contiennent des infos sensibles (médical, juridique, R&D), modèle local obligatoire. Volume : à partir de quelques millions de tokens par mois, le coût d'un modèle en local devient inférieur à GPT-4. Qualité : pour 90% des cas d'usage métier, Mistral 120B ou DeepSeek-R1 atteignent la qualité de GPT-4. Pour 10% des cas (raisonnement très complexe, code multilingue rare), GPT-4 ou Claude Sonnet restent en tête. On vous aide à choisir en fonction du use case.

Question 2

Combien coûte un projet IA chez Getup ?

Accepted Answer

Un POC RAG simple sur vos PDF : 5 000 à 12 000€ (2 à 4 semaines). Un agent métier intégré à votre application existante : 15 000 à 35 000€ (4 à 8 semaines). Un système multi-agents en production avec monitoring complet : 35 000 à 80 000€ (8 à 16 semaines). Si vous voulez tout héberger en local sur votre propre matériel, comptez 8 000 à 30 000€ en plus pour le hardware et le setup. Devis détaillé après un atelier de cadrage de 2h, gratuit.

Question 3

Mes données partent où exactement ?

Accepted Answer

Nulle part par défaut. On déploie les modèles soit sur votre infra (cloud privé, on-premise), soit sur notre DGX Spark à La Farlède. Aucun appel sortant vers OpenAI, Anthropic ou Google sans votre accord explicite. Si vous demandez une intégration GPT-4 (par exemple pour un sous-agent qui n'a pas accès aux données sensibles), on isole le périmètre et on documente précisément ce qui sort. Pour le RGPD, on fournit la documentation technique du pipeline et la base de traitement.

Question 4

L'IA peut-elle remplacer mon développeur senior ?

Accepted Answer

Non, et toute agence qui vous dit le contraire vous ment. Un dev senior comprend votre business, anticipe les conséquences d'un changement, négocie le scope, refuse une mauvaise idée. L'IA fait disparaître 60 à 80% du travail répétitif (boilerplate, tests, refactoring mécanique, code review de routine), ce qui libère votre senior pour les décisions architecturales. On le voit chez nous : nos agents font des PR, nos devs les valident et tranchent les choix de design. Personne n'a été remplacé, tout le monde produit plus.

Question 5

Combien de temps avant un POC IA fonctionnel ?

Accepted Answer

Pour un cas simple (RAG sur 100-500 documents avec interface web) : 2 à 3 semaines. Pour un agent métier qui appelle vos APIs et prend des décisions : 4 à 6 semaines. Pour un système multi-agents complet avec orchestration : 8 à 12 semaines. On démarre toujours par un atelier de cadrage qui définit le périmètre, les métriques de succès et les garde-fous. Un POC sans métrique mesurable, ce n'est pas un POC, c'est une démo qui meurt après la réunion de présentation.

Question 6

Vous fine-tunez les modèles ou vous utilisez les versions de base ?

Accepted Answer

Dans l'écrasante majorité des cas, fine-tuner un modèle de 120 milliards de paramètres pour un cas d'usage métier est une mauvaise idée : coût élevé, données d'entraînement difficiles à constituer, risque de catastrophic forgetting. Le bon réflexe en 2026 : prompt engineering soigné + RAG sur vos données + few-shot examples. On garde le fine-tuning pour les cas où c'est vraiment justifié (langage très spécialisé, besoin de latence ultra-faible). On préfère le LoRA / QLoRA au full fine-tuning quand c'est nécessaire.

Question 7

Latence d'inférence : c'est utilisable en production ?

Accepted Answer

Sur notre DGX Spark, Mistral 120B en quantification 4-bit délivre 30 à 60 tokens par seconde selon la longueur du contexte. Un modèle plus léger (Qwen 32B, Mistral Small) monte à 100 tokens par seconde. Pour une UX confortable en streaming, c'est largement suffisant : l'utilisateur voit la réponse arriver mot par mot. Pour des cas avec contraintes temps réel strictes (< 100ms), on bascule sur des modèles spécialisés ou on cache les réponses fréquentes.

Question 8

Pourquoi une agence IA à Toulon plutôt qu'à Paris ?

Accepted Answer

Tarifs 30 à 40% inférieurs aux agences IA parisiennes, même expertise technique (modèles open weights, agents, RAG, fine-tuning), et matériel local que peu d'agences ont (notre DGX Spark coûte le prix d'une voiture, on a fait le pari). Proximité aussi : RDV en présentiel à La Farlède, réactivité. On travaille avec des clients à Marseille, Nice, Paris, mais pour les entreprises du Var, on est à 20 minutes maximum.

DÉVELOPPEMENT IADANS LE VAR.

Pas un wrapper d'OpenAI,
une vraie infra IA.

Ce qu'on construit
avec l'IA.

Modèles open weights en local

Agents autonomes

RAG sur vos données métier

Intégration IA dans vos produits

Notre standard
qualité IA.

Sécurité & Souveraineté

Évaluation & Monitoring

Fiabilité & Garde-fous

Des projets qui
parlent d'eux-mêmes.

Helipass

Innovorder

The Explorers

La meute.

Pas de métro,
dans le Var.

Vos questions sur
l'IA en production.

OpenAI, Mistral en local, Anthropic : qui choisir ?

Combien coûte un projet IA chez Getup ?

Mes données partent où exactement ?

L'IA peut-elle remplacer mon développeur senior ?

Combien de temps avant un POC IA fonctionnel ?

Vous fine-tunez les modèles ou vous utilisez les versions de base ?

Latence d'inférence : c'est utilisable en production ?

Pourquoi une agence IA à Toulon plutôt qu'à Paris ?

Découvrez aussi nos
autres services.

Un cas d'usage IA
à creuser ?

DÉVELOPPEMENT IADANS LE VAR.

Pas un wrapper d'OpenAI, une vraie infra IA.

Modèles open weights en local

Agents autonomes

RAG sur vos données métier

Intégration IA dans vos produits

Sécurité & Souveraineté

Évaluation & Monitoring

Fiabilité & Garde-fous

Helipass

Innovorder

The Explorers

Pas de métro,dans le Var.

OpenAI, Mistral en local, Anthropic : qui choisir ?

Combien coûte un projet IA chez Getup ?

Mes données partent où exactement ?

L'IA peut-elle remplacer mon développeur senior ?

Combien de temps avant un POC IA fonctionnel ?

Vous fine-tunez les modèles ou vous utilisez les versions de base ?

Latence d'inférence : c'est utilisable en production ?

Pourquoi une agence IA à Toulon plutôt qu'à Paris ?

Un cas d'usage IAà creuser ?

Pas un wrapper d'OpenAI,
une vraie infra IA.

Pas de métro,
dans le Var.

Un cas d'usage IA
à creuser ?