Retour au blog
IA & Mistral·9 min

Mistral Large 2 vs GPT-4o : benchmark sur résumé en français

Test sur 50 réunions FR business : qualité de résumé, coût, latence, conformité. Le vainqueur va vous surprendre.

AG
Arno Gilardin
Fondateur, TranscribeFlow

Nous avons benchmarké les deux modèles sur 50 réunions clients réelles (anonymisées). Voici les résultats détaillés.

Méthodologie

50 transcripts FR (5 à 60 min), prompt système identique, évaluation par 3 humains (notes 1-5 sur fidélité, concision, structure, lisibilité).

Résultats globaux

Mistral L2GPT-4o
Fidélité4.64.5
Concision4.74.2
Structure4.44.5
Lisibilité FR4.84.3

Coût

Mistral Large 2 : 2$/M in, 6$/M out. GPT-4o : 5$/M in, 15$/M out. Soit 2,5x moins cher à qualité équivalente.

Latence

Depuis Hetzner Falkenstein : Mistral 1.2s p50 / 3.8s p99. GPT-4o 2.5s p50 / 7s p99. Mistral est ~2x plus rapide pour nous.

Souveraineté

Mistral SAS française, RGPD natif, DPA self-service. OpenAI : Cloud Act, DPA via Microsoft Azure (complexe).

Verdict

Pour le français business : Mistral Large 2 gagne sur tous les axes. C'est notre choix par défaut.

Mots-clés
Mistral LargeGPT-4obenchmarkrésuméfrançais

Prêt à essayer TranscribeFlow ?

14 jours gratuits, sans carte bancaire. Souverain, RGPD, hébergé en Allemagne.

Créer un compte gratuit