Whisper sort de l'usine à 80-85% de précision sur des termes métier spécifiques. Avec une simple liste de vocabulaire, on monte à 95-96%. Voici comment.
Pourquoi Whisper se trompe
Whisper a été entraîné sur du texte web généraliste. Il ne connaît pas "NF C 15-100", "habilitation B1V", ou "anamnèse". Il les remplace par les mots phonétiquement les plus probables (souvent absurdes).
Le mécanisme : initial_prompt
L'API Whisper accepte un paramètre initial_prompt (244 tokens max) injecté en début de transcription. Whisper s'en sert comme "contexte" et privilégie ces termes.
Construire votre liste
Lister vos 30-50 termes critiques : marques, normes, acronymes, noms de personnes. Exemple BTP : "Schneider, Hager, NF C 15-100, RT2012, RE2020, B1V, BR, QualiPV, Promotelec".
Configurer dans TranscribeFlow
Settings → Vocabulary → coller la liste séparée par virgules. Sauvegarder. Toutes vos prochaines transcriptions utiliseront ce contexte.
Mesurer l'amélioration
Faites tourner avant/après sur 5 minutes d'audio standard. Vous verrez généralement +10 à +15 points de précision sur les termes ciblés.
Prêt à essayer TranscribeFlow ?
14 jours gratuits, sans carte bancaire. Souverain, RGPD, hébergé en Allemagne.
Créer un compte gratuit