Retour au blog
Tutoriel·6 min

De 80% à 96% de précision avec votre vocabulaire métier

Le secret : injecter votre jargon (Schneider, NF C 15-100, anamnèse...) dans le prompt initial. Tutoriel pas à pas.

AG
Arno Gilardin
Fondateur, TranscribeFlow

Whisper sort de l'usine à 80-85% de précision sur des termes métier spécifiques. Avec une simple liste de vocabulaire, on monte à 95-96%. Voici comment.

Pourquoi Whisper se trompe

Whisper a été entraîné sur du texte web généraliste. Il ne connaît pas "NF C 15-100", "habilitation B1V", ou "anamnèse". Il les remplace par les mots phonétiquement les plus probables (souvent absurdes).

Le mécanisme : initial_prompt

L'API Whisper accepte un paramètre initial_prompt (244 tokens max) injecté en début de transcription. Whisper s'en sert comme "contexte" et privilégie ces termes.

Construire votre liste

Lister vos 30-50 termes critiques : marques, normes, acronymes, noms de personnes. Exemple BTP : "Schneider, Hager, NF C 15-100, RT2012, RE2020, B1V, BR, QualiPV, Promotelec".

Configurer dans TranscribeFlow

Settings → Vocabulary → coller la liste séparée par virgules. Sauvegarder. Toutes vos prochaines transcriptions utiliseront ce contexte.

Mesurer l'amélioration

Faites tourner avant/après sur 5 minutes d'audio standard. Vous verrez généralement +10 à +15 points de précision sur les termes ciblés.

Mots-clés
Whispervocabulaire métierprécisioninitial_prompt

Prêt à essayer TranscribeFlow ?

14 jours gratuits, sans carte bancaire. Souverain, RGPD, hébergé en Allemagne.

Créer un compte gratuit