De 80% à 96% de précision avec votre vocabulaire métier

Whisper sort de l'usine à 80-85% de précision sur des termes métier spécifiques. Avec une simple liste de vocabulaire, on monte à 95-96%. Voici comment.

Pourquoi Whisper se trompe

Whisper a été entraîné sur du texte web généraliste. Il ne connaît pas "NF C 15-100", "habilitation B1V", ou "anamnèse". Il les remplace par les mots phonétiquement les plus probables (souvent absurdes).

Le mécanisme : initial_prompt

L'API Whisper accepte un paramètre initial_prompt (244 tokens max) injecté en début de transcription. Whisper s'en sert comme "contexte" et privilégie ces termes.

Construire votre liste

Lister vos 30-50 termes critiques : marques, normes, acronymes, noms de personnes. Exemple BTP : "Schneider, Hager, NF C 15-100, RT2012, RE2020, B1V, BR, QualiPV, Promotelec".

Configurer dans TranscribeFlow

Settings → Vocabulary → coller la liste séparée par virgules. Sauvegarder. Toutes vos prochaines transcriptions utiliseront ce contexte.

Mesurer l'amélioration

Faites tourner avant/après sur 5 minutes d'audio standard. Vous verrez généralement +10 à +15 points de précision sur les termes ciblés.

De 80% à 96% de précision avec votre vocabulaire métier

Pourquoi Whisper se trompe

Le mécanisme : initial_prompt

Construire votre liste

Configurer dans TranscribeFlow

Mesurer l'amélioration

Prêt à essayer TranscribeFlow ?

Articles liés

Installer et configurer l'extension Chrome TranscribeFlow

Configurer BYOK avec votre clé Mistral La Plateforme

Activer la double authentification (2FA TOTP) sur TranscribeFlow