Vous êtes ici : ATELIERS DE LA DONNEE - FR > Ressources

Retranscription audio

En SHS, la retranscription automatique d’enregistrements audio est l’une des demandes les plus courantes. En mettant librement à disposition une application de retranscription en open source déjà existante mais seulement partiellement disponible, DATALystE entend répondre à cette attente.

Le modèle retenue pour ces tâches est Whisper, reconnue pour la qualité des retranscriptions. Une application est actuellement disponible via cette plateforme. Le groupe thématique "traitement des données" a également produit une fiche pratique et une expertise avancée sur le modèle et ses applications. Deux outils sont à votre disposition sur la plateforme. Le premier permet le dépôt de vos fichiers audio, le second la correction du texte issu des sorties du modèle. Pour l’instant, ce deuxième outil est en phase de test, mais vous pouvez d’ores et déjà l’utiliser.

Les formations existantes sur les outils (formations de la MSH LSE par exemple) pourront porter à terme, et selon la demande des usagers, sur cette application.

L'instance de Whisper, avec une restranscription à l'aide du modèle insanely-faster-whisper, est hébergée sur les serveurs de l'Ecole Centrale de Lyon. Le service de retranscription via DATALystE est accessible à tout le personnel des établissements  partenaires de DATALystE du site de Lyon Saint-Etienne.

Si vous préférez travailler de manière autonome, vous pouvez utiliser le ShareDocs d’Huma-Num, ou des logiciels à installer sur votre ordinateur, comme le logiciel Vibe.
Pour l’utilisation de ShareDocs de l’infrastructure Huma-Num, vous pouvez nous contacter pour un accompagnement.
Dans certains cas, nous vous redirigerons vers cet outil directement.