En SHS,
la retranscription automatique d’enregistrements audio est l’une des demandes les plus courantes. En mettant
librement à disposition une application de retranscription en open source déjà existante mais seulement partiellement disponible, DATALystE entend répondre à cette attente.
Le modèle retenue pour ces tâches est
Whisper, reconnue pour la qualité des retranscriptions. Une application est actuellement disponible via cette
plateforme. Le groupe thématique "
traitement des données" a également produit une
fiche pratique et une
expertise avancée sur le modèle et ses applications. Deux outils sont à votre disposition sur la plateforme. Le premier permet le dépôt de vos fichiers audio, le second la correction du texte issu des sorties du modèle. Pour l’instant,
ce deuxième outil est en phase de test, mais vous pouvez d’ores et déjà l’utiliser.
Les formations existantes sur les outils (formations de la
MSH LSE par exemple) pourront porter à terme, et selon la demande des usagers, sur cette application.
L'instance de Whisper, avec une restranscription à l'aide du modèle
insanely-faster-whisper, est hébergée sur les serveurs de l'
Ecole Centrale de Lyon. Le service de retranscription via DATALystE
est accessible à tout le personnel des établissements partenaires de DATALystE du site de Lyon Saint-Etienne.
Si vous préférez travailler de manière autonome, vous pouvez utiliser le
ShareDocs d’Huma-Num, ou des logiciels à installer sur votre ordinateur, comme le logiciel
Vibe.
Pour l’utilisation de
ShareDocs de l’infrastructure
Huma-Num, vous pouvez nous contacter pour un accompagnement.
Dans certains cas, nous vous redirigerons vers cet outil directement.
Référents :
Pour accéder au service, vous pouvez demander une inscription à la plateforme à cette adresse :
Une fois votre compte validé, vous pouvez accéder à deux outils :
- Un outil de retranscription :
https://datalyste-transcripteur.ec-lyon.fr/
- Un outil de post-correction :
https://datalyste-postcorrection.ec-lyon.fr/index.php
Sur les deux outils, nous sommes intéressés par vos retours :
- Sur l’interface elle-même et les éventuels bugs que vous rencontrez.
- Sur les fonctionnalités que vous souhaiteriez ajouter.
- Sur les formats de fichier que vous souhaitez (pour l’instant nous permettons l’export vers des formats txt, vtt et srt).
https://datalyste.universite-lyon.fr/retranscription-audio-334300.kjsp?RH=1707482065037