Ressources : Whisper et transcriptions automatisées à l’aide de l’IA

Session 6

Date de publication

3 décembre 2026

Max Beligné, ingénieur de recherche — Plateforme Universitaire de Données Grenoble Alpes (PUD-GA)


Ressources et outils complémentaires

Utiliser Whisper dans un cadre de recherche sécurisé

  • Huma-Num propose un accès à des services et infrastructures adaptés à la recherche publique française, avec des garanties en matière d’hébergement et de gestion des données de recherche.
  • Des modalités de création de compte et d’accès aux services sont disponibles ici :
    https://humanid.huma-num.fr/

Important : dans le cadre de travaux de recherche impliquant des données sensibles ou personnelles (entretiens, focus groups, données d’enquête, etc.), il est recommandé d’utiliser des infrastructures sécurisées et adaptées au contexte réglementaire de la recherche publique.


Ressources sur l’anonymisation et la protection des données

La transcription automatisée peut faire apparaître des informations identifiantes (noms, lieux, institutions, voix, etc.).
Une attention particulière doit être portée à l’anonymisation avant diffusion, partage ou archivage des corpus.


Outils développés par Alex Albert

Whispurge

https://www.sonal-info.com/whispurge.html

  • Outil permettant de :
    • lancer des transcriptions automatisées basées sur Whisper ;
    • nettoyer et restructurer les transcriptions ;
    • faciliter l’anonymisation et la préparation des corpus ;
    • exporter les résultats dans différents formats exploitables pour l’analyse.

Sonal

https://www.sonal-info.com/

  • Logiciel d’analyse qualitative d’entretiens et de corpus audio/vidéo ;
  • permet notamment :
    • l’écoute synchronisée des extraits ;
    • le codage thématique ;
    • l’annotation et l’exploration des corpus ;
    • le travail sur des transcriptions alignées avec l’audio.

Tutoriels MATÉ-SHS

Présentation de Whispurge et Sonal :
https://www.youtube.com/watch?v=4D3Midiny7E