Résumé des interviews Montreux Jazz Memories
Ce projet de bachelor s’est concentré sur l’exploitation de plus de 800 interviews du Montreux Jazz Festival, collectées dans le cadre du programme Montreux Jazz Memories. Les données, issues de transcriptions automatiques, présentaient de nombreuses erreurs et un manque d’organisation. L’objectif était double :
Développer un processus automatisé de nettoyage et de correction des transcriptions (détection de la langue, vérification via dictionnaires et listes de noms propres, corrections phonétiques et par distance de Levenshtein) afin d’obtenir un texte fiable.
Concevoir un outil de résumé automatique utilisant des modèles d’IA, notamment GPT-3, pour produire des synthèses concises (<1000 caractères) et extraire des mots-clés pertinents. Le résultat final inclut une application Python (MJM_App) permettant la recherche par mots-clés, la consultation des résumés et la génération de nouvelles synthèses. Ce travail facilite l’accès aux informations clés pour les chercheurs, contribue à la préservation du patrimoine culturel du festival et constitue un modèle reproductible pour la gestion de grands corpus qualitatifs.
Rapport Projet de Bachelor Mathieu Mognol.pdf
Main Document
Not Applicable (or Unknown)
restricted
N/A
748.67 KB
Adobe PDF
99d975926a36dc330b433ada7031a1fd