Cette section de l’application repose sur un pipeline complet de traitement textuel destiné à analyser les émotions des intervenants à partir d’enregistrements.
Analyse des interventions :
La solution proposée repose sur l’analyse émotionnelle des interventions des parlementaires, extraites à partir des comptes rendus de séance disponibles aux formats PDF et XML. Pour ce faire, un modèle de traitement automatique du langage naturel a été développé en s’appuyant sur CamemBERT, une version francophone du modèle BERT, préentraînée sur un large corpus en français. Ce modèle a été fine-tuné spécifiquement pour la classification des émotions en langue française, en distinguant sept catégories : Tristesse, Dégoût, Peur, Colère, Neutre, Surprise et Joie. Les performances obtenues sur les données de validation sont encourageantes, avec une accuracy de 82,95 % et un F1-score de 82,69 %, démontrant la pertinence de cette approche pour l’analyse émotionnelle des débats parlementaires.