Mathieu Brugidou et Philippe Suignard

Le séminaire « Méthodes pour l’analyse de la participation en ligne » accueillera

Mathieu Brugidou et Philippe Suignard


Que peuvent les algorithmes de plongement de mot

pour l’analyse sociologique des textes ?




Mathieu Brugidou est chercheur senior à EDF R&D au Groupe de Recherche Energie Technologie et Société et chercheur associé au laboratoire Pacte (UMR 5194), CNRS-Université Grenoble Alpes- Sciences Po Grenoble.

Philippe Suignard est Ingénieur Chercheur Expert au Département ICAME (Innovation Commerciale, Analyse des Marchés et de leur Environnement), EDF R&D.


Textes à lire en préparation de la séance :

Brugidou Mathieu, Suignard Philippe, Escoffier Caroline, et Charaudeau Lou (2020). Un discours et un public “Gilets Jaunes” au cœur du Grand Débat National ? Combinaison des approches IA et textométriques pour l’analyse de discours des plateformes “Grand Débat National” et “Vrai débat”. JADT 2020. https://halshs.archives-ouvertes.fr/halshs-03132818/document

Suignard Philippe, Escoffier Caroline, Charaudeau Lou et Brugidou Mathieu. Que peuvent les algorithmes de plongement de mot pour l’analyse sociologique des textes ? Analyser les discours et caractériser les locuteurs des plateformes “Grand Débat National” et “Vrai débat”. Statistique et Société (à paraître).

Résumé : Notre intervention se propose de contribuer à l’évaluation de l’apport des algorithmes dits de « plongement de mots » à l’analyse sociologique des textes : d’une part, en confrontant les résultats des analyses sémantiques de ces algorithmes aux approches maintenant bien connues des analyses de données textuelles ou de textométrie ; d’autre part, en s’intéressant à ce qui constitue un des principaux obstacles à l’analyse sociologique du web : la difficulté à caractériser sociologiquement les auteurs des énoncés issus du web. Pour cela, nous analysons les énoncés issus de plateformes de “civic tech”- plateforme gouvernementale, le “Grand Débat National”et, sa riposte politique et algorithmique proposée par un collectif de Gilets jaunes, le “ Vrai Débat”. Un troisième corpus issu de la plateforme “Entendre la France”, au design identique à celui du Grand Débat National et par ailleurs documenté en termes de propriétés sociopolitiques, nous permettra de caractériser les locuteurs en fonction de leurs discours et de tenter de prédire par des approches de machine learning des “pseudos propriétés” affectés aux locuteurs du Grand Débat National.

Pour recevoir les textes et signaler votre présence à cette séance du séminaire, merci de vous inscrire ici


Le séminaire « Analyse de la participation en ligne » (APeL)

Le séminaire « Analyse de la Participation en Ligne » (APeL) vise à développer la réflexion sur les démarches d’exploitation de données d’usages et de participation en ligne. Il est un lieu de rencontre et d’échange de connaissances, de pratiques et de savoir-faire pour des chercheurs issus d’horizon divers. A chaque séance, les invités du séminaire reviennent sur le « making of » d’une de leurs recherches : construction de l’enquête, spécificités de l’ingénierie de données mise en œuvre, outils de captation/constitution de corpus, stratégies d’analyse et outils mobilisés, etc.

Infos et inscription

Le séminaire est ouvert à tous. Merci de vous inscrire ici pour participer à la séance.


Date : 6 mai 2021, de 10h30 à 12h30

La séance se tiendra en visioconférence.


Contact : Alexandre Mallard, Valérie Beaudouin ou Cécile Chamaret




Pour en savoir plus sur le programme et le fonctionnement du séminaire


Photo sources : Mathieu Brugidou, Pacte-UMR 5194 & Philippe Suignard, EDF R1D.