une méthode pour articuler analyse des réseaux et des discours sur twitter la websphère de...
TRANSCRIPT
Une méthode pour articuler analyse des réseaux et des discours sur Twitter�
�La websphère de
#CharlieHebdo �
Pierre Ratinaud Université Toulouse 2 - Lerass
Nikos Smyrnaios Université Toulouse 3 - Lerass
Congrès AFSP 2015: ST7
« Les appropriations méthodologiques d'internet dans la recherche sur des objets politiques», Aix-en-Provence, 22 juin 2015
Le contexte
Le 7 janvier 2015 à Paris a lieu l’attaque terroriste contre Charlie Hebdo (12 morts)
Le 10 janvier des manifestations ont lieu dans plusieurs villes. Le 11 janvier à Paris une
manifestation ressemble plus d’un million de personnes
Le sujet devient trending topic mondial dans les
réseaux sociaux
Cadre théorique
Websphère (Schneider et Foot 2006) : un micro espace public en ligne créé ad hoc autour d’un un
évènement ou thème spécifique
Elle articule textes, relations, temps
Sur Twitter: tweets, RTs & mentions, période étudiée
Il n’y pas d’échantillon exhaustif possible. Elle est circonscrite par l’observateur
La méthode
Collecte des tweets comportant la chaine de caractères charliehebdo du 7/01 au 12/01 2015 avec DMI-TCAT puis nettoyage de l’échantillon
Etape 1: repérage de clusters avec Gephi et
exploration « manuelle »
Etape 2: analyse lexicométrique avec Iramuteq
Etape 3: correspondance entre clusters et classes de discours
Etape 4: analyse lexicométrique d’une seule classe
Le corpus
Une websphère très
internationale
Taux de RT très élevé,
échanges très structurés
3,66 millions de Tweets
Analyse des réseaux
Graphe orienté basé sur les retweets des comptes avec >10 tweets dans Gephi
73 726 comptes, 426 286 liens
Application de la Méthode de Louvain : algorithme
hiérarchique proposé dans Blondel et al. (2008) pour repérer les groupes d’utilisateurs qui se
mentionnent souvent
Analyse lexicometrique
Elimination des retweets=> 252 194 tweets originaux en français
Elimination des urls et du hashtag du corpus texte
3 447 311 occurrences, 33 914 hapax
Méthode Reinert avec IRaMuTeQ
On obtient 12 classes de lexique
Analyse lexicometrique
Méthode Reinert avec Iramuteq:
- Formes « pleines » porteuses de signification (substantifs, adjectifs, adverbes, verbes)
- Segment de texte comme unité : tweet
- Bis-partitions successives du corpus par analyse factorielle
Résultat: l'analyse met dans une même classe les tweets qui ont tendance à contenir les mêmes mots
(classes)
Analyse lexicometrique
Twitter Prises d’otages
Appel manif
Commentaire vidéo
exécution
Critique récupération
politique
Indignation Contexte Condoléances
Victimes Liberté d’expression
Religion Insultes, menaces
Clusters & classes de discours
Liberté de conscience
Critique du gouvernement
Mouvement opposition
Sondages GPA MPA
Clusters & classes de discours
Liberté de conscience
Critique du gouvernement
Mouvement opposition
Sondages GPA MPA
Analyse lexicometrique 2ème niveau
Les classes de discours produites par la première analyse lexicométrique restent
assez générales
Nécessité d’une analyse de 2ème niveau sur une seule classe pour une compréhension
plus fine du discours
Classe 2: surreprésentation très forte du cluster d’extrême droite
Quelles spécificités ?
Analyse lexicometrique 2ème niveau
Correspondance avec les clusters du graphe
Cluster de l’extrême droite fortement surreprésenté dans la critique du gouvernement et de son
incompétence supposée (classe 3) là où le cluster de la gauche est sous-représenté
L’extrême droite est surreprésentée également dans la polémique autour de l’unite nationale à l’exclusion
du Front National (classe 4)
En revanche elle est très fortement sous-représentée dans la classe des hommages et de
#Jesuischarlie
Analyse lexicometrique 2ème niveau
Conclusions sur la websphère Sur Twitter il n’y a pas eu de discours unanimiste
sur les évènements de Charlie Hebdo
Les échanges se sont structurés fortement par l’homophilie politique et médiatique
L’extrême droite se démarque fortement par:
- L’opposition à toute unité politique, considérée comme factice
- La critique de l’exécutif et la mise en cause de sa légitimité et
sa compétence
- La distance des hommages (ils ne sont pas Charlie)
Conclusions méthodologiques
L’articulation entre analyse de réseaux et analyses de graphes permet d’avoir une vue surplombante
sur des webshphères de taille importante
Cohérence entre les clusters d’usagers et les classes de discours repérées avec Iramuteq
Analyse de 1er niveau permet d’ouvrir de pistes
Analyse de nème niveau permet une compréhension
plus fine
Limites Population loin d’être representative de la société
(CSP+, jeunes, diplômés, métiers intellectuels)
Echantillon ad hoc biaisé par le choix du mot clé (résultats différents avec #jesuischarlie)
Logique internes de la plateforme
Nécessité de compléter par une analyse de discours
qualitative