le carnet de l'avent de la sociologie francophone sur twitter : réseaux et altmetrics de...
Post on 11-Feb-2017
200 Views
Preview:
TRANSCRIPT
Lecarnetdel'aventdelasociologiefrancophonesurTwi7er:
réseauxetaltmetricsde#SocioNoël
13janvier2017séminaireSRM
http://bit.ly/srmCabanac2017
nThème2:IndexaJonetRecherched’InformaJons
ÉquipeIRIS:InformaJonRetrieval&InformaJonSynthesis
GuillaumeCabanacguillaume.cabanac@univ-tlse3.fr
@gcabanac
10
Focussur#SocioNoël
Étudeduphénomène#SocioNoëlCollaboraJonavecErwanBahi(2016),stagiairedeDUTinformaJque
OnaaussitravaillésurIMDB→
SOUTENANCEDESTAGEIns/tutdeRechercheenInforma/quedeToulouse(IRIT)
Annéeuniversitaire2015/2016–Durée11semainesMaîtredestage:M.GuillaumeCabanacTuteurdestage:M.MohandBoughanem
Analyseduphénomènedediffusiond’informaKon#socionoel
ErwanBahi
SOMMAIRE
I–INTRODUCTION1.Ins/tutdeRechercheenInforma/quedeToulouse(IRIT)2.Fonc/onnementetlieudetravail3.ÉquipeInforma/onRetrievalandInforma/onSynthesis(IRIS)4.ObjetdelamissionII – ANALYSE DU PHÉNOMÈNE #SOCIONOEL 1.Objec/fsethypothèses2.Recherchedesdonnées3.Aspecttechnique4.Synthèsedesdonnées III – Conclusion et bilan
2
I–INTRODUCTION1.Ins/tutdeRechercheenInforma/quedeToulouse
- Laboratoirederecherche- 4 sites, 700membres,21équipes,7théma/ques
- Sitedel’UniversitéPaulSaba/er-Toulouse3(UPS)- ÉquipeInforma/onRetrievalandInforma/onSynthesis(IRIS)
3
I–INTRODUCTION3.ÉquipeInforma/onRetrievalandInforma/onSynthesis(IRIS)
- Crééeenoctobre2015- 7 membres permanents - 25doctorantsetétudiantsdemaster
Source:h*ps://www.irit.fr/Organigramme
5
I–INTRODUCTION3.ÉquipeInforma/onRetrievalandInforma/onSynthesis(IRIS)
Source:h*ps://www.irit.fr/IRIS-site/
Deux domaines : Recherche d’Information (IR) et Synthèse de l’Information (IS)
6
I–INTRODUCTION4.Objetdelamission
Analyseduphénomènedediffusiond’informaKon#socionoel
Source:h*p://bfontaine.github.io/SocioNoel/
7
I–INTRODUCTION4.Objetdelamission
Analyseduphénomènedediffusiond’informaKon#socionoelRecherched’InformaKon(IR)- RéseausocialTwi[er- Fichierdedonnées- SitewebSudoc(référencesbibliographiques)
Synthèsedel’InformaKon(IS)- Aggrega/ondesdonnées- Visualisa/onderéseaux- Sta/s/ques
8
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL1.Objec/fethypothèse
Bibliométrie:lesmédiassociauxnesontpasprisencompte
Hypothèse:AvecTwi[er,onpeutdéterminerlesbonnesréférencesbibliographiques
9
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL2.Recherchedesdonnées–Glossaire
Moissonnage (web scrapping) : Extraction d’informations du web par un programme.
API : Application Programming Interface. Permet d’accéder à un service à travers un programme.
YAML, XML, JSON : Formats de données. XPATH : Langage permettant d’accéder à une portion d’un document XML. Java : Langage de programmation objet. SQL : Langage des bases de données relationnelles.
10
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL3.Recherchedesdonnées-Twi[er
Premièreétape:récupérerlestweets.SoluKonstestées:
LokLak.org
Données structurées Pas d’authentification
Pas de limitation Données incomplètes
API Twitter
Données structurées Authentification
Limitations fortes Recherches incomplètes
Moissonnage
Données non structurées Pas d’authentification
Pas de limitation Recherches complètes
11
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL3.Recherchedesdonnées-Twi[er
Combinaisondumoissonnageetdel’APITwi]erObtenirdesinforma/onsexhaus/vesetstructurées
Iden/fiantsTweets
DonnéesTweets+U/lisateurs Chaîne de traitement
12
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL3.Recherchedesdonnées-Twi[er
RécupéraKondesfollowersSurlesous-ensembled’u/lisateursayantpostéavecl’hashtag#socionoel
DonnéesTweets+U/lisateurs Chaîne de traitement
DonnéesFollowers
13
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL4.Recherchedesdonnées–Référencesbibliographiques
RécupéraKondessourcesbibliographiquesàpar/rdestweetsU/lisateur@bfontnquiareceuillimanuellementlesréférences
DonnéesTweets+U/lisateurs Chaîne de traitement
Titredesréférences
14
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL4.Recherchedesdonnées-Référencesbibliographiques
EnrichissementdesdonnéesbibliographiquesMoissonnagevialarecherchesurSudoc
Chaîne de traitement
Titredesréférences
Donnéesbibliographiques
15
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL5.Recherchedesdonnées–Chaînedetraitement
Iden/fiantsTweets
DonnéesTweets+U/lisateurs
DonnéesFollowers
Titredesréférences Données
bibliographiques
16
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL7.Synthèsedesdonnées–Réseauxd’u/lisateurs
VisualisaKonduréseaudesuKlisateursayanttweeté#socionoelPermetdevisualiserleréseaucomplet,l’ac/vité,lesabonnements,lesinterac/ons.OuKlsperme]antlagénéraKon:- Gephi- CodeSQLgénérantlesfichiersdedonnées
17
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL7.Synthèsedesdonnées–Réseauxd’u/lisateurs
@xmolenat:«Journaliste@AlterEcoMag&@AlterEcoPlus.L'actualitéauprismedessciencessociales,etviceversa».
20
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL7.Synthèsedesdonnées–Réseauxd’u/lisateurs
VisualisaKonduréseaudesuKlisateursayanttweeté#socionoelavecaumoinsuneréférencebibliographiquePermetdevisualiserlesvraisacteursdumouvement.
21
II–ANALYSEDUPHÉNOMÈNE#SOCIONOEL8.Synthèsedesdonnées–Ac/vité
0
20
40
60
80
100
120
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Jourdumoisdedécembre2015
Nombredetweets Nombredelivres
ÉvoluKondel’uKlisaKonduhashtag#socionoelsurlemoisdedécembre2015
23
III–BILAN
Technique:Appren/ssagedesréseauxetdenouvellescompétences
MéthodologieetorganisaKon:- Travailenautonomie,recherched’informa/ons- Collabora/onHumain:- Découverted’unlaboratoirederecherche- Par/cipa/onàunCongrès,rencontres
26
IV–ANNEXES1.Aspecttechnique–Stockagedesdonnées
Programme BasededonnéesDonnées
OJDBC
HtmlUnit
Annexe1
top related