METTRE DEL'INTELLIGENCEDANS LES DONNÉESLIÉESMATHIEU D'AQUIN - @MDAQUIN
KNOWLEDGE MEDIA INSTITUTE, THE OPENUNIVERSITY
Le web des données liées c'est bien....
Le web des données liées c'est bien....Pourvoir en faire quelques chose, c'est mieux !
LE WEB DES DONNÉES LIÉES C'EST BIEN....
LE WEB DES DONNÉES LIÉES C'EST BIEN....
EXEMPLE: DATA.OPEN.AC.UK
EXEMPLE: DATA.OPEN.AC.UKCours: 600 module de cours + nivaux, crédits, sujets, etc.Publications: 30,000 articles de recherche + auteurs,conférences, etc.Podcasts: 2220 podcasts video et 1500 podcats audio +liens vers les cours, etc.Ressources éducationnelles ouvertes: 640 unités +liens vers les cours, etc.Videos Youtube: 900 videos + liens vers les cours et leschecheursBâtiments: 100 Bâtiments + address et photosBibliothèque: 12,000 livres + liens vers les coursOthers...
EXEMPLE: DATA.OPEN.AC.UK
Applications: "Study at the OU", "OU Buildings", "OUAnywhere", "Facebook Course Profile", etc.
EXEMPLE: DATA.OPEN.AC.UK
Un autre exemple d'application, un peu moins simple : inscriptionaux course de différents sujets, a diffèrent endroits
PLUS D'INTELLIGENCE ?
Données Données liées Web Sémantique
EXEMPLE: RECOMMANDATIONVersion simple
EXEMPLE: RECOMMANDATIONQuand les resources sont hétérogènes...
EXEMPLE: RECOMMANDATIONQuand les resources sont hétérogènes...
EXEMPLE: RECOMMANDATIONQuand les resources sont hétérogènes...
EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO
EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO
EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO
EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO
Explaining Patterns with Linked Data
Tiddi et al. @ ESWC 2014 et COLD 2014
EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO
Expliquer le déséquilibre entre l'éducation des hommes et des femmes dans diffèrents pays
Pays où les hommes ont plus d'éducation ; les femmes ; égalité
EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO
Expliquer le déséquilibre entre l'éducation des hommes et des femmes dans diffèrents pays
Pays où les hommes ont plus d'éducation en jaune; les femmes en bleue; égalité
en verts
EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO
EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO
(i.e. un chemin de relations, et une valeur) qui sont les plusreprésentative du cluster (maximum F-Score).
Difficulté : On ne connaît pas le graphe à l'avance - il faut leconstruire au fur et à mesure de l'exploration
EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO
Principe :Un algorithme A* qui recherche les règles de la formeX - p1 - p2-...- pn - valeur -> inCluster(X)
EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO
Aider nous a evaluer Dedalo: linkedu.eu/dedalo/eval/
GOING METAPour exploiter les données du Web, il ne fait pas seulement
raisonner avec les données, mais aussi raisonner sur lesdonnées.
EXEMPLE : CATALOGUE LINKEDUP DE DONNÉES WEB LIEES ÀL'ENSEIGNEMENT
data.linkededucation.org/linkedup/catalog/
ANALYSE DES RELATIONS ENTRE JEUX DE DONNÉES
Avant alignement
ANALYSE DES RELATIONS ENTRE JEUX DE DONNÉES
Après alignement
d'Aquin et al. @ WebSci2013
ANALYSE DES RELATIONS ENTRE JEUX DE DONNÉES
Après alignement
POURQUOI C'EST IMPORTANT ?EXAMPLE DU "DATA HUB" DU PROJET MK:SMART
( )MKSMART.ORG
EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI
Triangulation a partir de plusieurs capteurs
EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI
Simple analyse statistique
EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI
Simple analyse statistique
EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI
EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI
EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI
EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI
EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI
EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI
AU NIVEAU DU "DATA HUB"
ODRL pour la représentation structurées de licences de
données
POINT DE DÉPART : META-DONNÉESSTRUCTURÉES
DataNode pour la representation des relations entre jeux dedonnees -
POINT DE DÉPART : META-DONNÉESSTRUCTURÉES
http://purl.org/datanode/ns/
POINT DE DÉPART : META-DONNÉESSTRUCTURÉES
Permet la propagation de meta-caractéristiques comme lesdroits et conditions d'utilisation.
POINT DE DÉPART : META-DONNÉESSTRUCTURÉES
UN DERNIER EXEMPLE DERAISONNEMENT META
MESURER LE BIAIS DANS LE DONNÉES
Selon WikiPedia (anglais): "A statistic is biased if it iscalculated in such a way that it is systematically different
from the population parameter of interest."
UN DERNIER EXEMPLE DERAISONNEMENT META
MESURER LE BIAIS DANS LE DONNÉES
Selon WikiPedia (anglais): "A statistic is biased if it iscalculated in such a way that it is systematically different
from the population parameter of interest."Hypothèse : Toute donnée sur le web est biaisée - avoir
conscience de ce biais est important
UN DERNIER EXEMPLE DERAISONNEMENT META
MESURER LE BIAIS DANS LE DONNÉES
Selon WikiPedia (anglais): "A statistic is biased if it iscalculated in such a way that it is systematically different
from the population parameter of interest."Hypothèse : Toute donnée sur le web est biaisée - avoir
conscience de ce biais est important.Mais comment mesurer un biais sans connaître la
population de référence?
MESURER LE BIAIS DANS LE DONNÉES
Compare les distributions de valeurs dans la projection dujeu de données à tester sur un jeu de données lié avec les
distributions dans l'ensemble du jeu de données.
Utilise le test de Student (test t) pour tester la significationdes différences de distributions.
Tiddi et al. @ EKAW 2014
MESURER LE BIAIS DANS LE DONNÉES
Sur cet exemple, S est la projection de LMDB (Linked MovieDatabase) sur DBpedia.
Tiddi et al. @ EKAW 2014
MESURER LE BIAIS DANS LE DONNÉESQuelques résultats peu surprenants...
Tiddi et al. @ EKAW 2014
MESURER LE BIAIS DANS LE DONNÉESEt d'autres un peu plus...
Tiddi et al. @ EKAW 2014
CONCLUSION / FUTUR
Le web sémantique avant:La promesse d'un web intelligent, avec du sens etdes raisonnements
Le web sémantique maintenant:Des données, des fois liées
Aller vers de nouvelles forme de raisonnement quis'adaptent aux caractéristiques des données liéeset qui font émerger le sens !
MERCI
Alessandro Adamou Enrico Daga Ilaria Tiddi
Shuangyan Liu Keerthi Thomas Enrico Motta