objets informationnels et objets culturels - open data, aix-en-provence, 19 avril 2012
TRANSCRIPT
Patrick PeccatteChercheur associé au
Laboratoire d'histoire visuelle contemporaine(Lhivic/EHESS)
[email protected]: @ppeccatte
Facebook: patrick.peccatteGoogle+: Patrick Peccatte
Flickr: patrickpeccatte et photosnormandieTumblr: dubruitausignal.tumblr.com
Objets informationnels et objets culturels
http://culturevisuelle.org/dejavu
Journée d’étude et atelier expérimental
Ouverture et réutilisation des données« Open Data culturel »
École supérieure d’art d’Aix-en-Provence – 19 & 20 avril 2012
Ouverture et réutilisation des données(programme et résumés des présentations)
Données, etc.(selon les résumés des présentations)
Base de données (di Filippi) Contenus, contenus numériques (Bermès, Domange) Document (Peccatte, Simon) Données, data, données ouvertes, open data(Aillagon, Artin, Bermès, di Filippi, Labelle & Holken, Nepote, Simon Vernet) Information (Artin, Domange, Peccatte) Rédactionnels, monographies, œuvres d'art, photographies, témoignages (Bekkers) Ressources, ressources numériques(Aillagon, Bermès, Simon)
Accès (Domange) Appropriation (Aillagon) Consommation (Aillagon) Diffusion (Aillagon, Bermès, di Filippi) Exploitation (Simon) Exposition (Simon) Indexation (Peccatte) Mashup (Artin) Mise à disposition (Domange) Navigation (Bermès) Ouverture (Intro, Simon, Vernet) Partage (Bekkers) Réutilisation (Intro, di Filippi, Simon) Restitution (Artin, Bekkers) Usage (Aillagon, Vernet) Valorisation (Aillagon)
Actions sur les données ?(selon les résumés des présentations)
Types de données Textes Nombres et visualisations de nombres Sons Images fixes Images animées Structures (tables, triplets, etc.)
Opérations informatiques majeures Stockage Recherche, accès (et quelques autres...)
Deux notions importantes à ajouter
Programmation✔ implicite car les données dont nous parlons
sont numériques Métadonnées (≈ description des données)
✔ implicite car les métadonnées sont des données
Le projet "Digital Public Library of America"
Les données sont documentarisées à travers les métadonnées ?
Recherche de texteUne phrase énigmatique
« Tap da sac'h 'ta, breur kozh »???
Recherche de texte
« Tap da sac'h 'ta, breur kozh »
Prends donc ton sac, vieux frèrePoème de Youenn Gwernig (en breton)
Recherche d'une partie d'image
D'où vient ce lolcat ?
Recherche d'une partie d'image
D'où vient ce lolcat ?
Jérôme Bosch, Le Jardin des délices, 1504
Reconnaissance de musique
Des logiciels grand public comme Shazam ou SoundHound permettent de reconnaître des mélodies
Culture et mémorisation
La culture ne peut plus être considérée comme une accumulation passive de connaissances diverses
La reconnaissance des œuvres peut être efficacement simulée par des algorithmes
Thèse faible✔ Ces applications Internet ne constituent qu'une
extension de notre mémoire
Thèse forte✔ Notre rapport au savoir et à la culture est profondément
modifié par les nouvelles possibilités informationnelles
"Penser en objets" - Background
Philosophie✔ Ontologie (plutôt analytique...)✔ Philosophie de l'information (Luciano Floridi)
Informatique✔ Représentation des connaissances [ontologies]✔ Programmation par objets
Une ontologie rudimentaire
Entités naturelles (Soleil, Lune)
Êtres physiques (hommes, animaux)
Êtres sociaux
Événements (naturels, historiographiques, etc.)
Artefacts (fabriqués par l'homme)✔ Objets techniques✔ Objets culturels, matériels ou immatériels
✗ Objets artistiques (peinture, musique, etc.)✔ Objets informationnels
L'information – un concept très complexe
théories de l'information (plusieurs)information sémantique
information physiqueinformation biologiqueinformation économiqueSIC: Sciences de l'information et de la communication
etc.
Informatique :traitement des données, traitement de l'information
Théories de l'information
Théorie de Shannon (1948)Théorie algorithmique de l'information
✔ Solomonov, Kolmogorov (années 1960)✔ Chaitin✔ etc.
Théorie algorithmique de l'information(grosso modo...)
Évaluation de la complexité d'une suite de signes S≈ quantité d'information
Une suite de signes est toujours le résultat de l'exécution d'au moins un programme
✔ À la recherche du temps perdu✔ print "Longtemps, je me suis couché de bonne
heure, etc."La quantité d'information d'une suite S est la longueur du plus court programme qui engendre S
Donnée = défaut d'uniformité représentable à l'aide de symboles
Information = Données + Interprétation
Conception sémantique de l'information
Objet computationnel (informatique)✔ collection de données numériques (informatiques)
brutes formant un tout
Objet informationnel✔ collection structurée d'informations
(pas obligatoirement numériques) formant un tout✔ un objet informationnel numérique est un objet
informatique(mais l'inverse n'est pas toujours vrai)
Objet computationnel et Objet informationnel
Un objet computationnel est une instance de classe
Old cars all in a neat row, by deflam, Creative Commonshttp://www.flickr.com/photos/freeparking/502609973/
Aspect méréologique des objets informationnels numériques(la méréologie est l'étude des relations entre la partie et le tout)
objet informationnel = collection structurée d'informations formant un tout auquel on accède à travers une ou plusieurs de ses parties
objet informationnel [o. i.]► o.i. immatériel
► o.i. numérique► o.i. numérique du Web
► o.i. numérique du Web recherchable► o.i. numérique du Web recherchablepar une ou plusieurs de ses parties
MéréologiePetite typologie des objets informationnels
La hiérarchisation des objets informationnels sur le Web
ressourceressourceressourceressourceressourceressourceressource
Liste de ressources dont on ne consulte que le haut.vue sur Google ≈ rasoir d'Occam
Représentation des textes - codage Unicode
Important et "invisible": Unicode Collation Algorithm (UCA) algorithme définissant un ordre normalisé pour le tri, la reconnaissance et la
recherche de texte
Représentation des sons et des images – empreintes (fingerprints)
Une empreinte acoustique d'un son (ou une empreinte visuelle d'une image) est une représentation simplifiée d'un signal audio (ou vidéo)Conception unifiée mettant en œuvre des méthodes d'accès aux objets à partir de fragments
Méthodes d'accès
Algorithmes✔ sur des classements, des hiérarchisations et valorisations ✔ sur des représentations textuelles directes (codages) ou
indirectes (contextes de publication, métadonnées) mais en fait, nommer ou décrire, c'est déjà classer
✔ sur des représentations d'objets ou de fragments d'objets (empreintes)
Accès aux objets≈ détermination des parties communes
Puissance (et limite) du calcul"Calculabilité externe"
Les objets informationnels numériques sont construits pour être ordonnés, recherchés et retrouvés, comparés et reliés entre euxLes recherches d'informations quelconques peuvent alors s'effectuer "mécaniquement"
Puissance (et limite) du calcul"Calculabilité interne"
Exemple Computable Document Format de Wolfram
Le document devient objet informationnel
Ce n'est pas seulement la mémoire humaine qui est impactée par le Web.
C'est notre conception même de la culture.
Document
Indexation,métadonnées
Statique
Localisé
Objet informationnel
Méthodes d'accès
Calculé, dynamique
Non localisé
Objection 1 : Ce n'est que du calcul
RéponsesLa théorie algorithmique de l'information lie les concepts d'information et de programmeLes propositions pour lesquelles il existe une démonstration [un algorithme] constituent une classe bien particulièreIl est remarquable que l'on puisse répondre à une question en mettant en œuvre un algorithme sur un corpus de données
Objection 2: Les humains ne fonctionnent pas ainsi
Grief semblable formulé à l'encontre du programme de l'Intelligence Artificielle dans les années 60
Big Mouth by angel_shark, (Flickr, Creative Commons) / Cyana by Ifremer, (Wikimedia Commons)
« Se demander si un ordinateur peut penser n'a pas plus d'intérêt que de se demander si un sous-marin peut nager. » Edsger Dijkstra
Émergence ?
Apparition de nouvelles informations qui s'agglomèrent aux objets informationnels sur le Web, provoquée par:
✔ l'interconnexion de ressources diverses✔ l'ouverture aux ressources dans des langues inconnues auparavant inaccessibles✔ l'insertion dans des flux informationnels✔ la sérendipité (capacité de découvrir quelque chose sans l'avoir cherché)
L'émergence en ontologie: apparition de nouvelles propriétés des objets au delà d'une certaine complexité
Émergence et cultures
Émergence d'applications et d'usages nouveaux lors de l'ouverture des données
Cultures: organisations selon des propriétés émergentes de la masse informationnelle rendue intelligible par des méthodes d'accès diversesUne multiplicité de cultures émergent et remplacent une culture classique normativeVers une "pluralité et une relativité" des ontologies culturelles (?)