dossier de presse - leçon inaugurale de serge abiteboul

8
Contact presse : Marie Chéron/Cécile Barnier : 01 44 27 12 72 - [email protected] Communiqué - mars 2012 Serge Abiteboul, un des plus grands spécialistes de la gestion des données sur le Web, nommé titulaire de la chaire Informatique et sciences numériques - Année académique 2011/2012 - Leçon Inaugurale le 08 mars 2012 Comment gérer la masse d’informations et de données gigantesque qui circule sur Internet ? Où trouver la bonne information et comment choisir ce que l’on veut conserver ? Google et ses concurrents peuvent-ils décider seuls de ce que l’on appelle désormais « l’intelligence commune » et garder secrets les paramètres qui jugent de la « pertinence » ? Les informations circulant sur Internet ont atteint un gigantisme qui donne le tournis. En 2012, un demi- Zettaoctets devrait circuler sur Internet : c’est beaucoup plus que la quantité d’informations correspondant à toutes les phrases prononcées depuis l’apparition du langage. La gestion des données, des informations et des connaissances disponibles sur la Toile est plus que jamais une question fondamentale, d’un point de vue informatique et scientifique mais aussi en termes économiques, éthiques et sociétaux. Il s’agit d’un domaine éminemment stratégique pour la recherche européenne. Le Collège de France a donc choisi de confier cette année la chaire Informatique et sciences numériques à Serge Abiteboul, reconnu internationalement comme l’un des plus grands spécialistes de la théorie des bases de données. Une nouvelle ère Internet : la construction de la Toile des connaissances Les sciences des données ont atteint un haut niveau de maturité. Aujourd’hui les problèmes de stockage et de calcul sont en partie résolus. La vraie difficulté n’est plus d’avoir accès à l’information mais de trouver celle dont on a besoin parmi des données qui prennent des formes très variées (textes, images, sons …). Nous devons aujourd’hui résonner en terme non pas de données * ou d’informations * mais de connaissances * , et les défis scientifiques sont immenses. Le nouveau monde que les informaticiens cherchent à modéliser leur échappe en partie car, sur la Toile, les informations sont complexes, subjectives et imprécises. Elaborer des machines capables de raisonner et de décider à partir d’informations floues et erronées Pour Serge Abiteboul, « un des grands défis des années à venir est de développer les technologies qui permettront de trouver, évaluer, valider, vérifier, hiérarchiser l’information pour aider l’internaute à obtenir la bonne information, au bon moment. Si le domaine de la gestion de données montre aujourd’hui un dynamisme étincelant, il tient pourtant encore de la forêt vierge en ce qui concerne la Toile. Un vaste programme ! ». Faut-il faire confiance au moteur de recherche sans comprendre le secret de leur classement ? « Outre les défis scientifiques, la gestion des connaissances disponibles sur la Toile pose des problèmes politiques et éthiques, face notamment au quasi-monopole de quelques moteurs de recherches. Les scientifiques ont un rôle à jouer dans l’établissement de contre-pouvoirs », estime Serge Abiteboul, « une mesure qui privilégie la popularité des pages a pour effet d’encourager l’uniformité. C’est certainement discutable, tout comme le fait que

Upload: hoangdien

Post on 05-Jan-2017

217 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Dossier de presse - Leçon inaugurale de Serge Abiteboul

Contact presse : Marie Chéron/Cécile Barnier : 01 44 27 12 72 - [email protected]

Communiqué - mars 2012

Serge Abiteboul, un des plus grands spécialistes de la gestion des données sur le Web, nommé titulaire de la chaire Informatique et sciences numériques

- Année académique 2011/2012 -

Leçon Inaugurale le 08 mars 2012

Comment gérer la masse d’informations et de données gigantesque qui circule sur Internet ?

Où trouver la bonne information et comment choisir ce que l’on veut conserver ?

Google et ses concurrents peuvent-ils décider seuls de ce que l’on appelle désormais « l’intelligence commune » et garder secrets les paramètres qui jugent de la « pertinence » ?

Les informations circulant sur Internet ont atteint un gigantisme qui donne le tournis. En 2012, un demi-Zettaoctets devrait circuler sur Internet : c’est beaucoup plus que la quantité d’informations correspondant à toutes les phrases prononcées depuis l’apparition du langage. La gestion des données, des informations et des connaissances disponibles sur la Toile est plus que jamais une question fondamentale, d’un point de vue informatique et scientifique mais aussi en termes économiques, éthiques et sociétaux. Il s’agit d’un domaine éminemment stratégique pour la recherche européenne.

Le Collège de France a donc choisi de confier cette année la chaire Informatique et sciences numériques à Serge Abiteboul, reconnu internationalement comme l’un des plus grands spécialistes de la théorie des bases de données.

Une nouvelle ère Internet : la construction de la Toile des connaissances

Les sciences des données ont atteint un haut niveau de maturité. Aujourd’hui les problèmes de stockage et de calcul sont en partie résolus. La vraie difficulté n’est plus d’avoir accès à l’information mais de trouver celle dont on a besoin parmi des données qui prennent des formes très variées (textes, images, sons …).

Nous devons aujourd’hui résonner en terme non pas de données*ou d’informations* mais de connaissances*, et les défis scientifiques sont immenses. Le nouveau monde que les informaticiens cherchent à modéliser leur échappe en partie car, sur la Toile, les informations sont complexes, subjectives et imprécises.

Elaborer des machines capables de raisonner et de décider à partir d’informations floues et erronées

Pour Serge Abiteboul, « un des grands défis des années à venir est de développer les technologies qui permettront de trouver, évaluer, valider, vérifier, hiérarchiser l’information pour aider l’internaute à obtenir la bonne information, au bon moment. Si le domaine de la gestion de données montre aujourd’hui un dynamisme étincelant, il tient pourtant encore de la forêt vierge en ce qui concerne la Toile. Un vaste programme ! ».

Faut-il faire confiance au moteur de recherche sans comprendre le secret de leur classement ?

« Outre les défis scientifiques, la gestion des connaissances disponibles sur la Toile pose des problèmes politiques et éthiques, face notamment au quasi-monopole de quelques moteurs de recherches. Les scientifiques ont un rôle à jouer dans l’établissement de contre-pouvoirs », estime Serge Abiteboul, « une mesure qui privilégie la popularité des pages a pour effet d’encourager l’uniformité. C’est certainement discutable, tout comme le fait que

Page 2: Dossier de presse - Leçon inaugurale de Serge Abiteboul

Contact presse : Marie Chéron/Cécile Barnier : 01 44 27 12 72 - [email protected]

la popularité utilisée par les moteurs de recherche actuels semble ignorer si la page est citée pour sa qualité (son exactitude) ou pas ». Serge Abiteboul donnera sa leçon inaugurale, Sciences des données, de la logique du premier ordre à la Toile, le 08 mars 2012, à 18h00. Ses cours auront lieu, à partir du 14 mars 2012, les mercredis à 10h00. Ils seront suivis, de 11h00 à 12h00, d’un séminaire en relation avec le cours (voir programme complet ci-joint). L’ensemble du cycle d’enseignement de Serge Abiteboul sera disponible sur le site Internet du Collège de France en version française et anglaise (www.college-de-france.fr).

*Données, informations et connaissances

Des mesures de température relevées par une station météo, ce sont des données. Une courbe donnant l'évolution dans le temps de la température moyenne dans un lieu, c’est une information. Le fait que la température sur terre augmente du fait de l’activité humaine, c’est une connaissance. En recevant un sens, des données (par exemple des chiffres de température) deviennent des informations. Ces informations muent en connaissances quand nous les introduisons dans un univers logique.

Page 3: Dossier de presse - Leçon inaugurale de Serge Abiteboul

Contact presse : Marie Chéron/Cécile Barnier : 01 44 27 12 72 - [email protected]

Chaire Informatique et sciences numériques

Année académique 2011/2012

Leçon Inaugurale de Serge Abiteboul, le 08 mars 2012

Sciences des données, de la logique du premier ordre à la Toile (présentation)

« L’information produite, stockée, traitée, échangée, est au cœur de l’activité des êtres vivants, des objets du monde, des associations humaines. Les systèmes informatiques nous aident à conserver cette information sous forme numérique telle une sauvegarde quasi illimitée de notre mémoire personnelle. Ils nous aident à traiter et échanger cette information pour communiquer entre nous. L’ordre de grandeur de l’information stockée atteint le zettaoctet ; 1021 octets ! Le trafic d’information annuel sur Internet dépasse même cette quantité d’information accumulée. Face à ces chiffres vertigineux, deux problèmes s’imposent: Où trouver la bonne information dans cette masse ? Comment déterminer ce que l’on veut conserver ?

Avec les efforts combinés d’une recherche académique dynamique, de pionniers marquants comme IBM, de jeunes géants comme Google et de startups hyper créatives, les sciences des données se sont épanouies. Pourtant le domaine tient encore de la forêt vierge quand nous atteignons la gestion de données distribuées et la Toile. Il est compliqué d’en dresser l’état de l’art ; il n’est pas simple de l’enseigner ; il n’est pas évident de prévoir quelles tendances sont là pour durer. C’est cette jungle que nous chercherons à pénétrer.

Les systèmes de gestion de bases de données relationnels sont des systèmes informatiques complexes, résultats de dizaines d’années de recherche et de développement. Ils sont parmi les plus grands succès logiciels du siècle dernier avec des produits commerciaux très répandus comme les serveurs Oracle et des systèmes gratuits très utilisés comme MySQL. Ils résultent de la combinaison de bases mathématiques solides (comme la logique du premier ordre), d’algorithmes très sophistiqués, et d’un engineering complexe.

Nous retrouvons ces trois mêmes ingrédients à la base des moteurs de recherche de la Toile. La Toile, le World Wide Web en anglais, s’appuie sur des documents hypermédia. Un moteur de recherche permet de fuir la navigation fastidieuse sur le graphe des pages et le monde de l’hypertexte pour plonger dans une bibliothèque numérique universelle. Si la Toile n’a sûrement pas de réponse à toutes les questions de l’internaute, la réponse à une question précise se trouve peut-être dans les masses d’informations véritablement extraordinaires disponibles. Tels des enfants, nous nous émerveillons devant les dizaines de milliards de documents de la Toile. Mais un enfant apprend, depuis son plus jeune âge, à évaluer, classer, filtrer le volume considérable d’informations qu’il rencontre. Et nous ? Si le moteur de recherche ne nous aidait pas à nous focaliser sur un petit nombre de pages, que ferions-nous ? L’exploit technique, c’est de retrouver en un instant, grâce à un index, les pages de la Toile qui hébergent les quelques mots d’une requête. La magie, expliquée par quelques équations et des algorithmes, c’est de pouvoir retrouver, parmi les dizaines, voire centaines de millions de pages qui contiennent les mots demandés, quelques pages qui vont satisfaire l’internaute.

L’écriture nous a permis de matérialiser et d’externaliser en partie notre mémoire. L’imprimerie nous a permis de transmettre largement cette mémoire externe. On a beaucoup insisté sur le fait que la Toile diminuait considérablement les coûts de transmission de la mémoire. Nous sommes en train de découvrir que sa véritable révolution est de permettre à chacun d’apporter sa contribution personnelle au patrimoine collectif (avec des réserves comme la fracture numérique). La Toile est ainsi une juxtaposition de milliards d’individus et de tous leurs réseaux. Après les réseaux de machines, les réseaux de contenus, nous atteignons les réseaux d’utilisateurs.

Page 4: Dossier de presse - Leçon inaugurale de Serge Abiteboul

Contact presse : Marie Chéron/Cécile Barnier : 01 44 27 12 72 - [email protected]

Des systèmes de la Toile, tels Facebook, permettent aux internautes de communiquer entre eux. Ce ne serait pas vraiment nouveau si ces nouveaux outils de communication ne conduisaient à d’autres modes de pensées, d’autres formes de relations. Surtout, phénomène véritablement passionnant, ces systèmes font émerger automatiquement, depuis les profondeurs des réseaux, des connaissances collectives. Plusieurs types d’approches permettent de construire de telles connaissances : la notation, par exemple, de produits ou d’entreprises par des internautes comme dans eBay ; l’évaluation de l’expertise des internautes comme dans Mechanical Turk ; la recommandation par exemple de produits comme dans Netflix ; la collaboration entre internautes pour réaliser collectivement une tâche qui les dépasse individuellement comme dans Wikipedia ; enfin, le crowdsourcing met des humains au service de systèmes informatiques comme avec Foldit. L’émergence automatique de telles connaissances soulève toute une gamme de questions, tant philosophiques que scientifiques.

En observant les évolutions de la Toile et des sciences des données, nous pouvons imaginer ce que pourra être la Toile de demain, une Toile des connaissances, avec des millions, voire des milliards de machines interconnectées raisonnant collectivement. La fascinante Toile des documents d’aujourd’hui est fondée sur le plaisir des gens à écrire, lire, dire, écouter du texte dans leurs langues naturelles. Les machines préfèrent échanger des connaissances plus formatées, plus rigoureuses. Avec le passage de la Toile du texte à une Toile des connaissances, elles pourront prendre plus pleinement en main la gestion de nos informations. Cela paraît une étape indispensable pour que l’humanité puisse survivre dans les flots d’information chaque jour plus cataclysmique qu’elle génère.

La Toile est multiforme et il est devenu quasi impossible de vivre sans elle. Elle est à la fois la plus belle des dentelles, trame de toutes connaissances humaines, et terreau des plus horribles fantasmes, de toutes les violences. Il n’est pas possible, ni souhaitable, d’y renoncer comme il n’a pas été possible de refuser l’écriture ou l’imprimerie. Et malgré tous les écueils, nous voulons continuer à croire que la Toile participera à féconder un meilleur futur. Quant aux aspects plus techniques, nous nous hasarderons à affirmer que la prochaine étape en sciences des données a déjà commencé : c’est la construction de la Toile des connaissances. Des données, à l’information, aux connaissances, le cheminement est logique ».

Serge Abiteboul

Page 5: Dossier de presse - Leçon inaugurale de Serge Abiteboul

Contact presse : Marie Chéron/Cécile Barnier : 01 44 27 12 72 - [email protected]

Chaire Informatique et sciences numériques

Année académique 2011/2012

Biographie Serge Abiteboul est Directeur de recherche à INRIA, membre du Laboratoire LSV de l’ENS Cachan.

Ses recherches portent sur la gestion de données, d’information et de connaissances, notamment sur le Web. Il est l’un des coauteurs de Foundations of Databases (Addison-Wesley), le livre de référence en théorie des bases de données, et plus récemment de Web Data Management (Cambridge University Press).

Il a obtenu un diplôme d’Ingénieur Télécom Paris, un PhD d’USC Los Angeles, et une Thèse d'Etat de l’Université Paris Sud. Il a été Assistant au Technion de Haïfa, Professeur invité aux universités de Stanford et d’Oxford (Ste Anne College), et Maître de conférence à l’Ecole Polytechnique.

Il a reçu le prestigieux ACM SIGMOD Innovation Award en 1998*, et le Prix d'Informatique de l'Académie des Sciences en 2007. En 2008, il a obtenu une Advanced Grant du Conseil Européen de la Recherche sur les Fondements de la Gestion de Données sur le Web. Il est membre de l’Académie des Sciences, de l’Académie Europae, et Fellow de l’ACM.

Il a cofondé, en 2000, la startup Xyleme, société spécialisée dans la gestion de grands volumes de données XML, et a été consultant dans l’industrie notamment pour la Nasa et pour Technicolor.

(*) Le seul autre européen à avoir reçu ce prix est Rudolf Bayer en 2001.

Page 6: Dossier de presse - Leçon inaugurale de Serge Abiteboul

Contact presse : Marie Chéron/Cécile Barnier : 01 44 27 12 72 - [email protected]

Chaire Informatique et sciences numériques

Année académique 2011/2012 Présentation du cycle d’enseignement de Serge Abiteboul Serge Abiteboul abordera dans un premier temps la gestion de données dans des systèmes centralisés basés sur le modèle relationnel (1er cours), puis d’autres modèles de données qui ont été proposés (2ème cours) allant vers des données plus complexes pour aboutir aux bases de connaissances (3ème cours).

Il s’attachera ensuite aux développements récents autour des documents actifs (4ème cours), aux moteurs de recherche de la Toile (5ème cours) à la renaissance de datalog (6ème cours), à la gestion de données distribuées (7ème cours) et dans ce cadre aux travaux récents autour de datalog distribué et du langage Webdamlog (8ème cours).

Huit séminaires viendront complémenter ce cours avec des présentations des meilleurs spécialistes internationaux : Moshe Vardi, Anastasia Ailamaki, François Bancilhon, Julien Masanès, Victor Vianu, Tova Milo, Georg Gottlob, Gerhard Weikum, Marie-Christine Rousset et Pierre Senellart.

L’ensemble de cet enseignement est d’accès libre, gratuit et sans inscription préalable. Il sera disponible sur le site Internet de l’institution en version française et anglaise (www.college-de-France.fr).

Page 7: Dossier de presse - Leçon inaugurale de Serge Abiteboul

Contact presse : Marie Chéron/Cécile Barnier : 01 44 27 12 72 - [email protected]

Pourquoi une chaire Informatique et sciences numériques ?

La chaire annuelle « Informatique et sciences numériques » a été créée, en partenariat entre le Collège de France et l’INRIA, en 2009 et pour cinq ans. Elle accueille chaque année un nouveau titulaire spécialiste reconnu d’un domaine (langages de programmation, sécurité et analyse de protocole, robotique, …). À l’heure où nous découvrons presque chaque jour de nouveaux usages liés aux nouvelles technologies, usages qui ne représentent pas uniquement de simples améliorations de notre quotidien mais révolutionnent totalement nos manières de faire, il est important de donner à nos concitoyens un « bon sens informatique ». Chacun doit pouvoir connaître les fondements de cette science au même titre que des principes physiques élémentaires comme l’attraction terrestre.

L’informatique, une science au cœur de notre quotidien et des enjeux scientifiques de demain « Le Collège de France au-delà de ses missions de recherche et d’enseignement, a toujours eu pour vocation de soutenir les sciences nouvelles et émergeantes et de rester en alerte sur les évolutions scientifiques qui bouleversent nos sociétés ; la révolution informatique et numérique étant sans conteste l’une d’entre elles. Tous les pans de notre vie sont touchés par ces bouleversements, notre quotidien, notre économie mais aussi la recherche scientifique. L’informatique ouvre en effet pour de nombreuses autres sciences des horizons et des territoires de recherche jusque-là insoupçonnables, à travers notamment les nouvelles possibilités de calcul, de simulation et de modélisation. Le Collège de France ne pouvait l’ignorer», estime le Pr. Pierre Corvol, son administrateur. Pour Michel Cosnard, Président-directeur général de l’Institut National de Recherche en Informatique et en Automatique (INRIA), « La chaire annuelle Informatique et sciences numériques marque l’entrée de l’informatique en tant que discipline scientifique autonome au sein du Collège de France. C’est une étape importante dans la reconnaissance de notre domaine scientifique. Cette reconnaissance est fondamentale pour que l’informatique bénéficie d’un enseignement plus large. De ce dernier dépendra la capacité de notre pays à profiter pleinement des avancées offertes par les nouvelles technologies, tant sur le plan sociétal qu’économique.» Les précédents titulaires de cette chaire ont été : Gérard Berry 2009/2010 : Penser, modéliser et maîtriser le calcul informatique. Martin Abadi 2010/2011 : La Sécurité Informatique.

Page 8: Dossier de presse - Leçon inaugurale de Serge Abiteboul

Contact presse : Marie Chéron/Cécile Barnier : 01 44 27 12 72 - [email protected]

Invitation Presse

Leçon inaugurale de Serge Abiteboul

Titulaire de la chaire Informatique et sciences numériques

Le jeudi 08 mars 2012, à 18 heures

Au Collège de France

11 Place Marcelin Berthelot - Paris 5°

Réponse à retourner par Email ou par fax 01 44 27 11 09 M. ………………………………………………………………………. Media ……………………………………………………………………….. Email ………………………………………………………………………... o � Assistera à la leçon inaugurale de Serge Abiteboul o N’assistera pas à la leçon inaugurale