lille by inria n°3 : les données, matière première et source d'enjeux pour le numérique

24
FOCUS > KEYCOOPT ET INRIA FOCUS > TAN : LES TRANSITIONS S'ANIMENT DOSSIER > LES ORPAILLEURS DU BIG DATA #03 DOSSIER LES DONNEES MATIÈRE PREMIÈRE ET SOURCE D'ENJEUX POUR LE NUMÉRIQUE JUIN 2016 LE MAGAZINE DU CENTRE INRIA LILLE - NORD EUROPE

Upload: inria

Post on 13-Apr-2017

1.678 views

Category:

Technology


2 download

TRANSCRIPT

Page 1: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

focus >

Keycooptet inria

focus >

tan : LeS tranSitionSS'animent

dossier >

LeS orpaiLLeurSdu big data

#03

dossier

Les donneesmatiÈre premiÈre

et SOUrCe D'enjeUx pOUr Le nUmÉriqUe

juin 2016

LE MAGAZINE DU CENTRE INRIA LILLE - NORD EUROPE

Page 2: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

ediTo

C’est avec une grande joie que j’ai signé, le 26 avril dernier, la promesse de vente d’un nouveau bâtiment pour notre centre de recherche. Grâce aux financements du Conseil régional des Hauts-de-France, de la Métropole Européenne de Lille et d’Inria, ce troisième bâtiment lillois, situé au sein d’EuraTechnologies, accueillera dès 2018 plusieurs de nos équipes-projets et InriaTech, la première plate-forme de transfert technologique de l’institut initiée à Lille.

Suite aux recrutements soutenus ces dernières années (six chercheurs en 2014 et six chercheurs en 2015) et au développement de dispositifs favorisant le transfert technologique et la création de start-up, il était essentiel pour le centre Inria de Lille de répondre aux enjeux de l’institut qui favorise l’excellence scientifique au service du transfert technologique et de la société. Cette implantation, au cœur de l’écosystème de la French Tech lilloise, sera dédiée principalement à la donnée et au logiciel libre, priorités scientifiques du centre.

La récolte, le traitement ou encore la visualisation des données sont des sujets de recherche faisant l’expertise de plusieurs de nos équipes-projets dont la renommée est internationale. Cette expertise sur la “ data ”, sollicitée par les entreprises de la région, nous permet de mettre en place des collaborations répondant à un besoin fort de transfert technologique et ce, grâce notamment à InriaTech dont nous fêtons fièrement un an de succès.

C’est donc tout naturellement que ce numéro 3 de notre magazine est dédié à la donnée, thématique de recherche phare de notre institut et du centre de Lille en particulier, et faisant l’objet d’un projet emblématique inscrit dans le contrat de plan État-Région 2015-2020.

Je vous souhaite une bonne lecture et vous donne d’ores et déjà rendez-vous le 20 octobre prochain, dans nos bâtiments à la Haute-Borne, afin de célébrer le recrutement du cinquantième chercheur Inria à Lille. Ce sera l’occasion de discuter de l’impact de notre engagement sur l’écosystème euro-régional en termes d’emplois, d’innovation et d’enjeux stratégiques.

David SIMPLOT-RyL

02

Page 3: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

sommAire

dessine-moi LA recherche 12-13

focus 14-15• tan : les transitions s'animent

focus 16-17• Keycoopt et inria réinventent le recrutement

par cooptation

besT-of 18-19

porTrAiT 20-21

rendez-vous 22

conTAcT 23

dossier

• Les données : matière première et source d'enjeux pour le numérique

07-11

fAce A fAce• Pierre de Saintignon 04• anne Debertonne 05

moTs cLes 06

03

Semestriel édité par Centre de Recherche Inria Lille Nord Europe : Parc scientifique de la Haute Borne, 40, avenue Halley. Bât. A, Park Plaza, 59650 Villeneuve d’Ascq. [email protected]. Directeur de la publication : David Simplot-Ryl. Rédactrice en chef : Marie-Agnès Enard. Coordinatrice : Marion Blasquez. Conception graphique et mise en page : Élise Cattoire agence KaméléCom, 11/1 sentier du Christ, 59960 Neuville-en-Ferrain. Rédacteurs : Franck Deflandre agence KaméléCom et service communication et médiation Inria Lille - Nord Europe. Crédits photos : © Inria / Photo WIMMICS - Inria / Photo Kaksonen - Inria / Photo C. Morel - Inria / Photo P. Caron - Inria / Photo N. Fagot. © Fotolia. © TAN / Design G. Dorne. Impression : Easily Havet Concept Group, 3725 Rue de la Lys, 62840 Sailly-sur-la-Lys. Le centre remercie chaleureusement l’ensemble des contributeurs, collaborateurs et partenaires de ce troisième numéro de Lille by Inria. Imprimé en juin 2016 - Série limitée à 1000 exemplaires.

Page 4: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

04

// fAce A fAce

inTerviewspierre de Saintignon > préSident d’euratechnoLogieS

> Quels sont les atouts de notre région dans le domaine de la recherche numérique ?

Ils sont nombreux, à l’image des travaux qui sont menés par Inria, par les universités et par les laboratoires dans la région. Le numérique a pris une place

prépondérante dans les thématiques de recherche, dans la compétence des chercheurs en activité et dans les ambitions affichées par les au-torités académiques locales. Avec la fusion, notre recherche se rapproche géographiquement des plus grands centres de recherches parisiens et se doit de jouer la complémentarité. L’objectif est d’atteindre le monde de l’entreprise et de favoriser les échanges entre chercheurs et industriels en utilisant différentes stratégies de promotion (Inbound ou Outbound). Nous devons faire des efforts pour le transfert vers les entreprises, pour rendre encore plus compétitives et valoriser nos ETI, PME, PMI et start-up.

> Quels sont, selon vous, les grands enjeux à venir autour des données ?

Chaque jour, i l est généré 2 ,5 trillions d’octets de données. 90% de ces données ont été créées au cours des deux dernières années. Elles proviennent en par tie de l’utilisation d’ordinateurs ou de téléphones connectés à internet. Depuis plusieurs années déjà, nous avons compris les enjeux de cette question (acquisition, traitement,

gestion et valorisation de données informat iques massives) , qui constitue un vecteur de dévelop-pement particulièrement porteur pour l’avenir. En effet, l’analyse des volumes massifs de données, sous des conditions d’anonymat et de préservation de la vie privée soigneusement encadrées, peut être à la source du développement de nouvelles formes de collaboration entre les grands industriels, les PMEs, les acteurs de la recherche et les collectivités locales. Ensemble, ils peuvent inventer de nouveaux produits, développer de nouveaux usages et services à la population mais aussi créer de l’emploi. Pour faire émerger les domaines d’appli-cation concrets, il faut inventer de nouvelles techniques de compilation et d’analyse qui permettront d’exploi-ter efficacement un tel volume de données. Le projet TERRIL, confié par la Région à EuraTechnologies vise à développer des programmes de recherche dans ce domaine. La Troisième Révolution Industrielle doit pouvoir intégrer cette notion de big data comme technologie d’appui aux réponses à apporter aux défis écologiques et économiques qui se présentent à nous.

> Quel regard portez-vous sur l’excellence scientifique incarnée par Inria ?

Tout d’abord, nous avons été fiers et honorés d’accueillir Inria à EuraTech parmi les pionniers de cette belle aventure. Ce premier établissement de recherche s’est naturellement im-

posé comme une référence nationale et internationale, aux côtés d’autres acteurs académiques comme HEI et nous a donné l’occasion de devenir crédible aux yeux de l’industrie. L’implantation du Plateau a été un formidable accélérateur de transfert. L’excellence scientifique incarnée par Inria alliée à l’excellence économique d’EuraTech portée par un réseau d’entrepreneurs visionnaires et créa-tifs constitue un modèle du genre. Il s’agit d’un écosystème unique en Europe et dans le monde, au service de toute une région en mutation. Il nous faut maintenant passer la vitesse supérieure en soutenant la création de plus d’entreprises inno-vantes. Inria représente un partenaire précieux pour ces entrepreneurs en quête de développement technolo-gique. Cette collaboration valorise nos entreprises en les rendant en-core plus compétitives notamment à l’export.

º euratechnologies.com

Page 5: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

#03 juin 2016 05

anne debertonne > co-fondatrice de What a nice pLace

> Quelle est la place de la recherche en sciences du numérique chez “ What a Nice Place ” ?

Les sciences du numérique sont arrivées assez tardivement dans la construction du projet What A

Nice Place. Avec nos formations en commerce et dans le marketing/web, nous nous sommes plutôt centrés en priorité sur l’usage et l’expérience uti-lisateurs. Parallèlement, nous avons développé en interne un outil qui a rapidement affiché quelques fai-blesses. C’est à ce moment que nous avons commencé à échanger avec Inria pour résoudre ces problèmes. Rapidement, cette collaboration nous a offert de nouvelles perspec-tives d’optimisation de nos process internes mais a aussi fait émerger de nouvelles idées pour aller plus loin en termes d’expérience client. Nous avons alors pris conscience de la place que devait prendre la recherche en sciences numériques chez WANP en interne et à travers notre collaboration avec les équipes Inria pour les sujets liés à la R&D.

> Quels sont, selon vous, les grands enjeux à venir autour des données ?

Dans ce domaine, la dimension collaborative représente un enjeu important. Entre les phases de trai-tement, de manipulation et d’analyse des données, des spécialistes issus de domaines aussi différents que le numérique ou le marketing interviennent. Il y a des enjeux de communication importants pour ras-sembler ces deux mondes qui n’ont pas forcément appris à travailler ensemble. Dans le domaine, les dif-ficultés de recrutement représentent aussi un sérieux obstacle. Dans les entreprises et plus largement dans le monde actuel, les besoins en analyse et manipulation de données vont croissant mais les candidats sont rares et chers sur le marché. Il est difficile de fidéliser ce genre de profil. Par ailleurs, les formations sont ma-joritairement destinées à des postes orientés “ grandes structures ” avec des candidats qui maîtrisent l’analyse des données mais peu les développements. Enfin, la systéma-

tisation des processus d’analyse évolutive représente un autre enjeu. Il faut imaginer des solutions à apprentissage actif, plus complexes, mais indispensable pour construire des solutions pérennes.

> Quel regard portez-vous sur l’excellence scientifique portée par Inria ?

Inria est devenu un partenaire pré-cieux. Cette collaboration a changé mon regard sur le domaine de l’excel-lence scientifique qui me paraissait difficilement accessible. Inria traite effectivement de problématiques complexes mais les interlocuteurs ont toujours à cœur de se mettre à la portée de leur interlocuteur. La politique d’Inria repose aussi sur l’aspect collaboratif. Sur la base d’échanges, chacun peut mettre ses compétences au service d’une problématique.

º whataniceplace.com

Page 6: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

06

De quoi parle-t-on quanD on parle De

données ?

D’où proviennent

les données ?

quanD parle-t-on

De BIG dATA ?

sur quels sujetsportent lesrecherches menées

chez InrIA ?

Qu'est-ce Quichange avec les

métadonnées ?

Elles peuvent être mesurées par le biais d’ins-truments physiques comme des capteurs ou des équipements scientifiques. Elles peuvent être produites par des logiciels de manière autonome (par simulation numérique) ou en réaction à des événements (suite à des interactions avec d’autres logiciels ou avec des utilisateurs, par exemple). Elles peuvent bien sûr aussi être produites "à la main" par des personnes.

Sur la modélisation, la représentation, l’interroga-tion et le stockage des données. Sur les données incertaines, sur le contrôle d’accès, la confidentia-lité. Sur l’extraction de connaissance, l’analyse de données. Sur l’apprentissage et les systèmes de recommandation. Sur l’optimisation des processus de traitement et de décision. Sur la visualisation interactive des données.

La quantité de données disponible fait espérer des analyses plus fiables et produisant de nouvelles connaissances. C’est ce qui fait dire à certains que les données sont "le nouvel or noir", une nou-velle ressource à exploiter pour en extraire de la valeur. Mais produire, acheminer, traiter, stocker et analyser les mégadonnées nécessite de nouvelles approches mathématiques et informatiques.

De collections d’éléments d’information manipu-lables sous une forme informatique : de nombres, de textes, d’images, de sons et de vidéos intégrés dans des tables ou documents, par exemple.

On parle de mégadonnées (ou de données massives) quand leur volume ou leur débit est tel qu’elles ne peuvent être traitées de manière conventionnelle. Un volume ou un débit importants peuvent résulter d’une mesure ou d’une simulation très précise, d’une acquisition en continu ou de l’accumulation sur de longues périodes, ou de la production en parallèle par de nombreuses sources.

// moTs cLes

Page 7: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

07 #03 juin 2016

Les orpAiLLeurs du big dATA 08-09

un projeT cper

dedie A LA donnee 09-10

bigremenT dATA chez inriA 11

sommAire

dossier \\

Les donnees :matiÈre premiÈre

et SOUrCe D'enjeUxpOUr Le nUmÉriqUe

Page 8: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

08

// dossier > les données

Nous produisons chaque jour des milliards de données de par le monde : un flot continu d’in-formations dématérialisées qui vaut son pesant d’or. En 2012 ce marché des données représentait déjà 6,3 milliards

de dollars et pourrait atteindre 48,3 milliards d’ici à 2018*. Chez Inria, les équipes-projets de recherche se mobilisent pour trouver comment créer du sens et de la valeur à partir de ces données.

Mais que peuvent bien contenir nos données pour que les entreprises et les chercheurs se les arrachent à ce point ? Les spécialistes décrivent le Big Data comme le nouvel or noir : parmi ces flots continus d’informa-tions que nous produisons tous les jours, se cacherait forcément de la valeur. De nombreuses entreprises et startups sont à la recherche des clés qui leur permettront de créer du sens et surtout de générer des revenus à partir de quantités de données inintelligibles pour un simple cerveau humain. Un enjeu de taille qui mobilise les équipes-projets du centre Inria Lille – Nord Europe et les conduit à nouer de nombreux partenariats.

À L’origine du big data : deS ordinateurS pLuS puiSSantS et deS objetS connectéS

Le Big Data est un phénomène ré-cent, issu de la puissance de calcul des ordinateurs d’aujourd’hui*, mais surtout de la multiplication des objets connectés. Une foule de données sort directement de notre

poche et de nos Smartphones : en 2015, 58% des Français étaient équipés d’un de ces appareils. Un chiffre qui continue de progresser et qui atteint 90% chez les 18-24 ans. Les données récoltées par le biais des différents systèmes ou services proposés par ces équi-pements sont faramineuses : géolocalisation, requêtes, mes-sages, photos et vidéos envoyées quotidiennement par des mil-liards d’utilisateurs. Les réseaux sociaux (Twitter, Facebook etc.) émettent un flot continu que l’on compare parfois à des “ fire hose ” (des lances à incendie), d’où les datas, jaillissent en très grande quantité et en flux discontinu. Plus de 500 millions de tweets sont pu-bliés tous les jours et 144 milliards d’emails. Mais ce n’est pas tout : “ Aujourd’hui, nous sommes en-tourés de réseaux de capteurs : pour enregistrer des données cli-matiques par exemple, ou bien dans l’industrie, pour gérer des stocks, ” explique Nicolas Rous-sel, délégué scientifique du centre Inria Lille – Nord Europe. Toutes ces informations peuplent de gigan-tesque datas centers : des mines qui valent de l’or, si l’on sait s’y re-pérer et que l’on met au point des méthodes pour leur donner du sens. “ À partir du moment où elles sont devenues big, les datas ont intéressé les chercheurs. Mais le chemin entre les données et la création de valeur est long et com-pliqué, ” prévient-il.

deS donnéeS pourprévoir L’avenir

Ce potentiel, beaucoup d’entreprises l’ont déjà repéré. Sylvain Karpf est responsable du service transfert pour l'innovation et partenariats du centre Inria Lille - Nord Europe. Il joue un rôle d’intermédiaire entre les chercheurs et les acteurs écono-miques de la région. “ Exploiter des données est un besoin dont les en-treprises nous font souvent part, explique-t-il. Ils souhaitent que nous leur offrions des solutions pour traiter des gros volumes. ” Le secteur du commerce est particu-lièrement demandeur, par exemple pour réaliser des outils de gestion des stocks, car une bonne analyse, réalisée à partir de méthodes de calcul adaptées, permet de prédire l’avenir. Ainsi, l’équipe-projet Modal sous la responsabilité de Christophe Biernacki, propose une approche statistique pour le traitement de données et travaille sur ces sujets avec l’éditeur de logiciel Cylande. Dans l’industrie, les acteurs s’inté-ressent à la maintenance prédictive : en récoltant de très nombreuses données sur la chaine de produc-tion, des algorithmes sont capables de prévoir une panne suggérant ain-si de réaliser une opération de main-tenance. Des équipes de recherche comme Dolphin et Inocs proposent quant à elles des méthodes d’op-timisation s’appliquant à de nom-breux secteurs.

viSuaLiSer LeS donnéeS

Une startup baptisée Colisweb col-labore avec des chercheurs d’Inocs

Les orpAiLLeursdu big data

Page 9: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

#03 juin 2016 09

pour optimiser leur système de livrai-son de colis sur le dernier kilomètre et générer un modèle économique rentable. D’autres équipes-projets du centre Inria Lille – Nord Europe, comme Sequel ou Magnet, utilisent le machine learning pour élaborer des systèmes de recommandation : des recommandations de produits dans le commerce ou des conseils musicaux par exemple. “ Grâce à nos partenariats avec des entre-prises, nous disposons de données réelles pour valider nos travaux de recherche et les faire progresser, ” se félicite Sylvain Karpf. En bout de chaine, vient la visualisation des données : comment rendre intelli-gible et compréhensible d’un seul coup d’œil une masse colossale de données. C’est ce que réalisent les chercheurs de l’équipe Mjolnir de

Nicolas Roussel, qui travaillent sur les interactions homme-machine.

À La recherche du” quaLity data “

“ On a tendance à croire que dès qu’il y a des données en quantité, il y a de la valeur. Mais il faut être vigilant quant à leur qualité. La position indiquée par un Smart-phone ou un récepteur GPS n’est pas toujours fiable par exemple. Comment travailler à partir de da-tas imparfaites ? ” prévient Nicolas Roussel. Pour répondre à ce défi, plusieurs équipes-projets du centre Inria Lille – Nord Europe sont mo-bilisées. Fun propose notamment d’optimiser les réseaux de capteurs pour les rendre plus fiables, alors que Modal cherche à élaborer des

modèles statistiques capables de réaliser des prévisions fiables à par-tir de données imparfaites, en com-plétant les trous et corrigeant les erreurs. Les perspectives et les en-jeux autour des données sont donc vastes et particulièrement straté-giques pour les années à venir. Dans ce contexte, le centre de recherche Inria Lille – Nord Europe est por-teur d’un projet CPER (Contrat Plan Etat Région) Data pour “ Advanced data science and technologies ”. Ce projet ambitionne de mener un pro-gramme de recherche sur ce sujet au meilleur niveau international en synergie forte avec le tissu écono-mique régional et de mettre en place les infrastructures de recherche à la hauteur des enjeux.

Un projet cperdédié à la donnée

*D’après le cabinet d’études Transparency Market Research.*Tianhe-2, l’ordinateur chinois qui détient le record du monde, peut réaliser plus de 33 billiards (33 millions de milliards) d’opérations à la seconde.

Les techniques du nu-m é r i q u e b o u l e v e r s e n t c o ns id é rab l e m e nt n os so c ié tés e t impacte nt l’ensemble des activités humaines. Pour maîtriser ces transformations, le do-

maine de la recherche joue un rôle fondamental. Il permet d’adapter ces nouvelles techniques et ces nouvelles connaissances au monde qui nous entoure en proposant des solutions et des technologies pour nos sociétés. Le numérique représente éga-lement à lui seul un nouveau secteur économique générateur d’emplois directs (30 000 emplois dans le Nord et le Pas-de-Calais)

mais aussi plus indirects dans les nombreux domaines d’application pour les industries du numérique. Dans ce contexte, la donnée et les technologies numériques clés associées (Internet des objets, cloud computing, big data et calcul intensif) représentent des enjeux importants. Il s’agit des principaux axes développés dans le projet “ Advanced data science and technologies ” porté par Inria dans le cadre du contrat de plan État-Région (CPER) 2015-2020 et qui associe Centrale Lille, le CNRS, l’École des Mines de Douai, l’Université d’Artois et l’Université de Lille. L’objectif est de mener un programme de recherche, en

synergie avec le tissu économique régional, et de mettre en place des infrastructures à la hauteur des enjeux de cette révolution numérique.

Le programme Scientifique

Il s’articule autour de trois do-maines d’excellence, développés dans notre région, dans la re-cherche numérique et concernent les différentes étapes de la vie d’une donnée de sa captation à son exploitation.

L’internet des objets : il s’agit d’un concept qui représente l’extension du réseau internet à des objets

Page 10: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

leur permettant ainsi de commu-niquer entre eux ou de collecter des informations. Il implique un bouleversement en profondeur de notre quotidien qui va bien au-delà de la simple utilisation de nos smartphones.Les applications, dans le monde physique environnant, sont très nombreuses par exemple grâce à l’utilisation des RFID (Radio Frequency Identification), une méthode pour récupérer des données à distance, ou le dévelop-pement de réseaux de capteurs. L’augmentat ion du nombre d’objets connectés dans notre quotidien génère des volumes de données toujours plus importants.

Intelligence des données et des connaissances : désormais, les activités humaines entraînent des échanges de données aux volumes gigantesques. Afin de pouvoir les traiter et en extraire des informations, il faut être ca-pable de repousser les limites des techniques existantes et relever en permanence des défis liés à la modélisation des données, à l’ap-prentissage artificiel, à la fouille des données, à l’intelligence ar-tificielle ou encore à l’exploitation de bases de données. Le domaine de la recherche doit s’adapter pour pouvoir gérer des problématiques de plus en plus complexes et inventer des systèmes capables de raisonner en présence de tous les types de données.

Calcul haute performance et optimisation : l’exploitation de données qui peuvent être volumi-neuses, dynamiques, incertaines voire incomplètes demande des capacités de traitement impor-tantes. Dans le domaine du calcul haute-performance, la puissance de calcul développé a considéra-blement augmenté ces dernières années. Il faut pouvoir développer des algorithmes capables de

traiter des volumes importants de données et d’exploiter les informations contenues dans les nuages, tout en relevant le défi de la maîtrise de la consommation d’énergie (green computing).

deS infraStructureS À La hauteur deS enjeux

Afin de concrétiser les recherches menées dans le domaine des data, dans le cadre de ce projet du CPER, plusieurs plates-formes se-ront mises en œuvre. La première, pourvue d’un environnement idéal avec l’équipement d’excellence Future Internet of Things (EquipEx FIT), permettra de mener des expérimentations dans le do-maine de l’internet des objets. La deuxième aura pour vocation de valider les travaux de recherche sur le calcul haute-performance autour de la plate-forme nationale Grid’5000. Les travaux seront également valorisés à travers le développement de logiciels phares dans les domaines de la collecte et du traitement des données.Plusieurs démonstrateurs seront également réalisés, favorisant interactions avec le monde so-cio-économique :

• Un service web d’OpenAPI sera mis en œuvre pour l’expérimen-tation à titre d’essai des résultats de la recherche.

• Un démonstrateur baptisé “ Mes Infos ” sera développé. Il s’agit d’une initiative basée sur le principe d’un coffre-fort dans lequel le citoyen pourrait gérer certaines de ses données personnelles.

• Le démonstrateur “ smartGrid ” permettra de mettre en œuvre les techniques de collecte de données pour la gestion de réseaux de distribution d’électri-cité intelligents. Il sera développé dans le cadre du projet de dé-monstrateur de ville intelligente

et durable proposé également dans le cadre du CPER.

deS retombéeS Scien-tifiqueS régionaLeS et internationaLeS

Le sujet des data impliquant des enjeux importants dans beaucoup de domaines, la valorisation des travaux menés dans ce projet du CPER devrai t connaî t re un retentissement national et international fort dans le do-maine de la recherche. Le projet prendra aussi une dimension régionale importante en raison des nombreuses interactions avec les pôles d’excellence et les pôles de compétitivité de la Région. Au regard du diagnostic territorial et du schéma régional de développement économique, quatre domaines d’application prioritaires ont été identifiés pour le transfert et la valorisation de ces technologies clés liées à l’exploitation des données :

• Ubiquitaire, smart cities, trans-port et énergie

• Services à la personne et commerce

• Culture, loisirs et création numérique

• Santé et hôpital numérique

Dans la région, des pôles d’excel-lence comme EuraTechnologies, Pictanovo, le pôle des industries du commerce ou encore le campus-pilote de l’Université de Lille – Sciences et Technologies sur les “ smart cities ” par exemple représentent des atouts pour l’expérimentation et la valorisation des actions de recherche de ce projet. Le programme impliquera également les entreprises à travers la mise en place de laboratoires communs avec des PMEs afin de favoriser la montée en puissance de la R&D privée.

10

\\ dossier > les données

Page 11: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

11 #03 juin 2016

les données < dossier \\

La plate-forme ouverte Moose, de l’équipe-projet Rmod, permet d’analyser des logiciels de plus 5 millions de lignes de code et offre plus de 70 métriques. Elle permet d’analyser plus de 15 langages différents.

L’équipe-projet Fun et la société Traxens proposent d’équiper tous les contai-ners qui transitent dans le monde d’un capteur sans fil capable de surveiller l’état de santé et la position du container et de sa marchandise où qu’il soit sur la planète. Pour le produit de Traxens, chaque capteur remonte entre 1 et 2 kilo oc-tet de données chaque jour, soit entre 19 et 38 mega octet par bateau et par jour.

La plate-forme logicielle Paprika, développée par l’équipe-projet Spirals, a déjà pu identifier 7,7 millions d’anti-patrons logiciels en automatisant l’analyse de 291,3 millions d’instructions de 3553 applications mobiles publiées sur le Goo-gle Play Store. Les anti-patrons sont des erreurs courantes d’implémentation et de conception des logiciels.

L’équipe Mjolnir a récemment collecté des informations relatives à plus de 82 millions de contacts sur des pavés tactiles (position du doigt, orientation, taille de la zone de contact). Ces données vont être utilisées pour comprendre l’utilisa-tion actuelle de ces dispositifs et proposer de nouvelles techniques d’interaction.

En bio-informatique, le volume de données d’ADN généré en routine par le sé-quençage d’un échantillon environnemental est de 100 gigabases. Ce type d’échantillon peut être analysé en moins d’une minute par le logiciel SortMeRNA développé par l’équipe-projet Bonsai.

L’équipe-projet Modal a analysé 2.5 millions de tickets de caisse pour aider la société Rouge Gorge à mieux comprendre qui sont ses client(e)s.

31,5 millions de mesures ont été utilisées pour créer le modèle d’un écoulement turbulent par l’équipe-projet Non-A. L’objectif du travail est de réduire les tur-bulences aérodynamiques pour réduire la consommation des véhicules ou améliorer la portance des avions. Ces résultats en simulation vont être testés en soufflerie à l’Onera.

bigrement data chez inria

Page 12: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

12

// dessine-moi LA recherche

Page 13: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

13 #03 juin 2016

Page 14: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

14

Le démonstrateur TAN installé sur le Plateau Inria à EuraTechnologies pré-sente trois exemples de travaux de Fanny Chevalier (chercheuse au sein de l’équipe Inria Mjolnir) dans le domaine des transitions animées.

Les transitions animées participent à la facilité et à la qualité de lecture dans les interfaces. Concrètement, il s’agit de ces animations qui per-mettent de fluidifier le passage d’une page internet à une autre, d’identifier où disparaissent les fe-nêtres de votre bureau quand vous les minimisez, ou encore de rafrai-chir progressivement un fil d’actua-lité en ligne. Ces animations sont

utiles pour véhiculer de manière évi-dente les informations essentielles à l’utilisateur d’un système infor-matique. Si elles sont mal maîtri-sées, ces transitions animées repré-sentent des sources de pollutions visuelles pour les usagers. Pour les rendre efficace, il est donc essentiel de réaliser un travail de conception précis en y intégrant une multitude de paramètres. Dans le cadre de ses

// focus > InteractIon homme-machInein

te

ra

ct

ion

h

om

me

-ma

ch

ine

Les TrAnsiTions S'animent

Page 15: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

15 #03 juin 2016

travaux de recherche, Fanny Cheva-lier, chercheuse au sein de l’équipe de recherche Mjolnir (commune avec l’Université de Lille 1), a déve-loppé des modèles de transitions animées permettant une meilleure compréhension des interfaces, et conçu des outils les utilisant pour faciliter, par exemple, le travail de retouche d’image, ou l’édition de do-cuments.

hiStomageS : LeS tranSi-tionS animéeS au Service de La retouche numé-rique

Pour comprendre l’intérêt du dé-veloppement de cet outil, il faut tout d’abord comprendre comment est composé l’histogramme d’une image. Il s’agit d’un graphique sta-tistique qui représente le nombre de pixels et l’intensité des couleurs qui y sont associées, des notions consi-dérées comme des indicateurs pou-vant guider la retouche numérique. C’est en modifiant cet histogramme qu’il est possible de corriger les nuances et l’échelle des couleurs dans le but de rendre l’image plus lisible ou plus attractive. Habituel-lement assez complexe, ce genre de manipulation devient beaucoup plus facile. Avec Histomages, l’uti-lisateur peut sélectionner les pixels d’une zone précise et ainsi modifier les caractéristiques colorimétriques de cette partie de l’image ou de la photo. L’outil facilite cette démarche grâce à des transitions animées qui favorisent la compréhension du principe de l’histogramme et de la retouche d’images numériques. Les pixels de l’image s’animent pour se “ réorganiser ” en fonction de leur valeur de couleurs, et former progressivement l’histogramme. Il est possible de manipuler la cou-leur des pixels directement dans cet histogramme en déplaçant les pixels dans cet espace de couleurs,

par exemple, en faisant glisser une sélection de pixels clairs dans l’his-togramme de luminance, vers une zone plus foncée. L’utilisateur tra-vaille à partir de deux représenta-tions différentes de la même image, entièrement synchronisées, pour fa-ciliter les retouches de la photo.

diffamation : n’oubLiez paS La verSion originaLe

Sur un document assez complexe, le texte ou le code source que nous rédigeons évoluent au fil du temps avec des ajouts, des suppressions ou des corrections. Mais parfois, il peut être très utile de conserver une trace des modifications suc-cessives. Grâce à Diffamation, il est possible de travailler à partir de n’importe quelle étape mais aus-si de comparer plusieurs versions d’un document depuis sa création jusqu’au dernier modèle. Afin de créer une solution la plus complète possible, Fanny Chevalier a intégré la notion de transition animée pour faciliter la lecture d’un document et pour retrouver la totalité de ses évolutions. Sous Word par exemple, un outil de correction permet de vi-sionner deux représentations com-binées d’une page avec les ajouts colorés et les suppressions barrées. Diffamation va plus loin, notamment grâce aux principes des transitions animées. Des animations élaborées facilitent le passage d’une version d’un texte à une autre à l'aide d’une illustration colorée. Vous pouvez na-viguer au fil d’une sorte de ligne de vie du texte située en haut de l’écran qui permet de montrer de manière intelligible les ajouts, modifications et suppressions de texte entre la to-talité des versions d’un document.

gLiimpSe : SimpLe comme un cLic

Entre le HTML, le LaTeX ou encore le

wiki, les langages à balise (Markup Language) sont très nombreux. Les éditer sur un document final de-mande habituellement des étapes de compilations et de chargement assez fastidieuses et répétitives. Avec l’outil Gliimpse, il est pos-sible de basculer instantanément du code source au résultat final et inversement en un seul clic. Dans le langage HTML, le plus connu d’entre eux, les balises indiquent par exemple à l’intérieur d’un fichier les éléments de mise en page tels que les titres, les paragraphes ou encore les polices. Pour éditer ce langage sur une page web, comme pour le wiki ou le LateX (souvent utilisé par les scientifiques) il faut utiliser un logiciel spécifique qui implique de nombreuses manipulations. L’outil Gliimpse vient améliorer et faciliter les modes d’édition. Des animations sophistiquées, permettent de com-prendre le lien entre le texte brut du code et les textes formatés en images et autres éléments visuels qu’il produit. Les transitions ani-mées sont optimisées pour visua-liser sans effort la représentation mise en forme d’un document défini par balises.

º tan.lille.inria.frº mjolnir.lille.inria.fr

Page 16: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

16

Le marché du recrutement se digitalise fortement. Les réseaux sociaux profession-nels (L inkedIn , V iadeo, . . .) représentent des vecteurs de communication et de prospec-tion efficaces sur le marché du travail. Ils favorisent les recru-

tements et facilitent les recherches de nouveaux partenaires profession-nels. Cependant, d’après la dernière enquête de l’Apec, le réseau continue à jouer un rôle essentiel puisque 39% des entreprises ont recours à la cooptation des salariés pour trouver des candidats. Keycoopt propose de rendre plus efficace les recrutements en associant les deux tendances. La jeune start-up lilloise a lancé une plate-forme d’“ e-cooptation ”. Le principe est de relayer les annonces d’entreprises à un réseau d’experts métiers en fonction de leur localisa-tion et de leur profil. Ils sont ensuite chargés d’activer leur réseau de connaissances afin de recomman-der le candidat qui répond le mieux aux attentes du recruteur. Grâce à Keycoopt, les entreprises atteignent des collaborateurs potentiels qu’elles n’auraient pas identifiés via des outils classiques.

un aLgorithme pour op-timiSer La SéLection deS coopteurS

Afin d’accélérer son développe-ment, Keycoopt a signé en mai 2015, un contrat de collaboration avec l’équipe de recherche Magnet du centre Inria Lille - Nord Europe (commune avec l’Université Lille 3), spécialisée dans la définition de mé-thodes et de modèles de “ machine learning ”, ou encore “ apprentissage artificiel ”, au sein de réseaux d’in-formations. L’objectif de ce parte-nariat est d’automatiser le système de sélection des coopteurs, effectué jusqu’à présent de façon “ manuelle ” par les collaborateurs de Keycoopt. L’équipe de recherche a travaillé pour proposer un logiciel qui favo-rise le “ matching ” entre les don-nées non textuelles des annonces (catégories, secteurs, services, zones géographiques, métiers…) et les profils des coopteurs pour sélec-tionner ceux qui sont susceptibles de proposer les candidats les plus pertinents.

Le “ machine Learning ” au Service du “ croWd re-cruiting ”

Sur le modèle du financement par-ticipatif (crowdfunding), beaucoup d’entreprises font désormais appel au principe du “ crowd recruiting ”. Preuve de son efficacité, quelques grands noms comme L’Oréal, Orange ou Cartier ont été séduits par la so-lution de recrutement proposée par Keycoopt. Le nouveau logiciel fait intervenir le principe du “ machine learning ” qui permet d’obtenir une analyse prédictive à partir d’un grand nombre de données. “ Les prédictions sont plus pertinentes, elles correspondent davantage à la réalité. ”, souligne François Noyez, ingénieur dédié au transfert de technologie au sein du programme InriaTech. Livré en décembre 2015, le logiciel d’apprentissage automatique conçu pour Keycoopt pourrait être encore enrichi grâce à des parte-nariats dans les mois à venir. De nouvelles recherches pourraient encore affiner la pertinence des recommandations automatiques, par exemple en exploitant encore plus de données textuelles des coopteurs et des annonces. “ Il ne faut pas exploiter uniquement le fait de savoir si la personne a

KeycoopT eT inriAréinventent Le recrutementpar cooptation

// focus > machIne learnIng

Permettre aux entreprises de recruter des cadres par cooptation : c’est le concept de Keycoopt. Née en 2012, cette start-up lilloise a fait appel au savoir-faire d’Inria pour concevoir un outil logiciel afin d’automatiser et de renforcer la pertinence de cette méthode de recrutement.

ma

ch

ine

Le

ar

nin

g

Page 17: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

17 #03 juin 2016

finalement été embauchée ou non, mais également les raisons plus précises de cette décision, par le biais de commentaires formulés par les coopteurs et les consultants de Keycoopt. ”, ajoute Rémi Gilleron, chercheur au sein de Magnet. La plate-forme devrait permettre aux coopteurs de recevoir des annonces toujours plus en adéquation avec leur réseau professionnel et à Keycoopt de réduire la durée de la recherche des candidats.

machine Learning :Le recruteur de demain ?

Le machine learning au service de la recommandation constitue

une problématique de recherche et de développement nouvelle pour Inria, qui bénéficie des compé-tences technologiques apportées par le récent dispositif InriaTech. “ Scientifiquement, ce projet de recherche et développement nous donne l’opportunité d’explorer des méthodes nouvelles d’analyse de texte et de réseau ”, se réjouit Rémi Gilleron. Keycoopt, qui se positionne comme le TripAdvisor du recrutement, relève un nouveau défi qui s’inscrit dans la lignée des nouvelles entreprises de l’économie collaborative. “ Pour l’instant, il s’agit de remplacer le modèle du chasseur de tête par des méthodes collaboratives, pour lesquelles

l'apprentissage automatique peut aider à recommander, suggérer et choisir dans des espaces de solu-tions très grands ”, souligne Rémi Gilleron. “ Le but ici est d’émettre des propositions soumises à la va-lidation d’un expert métier. De mon point de vue, si la machine peut proposer des profils, la décision de recrutement reste de l'ordre de l'humain ”, conclut François Noyez.

º team.inria.fr/magnetº keycoopt.com

Page 18: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

18

// besT-of

> inria en pLeine expanSion À LiLLe

Au cœur de l’écosystème de la French Tech, Inria a fait l'acquisition d’un troisième bâtiment lillois localisé à EuraTechnologies, afin de développer son activité de recherche au service du transfert et de l’innovation. Le bâtiment, dont l’ouverture est prévue en 2018, accueillera des équipes de recherche centralisées sur le logiciel libre et les data.

> un mooc Sur Le Langage de programmation pharo

L’équipe-projet Rmod a participé à la conception d’un MOOC sur le langage

de programmation objet Pharo, dif-fusé sur la plate-forme FUN (France Université Numérique), de mai à juin. Plus de 2 750 personnes inscrites se sont formées en ligne à cette occasion.

> deux chaireS internationaLeS

Inria souhaite encourager les séjours longs de chercheurs internationaux éminents dans ses équipes et leur donner une plus grande visibilité, en définissant un programme de Chaires Internationales d’une durée de 12 mois répartis sur 5 ans. Le centre de recherche Inria Lille – Nord Europe accueille fièrement Marcelo M. Wanderley, professeur à l’Université de McGill (Canada) spécialisé en tech-nologie de la musique et Interaction Homme-Machine au sein de l’équipe Mjolnir, et Miguel F. Anjos, professeur à l’École Polytechnique de Montréal (Canada), spécialisé dans l’application de l’optimisation dans les smart grids, au sein de l’équipe Inocs.

> SignatureS accord - cadre

Le 3 mai dernier, l 'Institut Pasteur de Lille et Inria ont signé un accord-cadre de par-tenariat transdisciplinaire sur les sciences du numérique et la santé.

Le 19 mai, l’Université de Lille - Sciences et Technologies et Inria ont renouvelé leur partenariat scientifique en signant un ac-cord-cadre. Ce dernier officialise leur collaboration de longue date dans le domaine des sciences du numérique.

iL ne faLLait paS manquer... partenariatS

photo

Pour cette deuxième saison, R2D2 aime Inria Lille. Faites comme lui, dégainez votre badge et dites le sur Twitter avec le hashtag #ILoveInriaLille ou envoyez vos photos à º [email protected]

Page 19: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

IInriaLILLE

Sur tWitter...

19 #03 juin 2016

Page 20: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

20

Page 21: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

21 #03 juin 2016

Avec Christian Duriez , les robots deviennent plus vrais que nature. Ce chercheur Inria, responsable de l’équipe Defrost, est à la fois entouré de spécialistes de l’électronique, de la simulation numérique, d’ingé-

nieurs ou de créateurs de logiciels mais aussi de drôles de machines molles constituées de silicone ou de polymères élastiques. Sur les bureaux, ces prototypes de robots déformables sont soumis à rude épreuve pour tester leur résistance. Pour mieux connaître la matière qui les compose, ils sont étirés ou tractés par des câbles à longueur de journée. “ Notre objectif est par exemple de piloter la déformation du robot en calculant les charges qu’on lui applique. Nous utilisons l’impression 3D pour fabriquer des robots, afin de pouvoir valider nos modèles et vérifier qu’ils ne sont pas trop éloignés de la réalité ”.

Avec son équipe pluridisciplinaire, Christian Duriez travaille sur des robots qui dans le futur seront sans doute capables d’intervenir dans des domaines encore insoupçonnés aujourd’hui. Après avoir travaillé 10 ans sur la simulation chirurgicale, notamment sur le comportement mécanique des tissus anatomiques et leurs interactions avec les outils du chirurgien, il a choisi de faire un changement de cap dans sa

recherche. “ Pour ce nouveau sujet, nous pouvons profiter de notre savoir faire sur la simulation temps-réel des corps déformables mais aussi envisager des appli-cations nouvelles en robotique chirurgicale ”.

modéLiSer un robot Sur LogicieL

Cette nouvelle façon de concevoir les robots pourrait révolutionner le secteur dans les prochaines années. “ L’industrie reproche régulièrement aux robots d’être dangereux. Les modèles déformables le sont beau-coup moins. Ils peuvent s’adresser à des segments qui recherchent des robots moins chers à fabriquer, avec beaucoup de liberté de mouvement et capables de se faufiler dans des endroits très tortueux ”. Les robots déformables offrent donc de nouvelles perspectives aux industriels pour l’avenir et l’équipe Defrost poursuit ses recherches pour les modéliser et les piloter avec le plus de précision possible. “ Nous sommes la seule équipe au monde pour l’instant à pouvoir mo-déliser un robot sur logiciel. Nous aimerions que notre plate-forme devienne standard. Il faut pouvoir analyser un nombre de variables infiniment plus important que pour un robot rigide ”.

deS robotS incaSSabLeS

Alors que la recherche dans le domaine n’en est encore qu’à ses balbutiements, certains industriels commencent dé jà à prendre conscience du potentiel et des qualités du robot déformable. “ Il peut amortir la plupart des chocs. Fabriqué en silicone, il est incas-sable même dans les milieux les plus hostiles. Alors qu’un robot rigide est capable d’éviter les col-lisions, le robot déformable utilise les contacts avec l’environnement pour avancer, c’est une conception complètement différente ”.

Lors de la récente bourse aux technologies organisée à Paris, un évènement qui favorise les rencontres entre les chercheurs et le monde industriel, un prototype a été présenté par l’équipe Defrost. “ L’objectif était de concevoir un robot qui parle aux industriels pour commencer à réfléchir ensemble. Nous souhaitons pouvoir travailler sur des projets de recherche communs avec des entreprises qui pensent déjà à demain ”, conclut Christian Duriez.

porTrAiT \\

repouSSer LeS LimiteS de la robotique

Christian Duriez

Page 22: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

22

// rendez-vous

r&dv du pLateauChaque mois, de 9h à 10h30 ne manquez pas Les Rendez-vous du Plateau organisés sur le Plateau Inria situé à EuraTechnologies. Une équipe de recherche Inria vient à la rencontre des entreprises locales afin de soutenir le transfert de technologies vers l’écosystème régional. Au programme de ces rencontres : cloud computing, big data, interactions homme-machine, génie logiciel, machine learning… autant de sujets de recherche pointus qui vous seront exposés.

conférence de robotique

“ À La recherche de La performance induStrieLLeet SociaLe ”Jeudi 7 juillet 2016, salle de conférence, EuraTechnologies

50Jeudi 20 octobre 2016, Centre Inria Lille – Nord Europe

À l'aube des 50 ans d'Inria, le centre Inria Lille - Nord Europe vous invite jeudi 20 octobre à partir de 17h00 à célébrer le recrutement du cinquantième chercheur Inria à Lille qui sera l’occasion de faire un tour d’horizon de près de 15 ans d’innovations, d’avancées technologiques et de travaux de recherche dans les sciences du numérique au sein de l’Eurorégion.

rencontreS inria – induStrie

“ interaction avec LeS objetS et ServiceS numériqueS ”Vendredi 25 novembre 2016, Imaginarium de Tourcoing

retrouvez ceS évènementSet bien d’autreS danS L’agenda du centre !

º inria.fr/lille

À l’ère des nouvelles technologies, les robots s’immiscent dans notre quo-tidien et transforment les systèmes de production des PMEs et des grands groupes. Considérée comme une solution de performance et de compétitivité pour l’industrie, la robo-tisation soulève encore beaucoup de questions en termes d’intégration, de coût, de rentabilité et d’éthique. Des défis scientifiques et technolo-giques sont également au cœur de la robotique.

Venez rencontrer les acteurs de la région qui s’intéressent à ces pro-blématiques, des entreprises qui partageront leur expérience d’inté-gration de robots industriels dans leur activité, des chercheurs spécialisés en robotique qui vous présenteront les dernières avancées technolo-giques en la matière. Au programme : conférences et démonstrateurs !

Depuis une vingtaine d’années Inria organise des Rencontres Inria Industrie pendant lesquelles l'institut présente son offre de recherche et de trans-fert à destination des entreprises d’un secteur donné. Les objectifs de ces journées est de faire connaître les tra-vaux d'Inria et de mieux comprendre les besoins des industriels pour établir des liens entre les deux communautés qui pourront déboucher sur des pro-jets de collaboration et de transfert de

technologies. La journée est articulée autour de démonstrations s’appliquant au secteur considéré, réalisées par des équipes Inria et des PME issues/par-tenaires d’Inria, et complétée par des conférences thématiques.

Cet événement est organisé en par-tenariat avec la Plaine Images dans le cadre de la semaine de la Recherche et de l’Innovation des Hauts-de-France

º interaction.lille.inria.fr/rii

Page 23: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

23 #03 juin 2016

Parc scientifique de la Haute Borne40, avenue HalleyBât A - Park Plaza59650 VILLENEUVE D’ASCqFRANCE

(+33) 03 59 57 78 00 (+33) 03 59 57 78 50

º inria.fr/lille º [email protected] @Inria_Lille

Découvrez les coulisses du centreau travers de notre Tumblr Between Us !

º inrialille.tumblr.com

// centre de rechercheinria LiLLe - nord europe

// pLateau inria, euratechnoLogieSInria est présent au sein de l’écosystème EuraTechnologies d’innovation en TIC par un plateau de 200 m² unique en son genre. Il présente les travaux des équipes d’Inria. L’objectif est de favoriser les interactions entre la communauté scientifique, le monde économique et la société. Ainsi, un espace de travail collaboratif a été mis à disposition de l’ensemble des acteurs et un programme d’animation est mis en place tout au long de l’année.

Suivez les activités du Plateau sur Twitter @Plateau_Inria

conTAcT \\

Page 24: Lille by inria n°3 : Les données, matière première et source d'enjeux pour le numérique

InteractIonavec les objets et services numériques

en partenariat avec la Plaine images et organisé dans le cadre de la semaine de la recherche

et de l’innovation des Hauts-de-France

ImagInarIum, à Tourcoing

+ d’Infos : inTeracTion.lille.inria.fr/rii/

vendredi 25 novembre 2016