en 2016 : faire du seo face à une intelligence artificielle

21
UNE RÉVOLUTION SILENCIEUSE DANS LES ALGORITHMES DE GOOGLE LE SEO FACE A UNE INTELLIGENCE ARTIFICIELLE -1- PETIT DEJEUNER SEO SEARCH FORESIGHT 11 EME ÉDITION LILLE le 28 janvier 2016 9h-12h

Upload: search-foresight

Post on 15-Apr-2017

592 views

Category:

Internet


4 download

TRANSCRIPT

Page 1: En 2016 : Faire du SEO face à une intelligence artificielle

UNE RÉVOLUTION SILENCIEUSE DANS LES ALGORITHMES DE GOOGLE

LE SEO FACE A UNE INTELLIGENCE

ARTIFICIELLE

- 1 -

PETIT DEJEUNER SEO

SEARCH FORESIGHT

11EME

ÉDITION

LILLE le 28 janvier 2016

9h-12h

Page 2: En 2016 : Faire du SEO face à une intelligence artificielle

/ Et l’IA est maintenant au cœur de son algorithme

2

Google se met SERIEUSEMENT à l’IA

Page 3: En 2016 : Faire du SEO face à une intelligence artificielle

/ Les programmes utilisant de l’IA ne sont pas

forcément… intelligents au sens commun

- 3 -

« Intelligence Artificielle » est un faux ami

Définition de l’IA :

Au sens large, le domaine de

l’intelligence artificielle regroupe toutes

les techniques essayant de simuler les

capacités du cerveau humain dans un

programme informatique

Aujourd’hui, deux de ces capacités

ont engendré des applications

particulièrement prolifiques, au point

que souvent, les informaticiens

confondent « IA » et ces domaines

de l’informatique• Capacité de perception : réseaux de

neurones, deep learning et toutes les

variantes

• Capacité d’apprentissage automatique

Un programme basé sur de l’IA n’est

pas un programme qui

« comprend » au sens commun

Page 4: En 2016 : Faire du SEO face à une intelligence artificielle

- 4 -

Utiliser de l’IA dans un outil de recherche

est une vieille idée

Un exemple spectaculaire et ancien : YANDEX

Son architecture Matrixnet est basée sur de l’apprentissage

automatique

Page 5: En 2016 : Faire du SEO face à une intelligence artificielle

- 5 -

Matrixnet en action

Page 6: En 2016 : Faire du SEO face à une intelligence artificielle

- 6 -

Créer des filtres grâce à de

l’apprentissage automatique

Classifieurs : spam, ou non spam !

De gros progrès ont été obtenus au niveau performance :

SVM : support vector machines

Trouver la « formule » qui va prendre les mêmes décisions qu’un humain se

résume à un problème de géométrie mis en équations

Page 7: En 2016 : Faire du SEO face à une intelligence artificielle

- 7 -

Et pour la machine, le travail de

classification devient simple

Page 8: En 2016 : Faire du SEO face à une intelligence artificielle

/ la clé du mystère dans une interview de wired

- 8 -

Panda et l’apprentissage automatique

http://www.wired.com/2011/03/the-panda-that-hates-farms/all/

Wired.com: But how do you implement that algorithmically?

Cutts: I think you look for signals that recreate that same intuition, that same experience that you have as an engineer and that users have. Whenever we look at

the most blocked sites, it did match our intuition and experience, but the key is, you

also have your experience of the sorts of sites that are going to be adding value for

users versus not adding value for users. And we actually came up with a classifier to

say, okay, IRS or Wikipedia or New York Times is over on this side, and the low-quality

sites are over on this side. And you can really see mathematical reasons …

Singhal: You can imagine in a hyperspace a bunch of points, some points are red, some points are green, and in others there’s some mixture. Your job is to find a plane

which says that most things on this side of the place are red, and most of the things on

that side of the plane are the opposite of red.

Since the search engineers could not compute a signal for “would you trust this site

with your credit card” they had to look for other statistical measurements that would

correspond highly with the answers provided in the Quality Raters Survey.

Cela ne vous rappelle rien ?

Page 9: En 2016 : Faire du SEO face à une intelligence artificielle

- 9 -

Intégrer du machine learning dans l’algo?

Nous ne sommes pas les seuls à l’avoir compris : Le process décrit par Moz

Page 10: En 2016 : Faire du SEO face à une intelligence artificielle

- 10 -

Plus fort :

les réseaux de neurones dans l’algo

Les approches « classiques » ont atteint leurs limites

L’approche prometteuse : le « deep learning »

Page 11: En 2016 : Faire du SEO face à une intelligence artificielle

/ 2012 : Google brain

- 11 -

Google maîtrise le deep learning

Google brain est capable de reconnaître un chat dans l’image en bas à droite !

2015 : Google Deepmind bat le champion d’Europe de Go

Page 12: En 2016 : Faire du SEO face à une intelligence artificielle

- 12 -

L’analyse des textes permet d’associer

des termes à des vecteurs

Page 13: En 2016 : Faire du SEO face à une intelligence artificielle

/ Grâce aux vecteurs obtenus, on obtient des termes

proches par opérations simples entre vecteurs

- 13 -

Et… tada !

Page 14: En 2016 : Faire du SEO face à une intelligence artificielle

/ en place depuis début 2015

- 14 -

Application chez google : Rankbrain

En calculant une moyenne pour les vecteurs liés aux mots clés, on peut calculer

le vecteur d’une combinaison de mots clé : un syntagme, une phrase

Page 15: En 2016 : Faire du SEO face à une intelligence artificielle

/ l’ingénieur derrière l’implémentation de Rankbrain

- 15 -

Greg corrado

Page 16: En 2016 : Faire du SEO face à une intelligence artificielle

/ Premier niveau : expansion de requêtes

- 16 -

Word2vec est utilisé 2 fois dans l’algo

Si une requête rare est tapée, le requêteur essaie d’identifier une requête proche qui

elle est connue et offrira des résultats de meilleure qualité:

Exploitation de l’historique des sessions de requêtes sur la requête connue

Reconnaissance de l’intention derrière la requête connue

Page 17: En 2016 : Faire du SEO face à une intelligence artificielle

/ Deuxième niveau : calcul de similarité

- 17 -

Word2vec est utilisé 2 fois dans l’algo

La similarité avec la requête peut être calculée aussi bien qu’un cosinus de Salton.

Il semble que l’approche permette d’augmenter le rappel sans dégrader la précision

Les résultats sont améliorés par un score supplémentaire similaire dans son mode de

calcul au pagerank.

Page 18: En 2016 : Faire du SEO face à une intelligence artificielle

- 18 -

Encore une fois, adieu les mots clés

Indexation des concepts

Vecteurs Word2vec

Illustration : Brafton.com

Page 19: En 2016 : Faire du SEO face à une intelligence artificielle

- 19 -

Quelles conséquences pour le SEO ?

Les différentes couches de l’algorithme coexistent, les résultats sont obtenus en

combinant les approches

Les optimisations « à l’ancienne » n’ont pas complètement perdu leur intérêt à

date : l’algo classique reste dominant

Mais : les cas où une page remonte en tête du classement sur une requête alors

qu’elle semble ne pas être optimisée pour cette requête augmentent en

fréquence

Il faut donc se préparer à un nouveau paradigme de recherche, où pour bien se

classer, une page doit être avant tout une bonne réponse à la requête de

l’internaute, et même, un résultat en phase avec l’intention cachée derrière la

requête de l’internaute.

Page 20: En 2016 : Faire du SEO face à une intelligence artificielle

- 20 -

Pour en savoir plus

https://code.google.com/archive/p/word2vec/

https://scholar.google.com/citations?user=oBu8kMMAAAAJ

http://www.bloomberg.com/news/articles/2015-10-26/google-turning-its-

lucrative-web-search-over-to-ai-machines

http://research.google.com/pubs/GregCorrado.html

Page 21: En 2016 : Faire du SEO face à une intelligence artificielle

Merci !

- 21 -