analyse de logs - Études de cas et best practices - seo campus 2017
Embed Size (px)
TRANSCRIPT

1#seocamp
Julien Deneuville - Madeline Pinthon
Analyse de logsÉtudes de cas et best practices

2#seocamp
Qui sommes-nous ?
La partie autopromo

3#seocamp
Madeline Pinthon
Formation
2005 - 2010 / Audencia Nantes / Diplôme Grande Ecole
2009 / Udem (Universidad de Monterrey, Mexique)
6 ans d’expérience
2015 à ce jour : consultante SEO chez iProspect
2012-2015 : responsable seo technique chez MB Line
2011-2012 : chef de projet SEO chez MB Line
(Agriaffaires)
Site personnel
www.canyouseome.com
Consultante SEO chez iProspect

4#seocamp
Julien Deneuville
28 ans
Crée des sites web depuis 2004
SEO pro depuis 2011
@diije
clustaar.com/blog
Musique, Vélo
Consultant SEO chez Clustaar
SEO
DATA
TOOLS

5#seocamp
Pourquoi analyser les logs ?

6#seocamp
A quelles occasions ?
Pour les sites à forte
volumétrie
Pour suivre une
migration
Pour analyser des
anomalies
Pour préparer une
migration

7#seocamp
Crawl des robots
Quelles pages sont visitées ?
A quelle fréquence ?
Visites
Les données d’Analytics sont-elles fiables ?
Mes visiteurs rencontrent-ils des erreurs ?
Erreurs
Y a-t-il des erreurs sur mon site ?
Mon serveur tient-il la charge ?
Que s’attendre à trouver ?

8#seocamp
1
Audit ponctuel
2
Monitoring en
continu
Deux méthodes complémentaires

9#seocamp
Comment analyser les logs ?

10#seocamp
Les vérifications préalablesEvitez de perdre du temps
Si les chiffres ne sont pas cohérents, il y a un loup...
Vérifier le volume des données
Google Search Console donne une idée du volume des
logs GoogleBot.
Pages explorées par jour

11#seocamp
Les vérifications préalablesEvitez de perdre du temps
Il faut :
● L’URL réécrite (RIP IIS)
● Le code réponse HTTP
● Le User-agent
● L’IP du client (attention aux faux)
● Le referrer
● La date/heure
● ...
Vérifier l’intégrité des données
Ask your DSI
N’oubliez pas : les développeurs ne sont pas des sysadmin !

12#seocamp
Quels outils ?Google Search Console est ton ami mais il faut aller plus loin
Botify, onCrawl, Kelogs ...
SAAS
Splunk, Stack ELK, ...
Les DSI
Screaming Frog Log Analyzer
Logiciels
Grep, Awk, Sed,...
Linux

13#seocamp
Que regarder dans les logs ?

14#seocamp
Les codes réponsesOu status code, ou response code, ou rescode,..

15#seocamp
L’impact des 500Houston, on a un problème

16#seocamp
Quid des erreurs ?Mais t’es où ? pas là

17#seocamp
Les redirectionsPschiiit

18#seocamp
Catégoriser les pages

19#seocamp
Une approche techniquePar pattern
Raisonner en template de pages
● Pages produits
● Pages de listes
● Pages de contenus
● …
Idéalement avec un identifiant dans les URLs
● On utilisera généralement des Expressions Régulières
● http://www.example.com/nom-du-produit-1234.html
● http[s]?:\/\/www\.example\.com\/[a-z-]+-[0-9]+\.html

20#seocamp
Une approche marketingPar univers
● Raisonner en thématique
● Faciliter le croisement visite/logs
● Améliorer les conversions
Calquer sur le plan de taggage
Idéalement, elle reflète la structure du menu
● On utilisera plus les répertoires
○ musiques, CD, vinyles,...
○ jeux vidéos, consoles,....
○ films, dvd, blu-ray,....
Attention à ne pas rentrer trop dans le détail.

21#seocamp
Une approche SEOPar objectif
● Top tail
● Middle tail
● Long tail
Une possibilité de cibler selon les types de requêtes :

22#seocamp
Croiser logs et crawl

23#seocamp
Ce qu’on imagineJumeaux !
Google connaît votre site.
Votre site est entièrement crawlé.
Nous avons des images identiques (ou presque)

24#seocamp
Google connait une infime partie du siteOops

25#seocamp
Google en connaît bien plusIt’s bigger on the inside

26#seocamp
Google ne regarde pas au bon endroitwrong target

27#seocamp
Crawl, catégorisation et Logs
Ce que Google voit VS ce qui fait des visites

28#seocamp
Monitoring

29#seocamp
Fréquence de crawlEst-ce que tu viens pour les vacances ?

30#seocamp
ErreursTirer la sonnette d’alarme

31#seocamp
Etudes de cas

32#seocamp
De l’importance du temps de chargementharder, better, faster, stronger

33#seocamp
De l’importance de la structure

34#seocamp
Les joies des paramètres d’urlJusqu’ici tout va bien
Jusqu’ici, tout va bien...puis un jour, Google décide d’explorer certaines parties du site.
Attention, il ne faut pas (forcément) accuser les dev, c’est parfois Google qui change, pas
votre site
Parfois, Google est curieux

35#seocamp
Un exemple de crise 1/
On observe une baisse du crawl.
Dans l’’analyse de la recherche, on observe une forte baisse
des impressions, pour une position moyenne stable.
Il semble qu’il y ait une baisse du nombre de contenus
indexés.
1ere alerte : Search Console

36#seocamp
Un exemple de crise 2/
En fouillant un peu plus, on osberve effectivement de
l’instabilité sur certaines pages...ou même une disparition
complète.
1ere alerte : Search Console

37#seocamp
Un exemple de crise : 3/De l’importance des pages actives
visites SEO
pages actives
Crawl, par
univers
Les visites SEO : pas d’impact flagrant.
Autre indicateur : pages actives, légères baisse du nombre de
pages.
3e indicateur : le crawl, par univers… on oserve des variations
mais rien de flagrant; à part quelques éléments.
2e étape : analyse de logs

38#seocamp
1 2 3 4 5
visites
SEO
pages
actives
Crawl,
par
template
Par catégorie de pages, on voit un gros impact négatif…sur les
visites, les pages actives et le crawl.
1. une hausse du nb de pages crawlées par google
2. Une baisse progressive du nb de pages actives
3. une chute drastique des visites sur un type de page
4. Des actions correctives mises en place, hausse du
nombre de pages crawlées
5. retour des pages actives et des visites
Une recatégorisation technique
Un exemple de crise : 4/Une recatégorisation, technique

39#seocamp
Un exemple de crise : 5/Les conclusions
Google Search Console donne des premières indications
Attention aux anomalies de crawl
Le nombre de pages actives est un bon indicateur
Un site peut disparaître du jour au lendemain, rétablir un site prend du
temps.

40#seocamp
Going furtherSEO Hero
Ajoutez des informations dans vos logs
● Temps de génération des pages
● Dernière visite
● Serveur utilisé
● ...
Croisez d’autres données
● Analytics, Search Console
● Visibilité, tendances de recherche
● Stocks et données business

41#seocamp
Des questions ?Qui veut gagner un mug ?
Merci !

42#seocamp
Quel est le user-agent du robot de Qwant ?
Madeline Pinthon
Consultante SEO chez iProspect
@razbithume
www.iprospect.com/fr/fr/le-blog/
www.canyouseome.com
Julien Deneuville
Consultant SEO chez Clustaar
@diije
clustaar.com/blog