seo campus 2016 oncrawl open source log analysis

Download SEO Campus 2016 Oncrawl Open Source Log Analysis

If you can't read please download the document

Upload: cogniteev

Post on 16-Apr-2017

2.523 views

Category:

Data & Analytics


2 download

TRANSCRIPT

PowerPoint Presentation

Lanalyse de logs pour tous et gratuitementPar @FrancoisGoube, fondateur @Oncrawl

#seocamp+10 years SEO experienceSerial entrepreneurBusiness AngelMembre du CA SeoCampAdministrateur Frenchtech

Je vous aide A retenir limportant#LogsOnCrawl

Au programmePourquoi faire de lanalyse de logs et surtout pour qui ?Quelles donnes et quels outils pour bien dmarrer lanalyse de logs ?Comment avoir mon propre analyseur de logs sans dbourser un centime ?Etude de casEntrez dans la matrice et voir plus loin que les logs et le crawl.(Jeu et Q&A)

@OnCrawl SEOCAMP 2016

Logs Serveur : Kezako ?

ServeursInternet

@OnCrawl SEOCAMP 2016

A quoi ressemblent des logs ?Un serveur web enregistre toutes les requtes quil reoit. Ce sont les logs serveurs

En gnral:/var/log/httpd sous apache

Ils permettent :Didentifier le trafic SEODe voir ce que fait le GoogleBot

@OnCrawl SEOCAMP 2016

Pour qui ?Pour tous !!!Audit : Diagnostic des pages utiles / inutilesZones que Google crawleZones que Google ne connait pasMonitoring :AlertesSuivi des mise en productions / OptimisationsAttaques

@OnCrawl SEOCAMP 2016

Bien dmarrer sur lanalyse de logsSavoir o sont vos logs et comment y accderSassurer davoir lensemble des logsProcder des tests de compltude et de validit des donnes :Compter les hits de Google et comparer avec la search console

Compter les visites depuis Google et comparer avec Analytics

Attention aux systmes de cache !!!-$ grep Googlebot access.log | wc -l-$ grep google.fr access.log | wc -l

@OnCrawl SEOCAMP 2016

Pourquoi utiliser ses logs ?Know what Google did!Quelles pages sont crawles par Google BotQuelles sont mes pages actives ?Google rencontre-t-il des erreurs ?

Car Google cherche optimiser ses ressources de crawl

Optimisez les ressources de Google vers vos MONEY PAGES

@OnCrawl SEOCAMP 2016

Pourquoi utiliser ses logs ?Savoir ce que Google fait

Pour comprendre limpact SEO

@OnCrawl SEOCAMP 2016

Ne pas attendre un message dans GWTSuivez les status codes en temps relRecevez des alertesContrlez vos MEP

Alertes utiles :Augmentation anormale des 404Baisse du nombre de pages recevant du Trafic SEO

@OnCrawl SEOCAMP 2016

Savoir ce que Google Crawl et PositionneMoins vos pages sont populaires et moins Google les regarde

@OnCrawl SEOCAMP 2016

Quelles pages ont le plus de valeur pour Google ?Dcouvrez vos pages Actives

@OnCrawl SEOCAMP 2016

Quelles pages ont le plus de valeur pour Google ?Google ninterprte pas forcment votre site comme vous le voudriez !

@OnCrawl SEOCAMP 2016

La cl est dans le croisement des donnesA partir des donnes de crawlControl du balisage HTMLQualit des metaAnalyse du contenu (near duplicates, nb de mots)Popularit des pages (Inrank) et des donnes de logs

Vous ouvrez la boite noire de lalgo de Google!Pages orphelinesPages actives / familleZones inconnues de GoogleImpact de vos optimisations sur le GoogleBot

@OnCrawl SEOCAMP 2016

Quels outilsOutils Open SourceKibana Kibana by OncrawlLogalizeGraylogOutils SaaSOncrawl AdvancedLogs.ioKelo.gsQboxAvailable on Github

@OnCrawl SEOCAMP 2016

Et Moi ? Comment fabriquer son Analyseur de logs gratuitement ?

www.oncrawl.com

Les indicateurs de baseNombre de pages uniques crawles par GoogleFrquence de crawl par groupe de pagesMonitoring des status codes (200, 3xx, 4xx,)Nombre de pages actives / inactives

Accrochez vos ceintures !!!

@OnCrawl SEOCAMP 2016

Prenons le cas dun site heberg en MutualisHypothse :Vous avez un site heberg chez OVH Vous avez bien paramtr vos logs pour quils soient distincts par hostNous allons voir Comment rcuprer les fichiers de logs depuis OVH,Crer une machine virtuelle sur votre poste et utiliser Docker,Dployer Oncrawl ELK,Ingrer les logsUtiliser Oncrawl ELK pour analyser vos logs.

@OnCrawl SEOCAMP 2016

Fetch the logs!Ouvrez un navigateur webLoguez vous sur OVHA partir de lOVH Web console, cliquez sur hbergement et sur le nom de domaine que vous souhaitez analyserAccdez vos logs depuis le lien http://logs.ovh.net/YOURDOMAIN/Choisissez une priode dun mois https://logs.ovh.net/YOURDOMAIN/logs-MM-YYYY/Tlchargez chaque journe de logs(e.g. https://logs.ovh.net/YOURDOMAIN/logs-MM-YYYY/YOURDOMAIN-DD-MM-YYYY.log.gz)

@OnCrawl SEOCAMP 2016

Prparez vos logsControlons ce que nous rcuprons dOVH

Nous permet de renommer lensemble des fichiers en .log

Nous permet de lire les 10 premires lignes de logs pour contrle

@OnCrawl SEOCAMP 2016

Utilisons Docker ComposeSetup de Docker

Rcupration des containers Tlchargez OnCrawl ELK, et Dzippez le sur votre machineDans un terminal tapez : Si vous navez jamais utilis Docker, tlcharger ceci :https://www.docker.com/products/docker-toolbox, Et installez Docker Toolbox Suivez ce tutoriel : https://docs.docker.com/mac/step_one/

@OnCrawl SEOCAMP 2016

Up and Running?Si tout va bien, vous devriez avoir ceci

Vous navez plus qu copier les logs rcuprs :

cp path/clean/and/filtered/log/files/my-virtual-host-*.log path/to/oncrawl-elk/logs/apache/

Logstash devrait faire tourner le container oncrawlelk_logstash_1 container, Parser vos logs et les envoyer oncrawlelk_elsaticsearch_1 container.

@OnCrawl SEOCAMP 2016

RDV sur http://localhost:9000

@OnCrawl SEOCAMP 2016

Etude de cas : Exemple de 5 usagesSuivi de la sant de mon siteEtat des lieux de ma structure de siteDtection des problmes de maillage interneImpact SEO de mon contenuTemps de chargement, status codes et Googlebot

@OnCrawl SEOCAMP 2016

Voir plus loin que les logsDtecter des tendances BotsUsersRajouter des donnes businessCA / Panier moyenRevenus pubPenser votre business et vos donnes en remontant de la vente au first click.

@OnCrawl SEOCAMP 2016

www.oncrawl.com

2 mois Pro GratuitsCode : SEOCAMP16MERCI

www.oncrawl.com

3 questionsQuelles sont les deux tests raliser pour sassurer de bien dmarrer avec ses logs ?

Oncrawl Open source log analyzer est un fork de Elastic Search, Logstache et ?

Comment sappelle ce personnage ?

@OnCrawl SEOCAMP 2016

1. CrawlNos robots parcourent votre site comme Google peut le faire et nous rcuprons tout votre code HTML et lensemble des donnes SEO de votre site web. Dcouvrez comment Google interprte votre site web

Votre contact:

[email protected]+33 652 19 97 57

Follow us :