google-comment optimisez vos contenus

Upload: jdetoisien

Post on 30-May-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    1/13

    Optimisezvos

    contenusGuide pour des diteurs de sites web

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    2/13

    1

    Sommaire

    Introduction 2

    Rapide prsentation de la recherche Web 3

    Nouveauts Google en matire de recherche Web 4

    Google peut-il trouver votre site ? 5

    Google peut-il indexer votre site ? 6

    Contrle des lments indexs par Google 7

    Fichier Robots.txt ou balises Mta ? 9

    Contrle des lments en mmoire cache et des extraits de texte 10

    Le contenu de votre site est-il unique et pertinent ? 11

    Rendre votre site plus visible : les meilleures pratiques 12

    Centre pour les webmasters 13

    Protocole Sitemaps 14

    Foire aux questions (FAQ) 15

    Glossaire 19

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    3/13

    2 3

    Introduction

    Si vous cherchez vous aire connatre, Internet est loutil quil vous aut. Si vousen doutez, il vous sut dinterroger un annonceur qui a russi augmenter sesventes grce la publicit en ligne, un blogueur qui a dcroch un contrat avecun diteur grce sa popularit sur le Web ou un directeur dont le journal touchedsormais un public international grce Internet.

    Nous recevons rquemment de nombreuses questions portant sur la maniredont onctionnent les moteurs de recherche Web, ainsi que sur la aon dont lesditeurs Web peuvent optimiser leur prsence sur Internet.

    Ce petit guide vous aidera mieux comprendre comment les moteurs derecherche peroivent votre contenu. Vous apprendrez adapter ce dernierpour que les internautes trouvent acilement les inormations que vous dsirezcommuniquer, sans quils puissent touteois accder celles que vous nesouhaitez pas diuser.

    Ce petit guide, qui contient des conseils destins aux administrateurs de sitesWeb, des inormations sur des outils en ligne, ainsi quune oire aux questionstape par tape, est conu aussi bien pour les petits diteurs de sites Web quepour les propritaires de grands sites.

    A linstar dInternet qui a connu une volution ulgurante au cours de la derniredcennie, lapproche de Google en matire de recherche Web et ses relations avecles propritaires de sites Web ont connu dimportantes transormations. Nousavons mis au point de nombreux outils qui permettent aux administrateurs de sites

    Web doptimiser la visibilit de leur contenu et de mieux contrler les modalitsdindexation de leurs pages Web. Mais le mieux nest pas toujours lennemi dubien. Nhsitez pas nous aire part de vos commentaires sur ce guide et de vosides et suggestions damlioration. Nous mettons tout en oeuvre pour que le Webdevienne un outil encore plus convivial, aussi bien pour les internautes que pourles diteurs de sites Web.

    - Lquipe Google Webmaster

    Rapide prsentation de la recherche Web :

    fonctionnement

    En termes simples, on peut dire que le Web sapparente un gigantesque livre dont lindextout aussi imposant vous indique avec prcision o trouver ce que vous cherchez.

    Google dispose dun groupe dordinateurs nomm Googlebot qui explore en permanencedes milliards de pages Web. Ce processus dexploration (le crawling, en anglais) estalgorithmique. Cela signie que des programmes inormatiques dterminent quels sitesexplorer, quelle rquence et combien de pages rcuprer pour chacun de ces sites.Google naccepte pas de paiement pour quun site soit explor plus rquemment, et lesactivits lies au moteur de recherche sont totalement spares de notre service AdWords,

    qui lui, est source de revenus.Il existe cependant des moyens gratuits et simples pouroptimiser la rquence de rrencement de son site, notamment le protocole Sitemaps(voir page 14).

    Notre groupe dordinateurs commence son processus dexploration en parcourant une listedadresses URL de pages Web. Cette exploration permet aux robots Googlebot de dtectersur chacune de ces pages dventuels liens quils ajoutent ensuite la liste des pages parcourir. Les robots Googlebot ont galement une copie de chaque page explore pourcompiler ensuite tous les mots rencontrs et crer ainsi un large index. Cette liste indiquegalement lemplacement exact de chaque mot sur chaque page.

    Lorsquun utilisateur saisit une requte, nos moteurs de recherche parcourent cet indexan de trouver les pages correspondantes, puis achent les rsultats les plus pertinents.Le taux de pertinence est dtermin selon plus de 200 critres, parmi lesquels le scorePageRank de chacune des pages. Ce dernier value limportance dune page en onctiondes liens sur les autres pages Web renvoyant ladite page. En dautres termes, le scorePageRank dune page augmente chaque ois quune autre page renvoie celle-ci.

    3

    Avant la recherche

    Lors de la recherche

    Exploratioin du web Calcul du classementPageRank

    Envol des requtes

    Consulationde lindex

    Achage des rsultat Classement des rsultats Slection des documents

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    4/13

    4 5

    Google peut-il trouver votre site?

    Le rrencement de votre site Web dans les rsultats dune recherche Google estgratuit et ne ncessite pas daction pralable de votre part. En ait, la grande majoritdes sites rpertoris dans nos rsultats ne sont pas soumis manuellement, maistrouvs et ajouts automatiquement par les robots Googlebot qui explorent le Web.

    Bien que Google explore des milliards de pages, lomission de certains sites resteinvitable. Ce genre domission se produit le plus souvent pour lune des raisonssuivantes :

    Les sites omis sont peu lis aux autres sites du Web en raison dune insufsancede liens ;

    les sites omis ont t mis en ligne aprs la toute dernire exploration effectuepar les robots Googlebot ;

    les sites omis taient momentanment indisponibles lors de lexploration ounous avons reu un message derreur tandis que nous tentions de les explorer.

    Les outils Google destins aux administrateurs de sites Web, tels que le protocoleSitemaps par exemple, peuvent vous aider savoir si votre site est actuellementrrenc dans lindex de Google ou si nous recevons des messages derreur lorsquenous tentons de lexplorer (voir page 14). Vous pouvez galement utiliser ces outilspour ajouter manuellement ladresse URL de votre site lindex de Google ou nousournir un plan Sitemap de votre site an que nous disposions dun meilleur aperude son contenu. Ce plan nous aidera extraire le nouveau contenu et les nouvellessections de votre site.

    Nouveauts Google en matire de recherche Web

    Bien quen matire de recherche Web les grands principes demeurent, Google chercheen permanence amliorer ses rsultats de recherche.

    Quelle dirence existe-t-il par rapport la recherche Web, telle quelle tait pratique ily a cinq ans ? Tout dabord, elle est bien plus rapide.

    En outre, nos systmes dexploration et dindexation sont bien plus intelligentsquauparavant. Nos robots parcourent dsormais en continu les pages Web et planientleur visite de manire plus ecace an doptimiser lactualisation des rsultats. Cettenouvelle approche prend en compte le ait quun journal en ligne ncessite des visitesplus rquentes quun site Web statique dont le contenu nest mis jour quune oispar mois par exemple. En ait, grce aux outils disponibles sdans le Centre pour les

    webmasters, les administrateurs de sites Web peuvent prsent dcider de la rquencedexploration de leurs sites par nos robots. Dans lensemble, ces amliorations permettentla cration dun index mieux actualis et exhausti.

    Si aujourdhui la recherche Web est plus rapide et plus ecace que jamais, les acteursjouant un rle dterminant dans la visibilit des sites Web ont toujours t notre prioritet ce ds le lancement de notre moteur de recherch:

    Google peut-il trouver votre site ? (page 5)

    Google peut-il indexer votre site ? (page 6)

    Le contenu de votre site est-il unique et pertinent ? (page 11)

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    5/13

    6 7

    napparat pas dans les rsultats de recherche Google, assurez-vous que les donnes duchier robots.txt ou quune balise Mta ne bloquent pas laccs de votre contenu nosrobots dexploration.

    Contrle des lments indexs par Google

    Chaque diteur Web cherche atteindre un objecti dirent sur Internet. Certainsditeurs de journaux choisissent par exemple de permettre leurs lecteurs daccdergratuitement leurs articles les plus rcents, mais de rendre payant laccs leursarchives. Certains souhaitent que leur site apparaisse dans toutes les catgories dunmoteur de recherche (par exemple sur Google Mobile, Google Images, etc.), tandis quedautres prrent quil gure uniquement dans les rsultats de recherche Web.

    Il est important que les moteurs de recherche respectent les souhaits des diteurs,puisquil sagit de leur contenu. Touteois, nous ne sommes pas devins ! Il est donccrucial que les administrateurs de sites Web nous communiquent la manire dont ilssouhaitent que leurs contenus soient indexs. Pour ce aire, il est possible de aire appelau protocole dexclusion des robots. Il sagit dune norme technique prouve qui indiqueaux moteurs de recherche quels sites ou parties de site doivent ou non apparatre dans lesrsultats de recherche.

    Robots.txt: contrle lchelle du site

    Au cur du protocole dexclusion des robots se trouve un simple chier texte dnommrobots.txt, devenu la norme du secteur depuis de nombreuses annes. Le chier robots.txtvous permet de contrler laccs au contenu de votre site plusieurs niveaux : intgralitde votre site, rpertoires individuels, pages dun type spcique ou mme pagesindividuelles.

    Sur mon site, il y a certaines pages que je ne souhaite pas voir indexes dans Google.Que dois-je aire pour empcher que ces pages ne sachent dans les rsultats derecherche de Google ?

    En gnral, la plupart des propritaires de sites souhaitent que Googlebot puisse accder leur contenu an que leurs pages Web sachent dans les rsultats de recherche deGoogle. Cependant, il peut arriver que vous ne souhaitiez pas que certaines de vos pagessoient indexes. Il peut sagir, par exemple, de pages accessibles uniquement contrepaiement (ou de registres (logs) de connexions).

    Vous pouvez exclure ces pages de lindex de Google en crant un chier robots.txt que vousenregistrez dans le rpertoire racine de votre serveur Web. Ce chier robots.txt vous permetalors de rpertorier les pages que les moteurs de recherche ne doivent pas indexer. Lacration robots.txt dun tel chier est un jeu denant et permet aux diteurs Web de contrlertrs prcisment la manire dont les moteurs de recherche accdent leurs sites Web.

    Par exemple, si un administrateur de sites Web ne souhaite pas que ses registres (logs)de connexions internes soient indexs, son chier robots.txt doit contenir les inormationssuivantes :

    Google peut-il indexer votre site?

    De temps autre, les administrateurs de sites Web saperoivent que leurs sitesnapparaissent pas dans nos rsultats de recherche. Il peut sagir dun problmedindexabilit. Ce terme dsigne la possibilit pour les robots Googlebot de aire ou nonune copie des pages Web en question an de linclure dans nos rsultats de recherche.

    Structure et Contenu

    Limpossibilit dinclure des pages Web dans nos rsultats de recherche est souvent due leur structure et leur contenu. Par exemple, une page Web sur laquelle les utilisateursdoivent renseigner les champs dun ormulaire peut ne pas tre indexable par Google.De mme, les moteurs de recherche peuvent avoir des dicults indexer une pagecontenant des donnes dynamiques (Flash, JavaScript, cadres et adresses URL gnres

    dynamiquement). Pour vous assurer que votre site ne connat pas ce problme, essayezde lacher laide dun navigateur texte tel que Lynx, ou de tout autre navigateur aprsavoir dsactiv loption permettant dacher les images, les contenus Javascript et Flash.Vous verrez alors si tout le contenu de votre site est eectivement accessible.

    Si votre site contient un grand nombre dimages, assurez-vous que le texte ou leslgendes y aisant rrence dcrivent de manire prcise leur contenu. Cela permet nonseulement aux moteurs de recherche dindexer correctement vos images, mais aussi deles rendre accessibles aux internautes malvoyants. Vous pouvez galement utiliser laonction alt text pour vos images et attribuer leur chier des noms descriptis commedans lexemple ci-dessous (il sagit dune image correspondant au logo dune socitdnomme La cuisine de Vronique) :

    Les adresses URL

    Un autre obstacle lindexation de votre site peut tre son adresse URL. Si ladresse URLde votre site contient plusieurs paramtres ou comprend des identiants de session ou sicette adresse renvoie automatiquement plusieurs autres adresses successives, Google

    peut ne pas tre mesure de lindexer.

    Serveur et rseau

    Des problmes de serveur ou de rseau peuvent galement nous empcher daccder certaines pages de votre site. Grce aux outils du Centre pour les webmasters dveloppspar Google, les diteurs de sites Web peuvent dsormais voir une liste des pages Webauxquelles les robots Googlebot ne peuvent pas accder. Pour en savoir plus sur les outilsdu Centre pour les webmasters, voir page 13.

    Protocole dexclusion des robots

    Il peut arriver que certaines pages soient bloques par le protocole dexclusion des robots.Il sagit dune norme technique qui permet aux diteurs Web dindiquer aux moteurs derecherche de ne pas indexer le contenu de leur site (voir ci-dessous). Si votre site Web

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    6/13

    8 9

    Fichier Robots.txt ou balises Mta ?

    En gnral, le chier robots.txt constitue une solution ecace pour contrler lensembledes pages dun site. Les balises Mta permettent quant elles de dnir des rglesdaccs spciques pour chacune des pages de ce site. Elles sont particulirement utilessi vous tes autoris modier des chiers distincts du site mais pas lintgralit de cedernier. Elles vous permettent galement de spcier des rgles de contrle daccscomplexes distinctes pour chacune des pages de votre site.

    Parois, lune ou lautre de ces solutions peut vous permettre de rgler le mme problme.

    Que dois-je aire pour massurer que le texte dune page est index, mais pas lesimages quelle contient ?

    Vous pouvez bloquer laccs aux images de cette page en spciant leur extension dans

    le chier robots.txt. La prsence des lignes suivantes dans un chier robots.txt indique Google de ne pas indexer les chiers ayant pour extension *.jpg ou *.jpeg :

    User-agent: Googlebot

    Disallow: /*.jpg$

    Disallow: /*.jpeg$

    Si votre systme de gestion de contenu stocke les images dans un rpertoire distinct,vous pouvez galement exclure du processus dindexation la totalit de ce rpertoire. Sivos images sont stockes dans un rpertoire dnomm images, vous pouvez exclure cerpertoire du processus dindexation de tous les moteurs de recherche en spciant leslignes suivantes :

    User-agent: *

    Disallow: /images/

    Vous pouvez aussi ajouter la balise Mta NOINDEX chaque chier comportant uneimage. Toutes ces solutions vous permettent dempcher que vos images ne soientindexes. Lutilisation de lune ou lautre dpend de la quantit dimages et des images

    que vous souhaitez exclure du processus dindexation.

    User-Agent: Googlebot: la ligne User-Agent (Agent-utilisateur) indique que lasection suivante contient un ensemble dinstructions destin uniquement aux robotsGooglebot.

    Disallow: /logs/: La ligne Disallow (Interdire) indique aux robots Googlebotquils ne doivent pas accder aux chiers situs dans le sous-rpertoire contenant lesregistres de connexions de votre site.

    Le propritaire du site a ainsi clairement indiqu quaucune des pages contenues dans lerpertoire des journaux de consignation ne devaient gurer dans les rsultats de recherchede Google.

    Tous les principaux moteurs de recherche liront et respecteront les instructions dniesdans votre chier robots.txt. Si vous le souhaitez, vous pouvez galement dnir des rglesspciques pour chaque moteur de recherche.

    Balises Mta : contrle afnOutre le chier robots.txt qui vous permet de dnir de manire concise des instructionspour un grand nombre de chiers de votre site Web, vous pouvez galement utiliser lesbalises Mta an de contrler individuellement chaque page de votre site. Pour ce aire,il vous sut dajouter des balises Mta au code HTML de la page Web souhaite an decontrler les modalits dindexation de cette page. Grce leur fexibilit, le chier robots.txt et les balises Mta vous permettent de spcier des rgles complexes daccs demanire relativement acile.

    Jai sur mon site un article dactualit accessible uniquement aux utilisateurs inscrits.Que dois-je aire pour que cet article ne gure pas dans les rsultats de recherche deGoogle ?

    Pour ce aire, il vous sut dajouter une balise Mta NOINDEX dans la premire section de cet article. Voici comment se prsente linsertion de cette balise dans le codeHTML :

    [...]

    Linsertion de cette balise Mta empche alors que Google nindexe votre chier.

    Cependant, noubliez pas quil peut arriver que vous souhaitiez que Google indexe cetype de page, par exemple la page dun journal archiv accessible en ligne aprspaiement. Tandis que Google nachera pas ce type de contenu dans ses rsultats derecherche, certains services de Google, tels que News Archive Search, lindexeront enindiquant clairement aux internautes que laccs ce contenu est payant. Pour savoircomment permettre lindexation sur certains services uniquement, consultez la Foire auxQuestions (FAQ).

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    7/13

    10 11

    Pour que le lien En cache napparaisse plus dans les rsultats de recherche, lepropritaire de ce site dinormations peut insrer une balise NOARCHIVE dans la pageen question :

    De la mme aon, pour que les rsultats de recherche nachent plus dextrait de texte,il vous sut dinsrer une balise NOSNIPPET :

    Remarque : lajout dune balise NOSNIPPET empche galement lachage dun lien enmmoire cache. Par consquent, lajout de la balise NOSNIPPET dispense de linsertiondune balise NOARCHIVE.

    Le contenu de votre site est-il unique et pertinent ?

    Une ois votre site repr et index, la question que vous devez vous poser est la suivante :le contenu de mes pages Web est-il unique et pertinent ?

    Jetez dabord un coup dil votre texte dans son ensemble. Vos titres et liens textuelsont-ils un caractre descripti ? Votre texte se lit-il acilement, est-il clair et intuiti ?

    De mme quun livre est dcoup en chapitres distincts traitant chacun dun thmespcique, les pages Web de votre site doivent chacune tre consacres un sujetparticulier. Mots cls et expressions ressortent naturellement de ce genre de pages. Enoutre, les internautes resteront plus srement sur une page Web orant un contenu et desliens pertinents.

    Touteois, assurez-vous dutiliser des expressions que les internautes sont eux-mmessusceptibles dutiliser dans de leur recherche. Par exemple, si votre site est celui dun clubde passionns de MG, assurez-vous que les termes voitures et MG apparaissent survos pages. Des termes tels que voitures britanniques ne sont pas susamment prcis.

    Contrle des lments en mmoire cache et des extraits de texte

    Les rsultats de recherche contiennent gnralement un lien En cache, ainsi quun courtextrait de texte (snippet, en anglais). Voici, par exemple, lun des premiers rsultats quisachent lorsquon lance une recherche sur canard colvert :

    Extrait : il sagit dun court extrait de texte provenant de la page Web.

    Lien En cache : il sagit du lien qui renvoie les utilisateurs une copie de la page indexe et stocke sur lun des serveurs de Google.

    quoi servent les extraits de texte ? Les internautes visiteront plus srement un site Websi les rsultats de recherche contiennent un extrait de texte issu des pages de ce site. Cesextraits permettent en eet de voir acilement si les rsultats sont pertinents ou non parrapport la requte saisie. Lorsquil leur est impossible de dterminer rapidement si unrsultat est pertinent ou non, les internautes passent habituellement un autre rsultat.

    quoi servent les liens En cache ? Les liens En cache sont utiles dans un grandnombre de cas, notamment lorsque les sites auxquels ils renvoient sont momentanmentindisponibles, lorsque les sites dinormations arrivent saturation aprs la survenuedvnements majeurs ou lorsque des sites sont supprims par inadvertance. Cescopies en mmoire cache orent galement un autre avantage, puisquelles mettenten surbrillance les mots recherchs par internautes lui permettant ainsi de rapidementvaluer le degr de pertinence des pages proposes.

    La plupart des diteurs Web souhaitent que Google ache les deux. Cependant, il arriveque les propritaires de site prrent que lune ou les deux options soient dsactives.

    Le contenu de mon journal change plusieurs ois par jour. Les robots Googlebot nesemblent pas indexer ce contenu aussi rapidement que nous le mettons jour et lelien En cache renvoie une page qui nest plus dactualit. Que dois-je aire pourque Google ne gnre plus de lien En cache ?

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    8/13

    12 13

    Rendre votre site plus visible : les meilleures pratiques

    Les propritaires de site nous demandent souvent quelles sont les meilleures solutions leur disposition pour amliorer la visibilit et le classement de leur site dans nos rsultatsde recherche. Notre rponse est simple : Mettez-vous la place des internautes. Cestdailleurs ce que nous essayons nous-mmes de aire.

    Quest-ce que cela signie dans la pratique ? Tout dabord, assurez-vous de communiqueraux visiteurs les inormations quils recherchent. La pertinence des inormations est eneet llment dterminant lorsquil sagit dattirer et de retenir lattention dun nombrecroissant dinternautes.

    De nombreux propritaires de site sont obsds par le classement PageRank de leurspages Web respectives. Mais noubliez pas quen plus de ce dernier, plus de 200 autres

    critres entrent en ligne de compte lors du classement de votre site Web. Par consquent,concentrez-vous sur la qualit de votre contenu et son accessibilit, plutt que dessayerde trouver des solutions pour ruser avec lalgorithme des moteurs de recherche. Si un sitene respecte pas nos directives en matire de qualit, son indexation peut tre bloque.

    Ce quil faut faire :

    1. Crez un contenu pertinent et accrocheur : les visiteurs accdent vos pages viadirents liens. Par consquent, assurez-vous que chaque page est susceptible deretenir leur attention.

    2. Impliquez les internautes : vous pouvez peut-tre ajouter une section Commentairesou un blog votre site. Crer une communaut contribuera drainer des passages plusrquents vers votre site. Impliquer vos visiteurs est une aon daccrotre leur dlit etdamliorer la visibilit de votre site.

    3. Surveillez votre site : utilisez le Centre pour les webmasters (voir page 13) an desavoir quelles requtes conduisent les visiteurs votre site ou pour connatre lvolutionde votre classement dans les rsultats de recherche suite dimportantes modicationsque vous aurez apportes.

    4. Visez obtenir des liens entrants de la part de sites de haute qualit.

    5. Fournissez des liens textuels clairs : choisissez avec soin lemplacement des vos lienstextuels sur votre site et assurez-vous quils contiennent les termes correspondantexactement la rubrique ou la page laquelle ils renvoient.

    Ce quil faut viter :

    1. Nencombrez pas vos pages Web avec des listes de mots cls.

    2. Nessayez pas de dissimuler vos pages en rdigeant du texte visible uniquement parles moteurs de recherche et non par les utilisateurs.

    3. Ne crez pas des pages et des liens destins uniquement induire en erreur les robotsdexploration et les moteurs de recherche.

    4. Nachez pas les noms, liens ou contenus importants sous orme dimages. Noubliezpas que les moteurs de recherche ne peuvent pas en lire le contenu.

    5. Ne crez pas plusieurs copies dune mme page sous dirents adresses URL dans lebut dinduire en erreur les moteurs de recherche.

    En cas de doute, consultez nos directives destines aux administrateurs de sites Webdisponibles ladresse suivante : google.fr/webmasters/guidelines.html

    Outils Webmaster Central

    Notre socit seorant de ournir les rsultats de recherche les plus pertinents et utilesdu Web, il est logique que nous cherchions galement orir une assistance accessibleau plus grand nombre et quitable tous les administrateurs de sites Web, quelle que soitla taille des sites quils administrent. Cest pourquoi nous avons cre le Centre pour leswebmasters, disponible` ladresse suivante : google.fr/webmasters.

    Ce centre constitue une source dinormations et doutils trs utile pour tous les diteursWeb. Il contient des rponses compltes aux questions portant sur lexploration,lindexation et le classement. Il rassemble galement les commentaires des utilisateurs etdes inormations sur les problmes rencontrs et permet aux administrateurs de soumettreleurs propres commentaires. Enn, il propose des outils de diagnostic conus pour aiderles administrateurs rsoudre les ventuels problmes de rrencement rencontrs.

    Voici un avant-got de ce que le Centre pour les webmasters vous propose :

    Diagnostic des ventuels problmes lors de laccs aux pages et ventail de solutions

    Demande de suppression de certaines pages de notre index

    Vrication de lefcacit de votre chier robots.txt (autorisation ou blocage de laccsaux pages dsignes.)

    Afchage des statistiques des pages et requtes de votre site Web :

    Statistiques de requte : elles dterminent quelles requtes de recherche drainentle plus grand nombre de visiteurs vers votre site et quels thmes votre site pourraitdvelopper an dattirer encore plus dinternautes.

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    9/13

    14 15

    Analyse de page : cet outil vous permet de voir vos pages Web telles que Google lesvoit, dacher les termes apparaissant le plus rquemment sur votre site, ainsi queles liens entrant y conduisant et les descriptions des autres sites qui renvoientau vtre.

    Frquence dexploration : cet outil vous indique quelle frquence votre site est explorpar les robots Googlebot et vous permet de signaler Google si vous souhaitez quilsoit explor plus ou moins souvent.

    Protocole Sitemaps

    Le Centre pour les webmasters propose galement aux diteurs Web dutiliser le protocoleSitemaps pour les rsultats de recherche Web, Google Mobile et Google News.

    Sitemaps est un protocole que nous prenons en charge linstar dautres moteurs derecherche, an daider les administrateurs de sites Web nous ournir plus dinormationssur leurs pages Web. Le protocole Sitemaps vient en complment dautres mcanismesdexploration Web standard. Les administrateurs de sites Web peuvent utiliser ce protocolean de communiquer Google de plus amples inormations sur les pages de leur site etoptimiser ainsi leur exploration et augmenter leur visibilit dans les rsultats de rechercheGoogle.

    Outre le protocole Sitemaps pour la recherche Web, nous proposons galement unprotocole Mobile Sitemaps qui permet aux diteurs Web de soumettre notre index desadresses URL de pages destines tre consultes sur des appareils mobiles (PDAs,smartphones, etc.).

    Quant aux diteurs de sites dactualit rrencs sur Google News, le protocole NewsSitemaps leur ournit des statistiques sur leurs articles : requtes, rquences dachage,etc. En conjonction avec les outils de diagnostic du Centre pour les webmasters, leprotocole News Sitemaps ournit galement des rapports derreur qui permettent de mieuxcomprendre les problmes rencontrs par Google lors de lexploration ou de lindexationdarticles provenant dun site dactualit. Enn, le protocole News Sitemaps permet aux

    diteurs de soumettre lindex de Google News les adresses URL de leur choix. ladirence des protocoles Web et Mobile Sitemaps, le protocole News Sitemaps est pourlinstant uniquement disponible en anglais. Nous esprons quil sera bientt disponibledans dautres langues.

    Foire aux questions (FAQ)

    Pourquoi ne puis-je pas bncier dune assistance personnelle pour mon site Web ?Selon certaines estimations, il y a 100 millions de sites sur le Web. Chacun de ces sitesest important nos yeux car sans eux, quelle que soit leur taille ou leur importance, notreindex serait moins complet et donc au nal moins utile nos utilisateurs.

    Webmaster Central ore une assistance prcieuse pour tous les types de sites Web. Nouspublions les questions des diteurs et y rpondons de sorte que tout le monde puissebncier des inormations changes. Webmaster Central, cest aussi une communautconviviale dadministrateurs Web prts partager leurs astuces et conseils et vous aider rsoudre vos ventuels problmes.

    Les annonces que vous achez infuencent-elles vos classements ? Les annonces que

    vous achez et les rsultats de recherche sont-ils totalement distincts ?Les annonces et les rsultats de recherche sont absolument indpendants les uns desautres. En ait, des quipes distinctes travaillent sur chacun de ces secteurs an dvitertoutes interrences. Nous sommes convaincus que nos rsultats de recherche doiventtre absolument impartiaux et objectis an de garantir aux utilisateurs des services lameilleure qualit qui soit.

    Comment dois-je procder pour que mon site soit rrenc dans lindex de recherchede Google ?Le rrencement des sites dans les rsultats de recherche Google est gratuit et se aitautomatiquement (vous navez pas besoin de les soumettre manuellement Google).Google est un moteur de recherche entirement automatis qui explore le Web de manirergulire an dy dtecter les sites non encore rrencs et les ajouter notre index.En ait, la grande majorit des sites rpertoris dans nos rsultats ne sont pas soumismanuellement, mais trouvs et ajouts automatiquement par nos robots qui explorent leWeb.

    En outre, les outils de Google disponibles sur Webmaster Central orent auxadministrateurs de sites Web un moyen simple de soumettre lindex de Google un plande leur site ou une liste de leurs adresses URL et dobtenir des rapports dtaills sur la

    visibilit de leurs pages sur Google. Grce ces outils, les propritaires de sites peuventautomatiquement tenir Google inorm des toutes les pages dont se compose leur site etde toutes les mises jour apportes ces pages.

    En moyenne, combien de temps aut-il Google pour reprer un nouveau site sur le Webet quelle rquence Google explore-t-il le Web de manire gnral ?Il ny a pas de dure standard pour quun site soit rrenc. Les robots Googlebotexplorent rgulirement le Web an de mettre jour notre index. Grce WebmasterCentral, les administrateurs de sites Web peuvent voir quelle rquence leur site estexplor par les robots Googlebot et indiquer sils souhaitent que leur site soit explor plusou moins souvent.

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    10/13

    16 17

    Que se passe-t-il si je souhaite que mon site Web gure dans les rsultats derecherche Web, mais pas dans les rsultats de services distincts tels que GoogleNews ou Google Image ?Google donne toujours la possibilit aux diteurs Web de ne pas gurer sur certains deses services. Pour ce aire, il leur sut de contacter la ou les quipes dassistance encharge du ou des services concerns.

    Ainsi que mentionn prcdemment dans le prsent guide, le protocole dexclusion desrobots peut tre utilis an de bloquer lindexation de certaines images et pages Web. cette n, vous pouvez galement utiliser la onctionnalit de suppression dadresses URLdisponible sur Webmaster Central, prenant en charge la recherche Web et la rechercheGoogle Image.

    En outre, le groupe dordinateurs Googlebot utilisant dirents robots, vous pouvez dniravec prcision les pages dont vous souhaitez bloquer laccs :

    Robots Googlebot : explorent les pages pour notre index Web et notre indexrrenant les pages consacres lactualit

    Robots Googlebot-Mobile : explorent les pages pour notre index rfrenant lescontenus destines aux appareils mobiles

    Robots Googlebot-Image : explorent les pages pour notre index rfrenantles images

    Robots Mediapartners-Google : explorent les pages an didentier le contenuAdSense. Nous utilisons uniquement ces robots pour explorer les sites contenantdes annonces AdSense.

    Robots Adsbot-Google : explorent les pages Web an dvaluer la qualit des pagesde renvoi AdWords. Nous utilisons uniquement ces robots lorsque vous aites appel Google AdWords pour promouvoir votre site.

    Si vous souhaitez, par exemple, bloquer laccs de lintgralit des robots Googlebot vospages, vous pouvez utiliser la syntaxe suivante :

    User-agent: Googlebot

    Disallow: /

    Est-ce que je peux choisir le texte de lextrait qui apparat dans les rsultats derecherche ?Non. En eet, une telle possibilit ne serait pas une bonne ide, ni du point de vue desinternautes, ni du point de vue des crateurs de contenu. Nous choisissons un extraitissu du site qui comporte la requte de linternaute dans son contexte et qui permet doncdattester de la pertinence du rsultat.

    Les tudes dmontrent que les internautes se rendront plus srement sur un site Websi les rsultats de recherche contiennent un extrait de texte. Grce ces extraits, lesinternautes peuvent plus acilement valuer la pertinence des rsultats par rapport leurrequte. Lorsque les internautes ne peuvent pas valuer rapidement la pertinence dunrsultat, ils passent gnralement au rsultat suivant.

    Lorsquil nous est impossible de gnrer laide dalgorithmes des extraits de texteexploitables et satisaisants partir du contenu de leurs pages Web, les diteursWeb peuvent y ajouter la balise Mta suivante an de nous ournir des inormationssupplmentaires. Cette balise doit tre ajoute dans la section des pagesconcernes comme dans lexemple suivant :

    Si vous ne souhaitez pas quun extrait de texte soit gnr partir du contenu de vospages, il vous sut dajouter la balise Mta NOSNIPPET comme suit :

    Enn, nous utilisons parois les descriptions de site contenues dans le rpertoire ODP

    (Open Directory Project) pour les extraits de texte que nous achons dans les rsultats. Sivous ne souhaitez pas que nous utilisions cette description, il vous sut dajouter la baliseMta suivante :

    Sur mon site, les articles consacrs aux dernires nouvelles sachent pendant quelquesheures avant dtre mis jour, puis sont dplacs vers la section des articles standard. Jesouhaite que tous les articles de mon site soient rrencs dans lindex de Google sau lesarticles consacrs aux dernires nouvelles.Pour ce aire, vous pouvez placer tous les articles consacrs aux dernires nouvelles dansun mme rpertoire, puis empcher laccs de ce dernier aux robots Googlebot laide duchier robots.txt.

    Vous pouvez galement, cette n, ajouter la balise Mta NOFOLLOW dans la section de la page HTML consacre aux dernires nouvelles. Cette balise indique auxrobots Googlebot quils ne doivent suivre aucun des liens trouvs sur cette page. Noubliezpas cependant, que cette balise empche uniquement les robots Googlebot de suivre lesliens allant dune page une autre. Si une autre page Web renvoie ces articles, Googlepourra les trouver et donc les indexer.

    Si je dispose de plusieurs noms de domaine et si je diuse le mme contenu partirde ces noms dirents, mes sites courent-ils le risque dtre exclus de vos rsultats derecherche ?Bien que certains diteurs Web tentent parois dutiliser le clonage de site et les sitesmiroirs pour induire en erreur les moteurs de recherche, il y a des cas o le clonage decontenu est tout ait justi et lgitime. Nous ne souhaitons pas pnaliser les sitesse trouvant dans ce cas. Par exemple, nous ne considrons pas que le mme contenuexprim dans deux langues direntes (par exemple, une version anglaise et une versionranaise) est du contenu clon.

    ^

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    11/13

    18 19

    Glossaire

    Adresse URL (Uniorm Resource Locator)Adresse dun site Web sur Internet qui se compose des lments suivants : http (protocoledaccs), nom de domaine (www.google.r) et dans certains cas de lemplacement dunautre chier (www.google.r/webmaster).

    Balises MtaBalises dans le code HTML permettant de dcrire le contenu dune page Web. Les balisesMta peuvent tre utilises an de dnir des modalits dindexation spciques pourchacune des pages dun site.

    Contenu dynamique

    Contenu tel que des images, des animations ou des vidos qui utilisent le langage Flashou Javascript, des cadres ou des adresses URL gnres dynamiquement.

    Dissimulation (Cloaking)Technique qui consiste montrer aux moteurs de recherche un contenu dirent de celuivisible par les utilisateurs.

    Exploration (Crawling)Processus utilis par les moteurs de recherche pour collecter des pages sur le Web.

    Extension de fchierNom attribu aux chiers inormatiques (.doc, .txt, .pd, etc.) indiquant gnralement lanature des donnes contenues dans le chier.

    HTML (Hypertext Markup Language)Langage de marquage utilis sur le Web an de structurer le texte.

    IndexerProcessus consistant rrencer le contenu dun site dans un moteur de recherche.

    Lien En cacheImage dune page Web capture par les robots Googlebot lors de leur dernire visite. Unecopie en cache permet aux utilisateurs dacher une page mme lorsque sa version enligne nest pas disponible. Le contenu de cette copie peut touteois varier lgrement de laversion en ligne. Pour acher la copie en cache dune page, cliquez sur le lien En cacheach sous le rsultat de la recherche.

    Mot clTerme saisi dans la zone de recherche dun moteur de recherche, lequel lance unerecherche an de trouver des pages contenant ces termes.

    Diuser le mme contenu sur plusieurs sites Web dirents, notamment dans le cadredune syndication darticles, ne signie pas ncessairement que lun ou plusieurs de cessites seront entirement supprims des rsultats de recherche. Touteois, noubliez pasque les articles apparaissant sur plusieurs sites sont moins bien classs que les articles negurant que sur un seul, car les premiers bncient uniquement dune raction des liensentrants dont les articles publis en un seul exemplaire bncient. En principe, un articlepubli sur un seul site sera mieux class quun article publi sur plusieurs. Il sera doncconsult par un plus grand nombre dinternautes.

    En outre, an de garantir la qualit de nos rsultats de recherche, nous ny aisons pasgurer plusieurs exemplaires dune mme page. Nous prrons gnralement y acherune seule version de cette page. Les administrateurs de sites Web peuvent nanmoinsnous indiquer laide du chier robots.txt quelle version de la page ils souhaitent que nousachions dans nos rsultats ou bloquer laide des balises Mta appropries lachagede toutes versions non dsires.

    Pourquoi laccs de mon site lindex Google est-il bloqu ?Tout dabord, il se peut que lindexation de votre site ne soit pas bloque. De nombreusesautres raisons peuvent en eet expliquer pourquoi votre site napparat pas dans nosrsultats de recherche (voir pages 5 11).

    Si aucun obstacle nempche le reprage ou lindexation de votre site, alors il se peuteectivement que son accs lindex soit bloqu. Cette situation se produit notammentlorsque les sites concerns ne respectent pas les normes de qualit dnies par lesdirectives que nous avons rdiges lattention des administrateurs de sites Web(disponibles sur le Centre pour les webmasters). Il sagit le plus souvent de sites Web quiutilisent des mthodes dloyales pour obtenir un classement plus lev dans nos rsultatsde recherche. Ces inractions nos directives incluent notamment la dissimulation(cloaking, en anglais) qui consiste rdiger du texte de sorte quil soit visible par lesmoteurs de recherche mais pas par les utilisateurs) ainsi que la conguration de pages et

    / ou de liens dans le seul but dinduire en erreur les moteur de recherche et de manipulerles rsultats de recherche.

    Lorsquun administrateur de sites Web pense que lun de ses sites est en inractionavec nos directives en matire de qualit, il peut modier ce site an quil sy conorme,

    puis cliquer sur le lien Request re-inclusion (Demander une rindexation) accessible partir de linterace des outils du Centre pour les webmasters an que nous procdions une rvaluation du site.

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    12/13

    20

    Protocole dexclusion des robotsNorme technique indiquant aux moteurs de recherche quels sites ou parties de sitedoivent tre ou non rrencs dans les rsultats de recherche.

    PageRankFonctionnalit propose par Google contribuant dterminer le classement dun sitedans nos rsultats de recherche. Ce classement est tabli en respectant le caractreproondment dmocratique du Web, puisquil utilise son organisation sous orme deliens pour dterminer la valeur individuelle de chaque page. Le score PageRank dessites importants et de grande qualit est plus lev. Cet lment est pris en compte parGoogle lors des recherches. Google associe ce classement des techniques labores derecherche de texte correspondant aux critres saisis an de trouver des pages pertinenteset importantes par rapport aux requtes des internautes.

    Rpertoire racineRpertoire principal dans un systme de chiers inormatiques.

    Robot dexploration (Crawler)Logiciel utilis pour reprer, puis indexer les adresses URL du Web ou dunrseau intranet.

    Robots.txtFichier texte permettant aux diteurs Web de contrler laccs de leur site plusieursniveaux : intgralit du site, rpertoires individuels, pages dun type particulier ou mmepages individuelles. Ce chier signale aux robots dexploration quels rpertoires peuventtre ou non explors.

    Systme de gestion de contenuLogiciel qui permet de grer dirents types de contenus : chiers inormatiques, images,chiers audio, contenus Web, etc.

    Site miroirVersion clone dun site Web, parois utilise pour induire en erreur les moteurs derecherche et ainsi optimiser lindexation et le classement dun site Web donn.

  • 8/14/2019 Google-Comment Optimisez Vos Contenus

    13/13

    Pour en savoir plus sur le Centre pour les webmasters: veuillez consulter :

    google.r/webmasters/

    Copyright 2007. Google est une marque commerciale de Google Inc. Tous les autres noms de socit et de produitsont susceptibles dtre des marques commerciales des socits auxquels ils sont associs.