27 Octobre 2004 Exposé 2004 - Google 1
27 Octobre 2004
Google,Google,Un moteur de recherche Un moteur de recherche
comme les autres ?comme les autres ?
BEGHDADI Samir - BOYE Syr - MENDES Raoul
Projet ExposéProjet Exposé
27 Octobre 2004 Exposé 2004 - Google 2
Plan de la présentation:
1. Un peu d’histoire.
2. Comment fonctionne Google ?
3. Requêtes spécifiques sur Google.
4. Galaxie Google
27 Octobre 2004 Exposé 2004 - Google 3
1. Un peu d’histoire.
• GoogleGoogle est dérivé du terme Googol.
• Googol : 1 suivi de 100 zéros !
• But : tenter d’organiser au mieux l’incroyable masse d’information disponible sur le web…
27 Octobre 2004 Exposé 2004 - Google 4
Genèse
• En 1995, Rencontre de Larry Page et Serge Brin à l’Université de Standford.
• En janvier 1996 : projet nommé BackRub.BackRub.
27 Octobre 2004 Exposé 2004 - Google 5
Quelques dates
19971997
Première architecture de serveurs : une association de machines bas de gamme!
27 Octobre 2004 Exposé 2004 - Google 6
Clin d’œil : avant – après…
27 Octobre 2004 Exposé 2004 - Google 7
« A la mi-2003, »
• A la mi-2003, plus de 3 milliards de documents en croissance constante !
• Plus de 10000 serveurs tous regroupés au centre nerveux de la société Google… le GooglePlexGooglePlex .
27 Octobre 2004 Exposé 2004 - Google 8
Plan de la présentation:
1. Un peu d’histoire.
2. Comment fonctionne Google?
3. Requêtes spécifiques sur Google.
4. Galaxie Google.
27 Octobre 2004 Exposé 2004 - Google 9
2. Comment marche Google ?
• WebCrawler
• Indexation ou "deep crawl".
• La recherche de la pertinence :
Critère interne à la page
Critère externe à la page
27 Octobre 2004 Exposé 2004 - Google 10
La recherche de la pertinence
Critère interne à la page :
· mots de la requête dans l'url · positionnement des mots dans la page et
donc dans différentes balises < title >, < h1 >, < b >...
· densité du mot dans la page · proximité des mots de la requête dans une
page
27 Octobre 2004 Exposé 2004 - Google 11
La recherche de la pertinence suite….
Critère externe à la page : un algorithme de pertinence, PageRank.
PR(B) = (1-d) + d * ( PR(A1) / N(A1) + …+ PR(An) / N(An))
Inconvénient : pages de résultat sans grand rapport avec la requête si ses pages sont dites "populaires"
27 Octobre 2004 Exposé 2004 - Google 12
Plan de la présentation:
1. Un peu d’histoire.
2. Comment fonctionne Google ?
3. Requêtes spécifiques sur Google.
4. Galaxie Google.
27 Octobre 2004 Exposé 2004 - Google 13
Premiers pas avec Google
• Chien chat
• chien OR chat
• Allergie (chien OR chat)
• Automobiles Renault –clio
• +le parisien
• “le rouge et le noir”
• Lun*
• Trois * chiens
27 Octobre 2004 Exposé 2004 - Google 14
Bien élaborer une recherche
• allintitle, inurl, intext, inanchor
• “jacques chirac” site:lemonde.fr
• link:http://www.nature.com
• cache:http://linuxfr.org/poll/send,76.html
• neurochirurgie daterange:2452389-2452389
• cours filetype:pdf
• related:www.tf1.fr
• info:www.lequipe.fr
• stocks:ibm
• phonebook:(601) 373-1061
• vincennes
27 Octobre 2004 Exposé 2004 - Google 15
Affichage des résultats
27 Octobre 2004 Exposé 2004 - Google 16
Plan de la présentation:
1. Un peu d’histoire.
2. Comment fonctionne Google ?
3. Requêtes spécifiques sur Google.
4. Galaxie Google.
27 Octobre 2004 Exposé 2004 - Google 17
La Galaxie Google
• Google Catalogs
• Google Answers
• Google Special Searches
• Google Labs
• Google Wireless
27 Octobre 2004 Exposé 2004 - Google 18
Les autres services Google
• Ad Words
• Gmail
• Google Toolbar
27 Octobre 2004 Exposé 2004 - Google 19
Conclusion
Les évolutions de Google • Google Print • Froogle • Google Desktop SearchGoogle Desktop Search
La concurrenceLa concurrence• Le projet Le projet « PrototypeCrawler » ou MsnBot« PrototypeCrawler » ou MsnBot• Les metamoteursLes metamoteurs• Les agents intelligentsLes agents intelligents …
27 Octobre 2004 Exposé 2004 - Google 20
Questions