TYPO3 et
les moteurs de recherche 01.07.2011
Yohann CERDAN <[email protected]> Thomas LEROY <[email protected]>
Yohann CERDAN Directeur Technique Site’nGo Profil : Développeur TYPO3 Certifié TYPO3 Integrator
Thomas LEROY Directeur Techno-commerciale Site’nGo Profil : Intégrateur TYPO3 Certifié TYPO3 Integrator
T3UNI11
TYPO3 et les moteurs de recherche 01.07.2011
TYPO3 et les moteurs de recherche
Ce qu’il existe par défaut
TYPO3 et les moteurs de recherche
Recherche full text MySQL
Retourne les enregistrements avec leur pertinence
Gère les opérateurs booléens + et –
Peut convenir pour un développement spécifique
T3UNI11
01.07.2011
http://dev.mysql.com/doc/refman/5.0/fr/fulltext-search.html
TYPO3 et les moteurs de recherche
Recherche full text MySQL
Trop simpliste
Modifie la structure de la table (MyISAM)
Performances faibles sur des gros volumes
T3UNI11
01.07.2011
http://dev.mysql.com/doc/refman/5.0/fr/fulltext-search.html
TYPO3 et les moteurs de recherche
Recherche full text MySQL
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
indexed_search
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
indexed_search
Est développée depuis 2004 (Kasper Skaarhoj)
Est intégrée et configurée dans les sources de TYPO3
Indexe toutes les pages/contenus et documents (catdoc / pdftotext)
Gère les espaces authentifiés
Dispose d’un crawler externe (CRON) ou indexation à la visite (aucune configuration)
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
indexed_search
Convient parfaitement pour des sites à faible et moyen trafic
Ne gère pas de manière poussée les opérateurs et le filtrage
Est difficile à surcharger pour ajouter des fonctionnalités (XCLASS, hooks…)
T3UNI11
01.07.2011
Pour aller plus loin
TYPO3 et les moteurs de recherche
Google Search (version gratuite)
Très simple à mettre en place
Aucun contrôle :
Retours Mise en forme Indexation dépend de votre SEO
http://www.google.com/cse/
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
Google Search (version payante)
Toujours aussi simple
Gestion des synonymes
Pondération de certains résultats
Pas de publicité
Flux XML
Filtrage par catégorie simple
Dépend toujours de l’indexation de Google
T3UNI11
01.07.2011
http://www.google.com/sitesearch/
TYPO3 et les moteurs de recherche
Google Search et TYPO3
ya_googlesearch
googlecse
google_api_search
ltg_googlesearch
so_gsearch
ajax_google_search
…
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
MnoGoSearch
Ecrit en C
Composé d’un crawler et d’un moteur de recherche
Supporte la plupart des base de données
Support de l’UTF8
Gestion du multilinguisme (70 langues)
Indexation et recherche rapide
Indexation des pages et documents
Existence d’une extension PHP (http://php.net/manual/fr/book.mnogosearch.php)
http://www.mnogosearch.org/
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
MnoGoSearch et TYPO3
1 seule extension : mnogosearch (2009)
Développée par Dmitry Dulepov (realurl, templavoila, pagebrowse…)
Simple (nécessite par contre l’installation sur le serveur)
Supporte les pages authentifiées et les documents
Peu d’options disponibles pour les recherches (tris, filtres…)
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
Sphinx
Ecrit en C++
Spécialement conçu avec la performance à l’esprit
Composé d’un crawler et d’un moteur de recherche
Couvre les mêmes fonctionnalités que mnogosearch
Plus rapide que mnogosearch (ou les autres) pour les deux traitements
Supporte la plupart des base de données (ou des fichiers XML)
Possibilité de recherches distribuées pour les très gros sites
De bonnes références : wordpress, dailymotion, mozilla
Craigslist : 5 billions de documents, 6 TB de données, 50 millions de recherches/jour
http://www.sphinxsearch.com/
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
Sphinx et TYPO3
Rien ! Tout est à faire
SphinxAPI compatible PHP (SphinxAPI, SphinxSE et SphinxQL)
Peut-être une implémentation de SphinxQL dans le core de TYPO3 4.6?
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
Apache SOLR
Ecrit en Java (nécessite un serveur d’application Java)
Composé d’un moteur d’indexation et de recherche (Lucene)
Propose une interface de recherche (SOLR)
Solution très rapide
Pas besoin de base de données
Interface sous forme d’API XML / JSON exploitable de n’importe où et avec
n’importe quelle technologie (SolrPHPClient)
De bonnes références : Cnet, Panasonic, Porsche…
Nécessite de la configuration et un serveur « convenable »
http://lucene.apache.org/solr/
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
Apache SOLR
Beaucoup de fonctionnalités :
Possibilité de choisir exactement ce qui est indexé
Indexation des documents puissante (Apache Tika)
Recherche avec des opérateurs
Recherche par facette
Réplication des index
Recherche distribuée
Interface d’administration
Interaction possible avec d’autres systèmes (Liferay, AlFresco)
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
Apache SOLR et TYPO3
Projet débuté en 2008
Projet soutenu par dkd
Une version gratuite Une version payante
Bien intégré
Pages authentifiées Facettes Tris Filtres Auto-complétion Installation facilitée …
http://www.typo3-solr.com/
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
Apache SOLR et TYPO3
Toute la configuration est faite en typoscript
Paramétrage
Ajout de champs, facettes…
Objets typoscript
T3UNI11
01.07.2011
http://www.typo3-solr.com/
TYPO3 et les moteurs de recherche
Apache SOLR et TYPO3
Et si l’extension ne fait pas ce que je veux?
Possibilité de surcharger le typoscript (userfunc)
Des hooks aux bons endroits
Une XCLASS?
T3UNI11
01.07.2011
http://www.typo3-solr.com/
TYPO3 et les moteurs de recherche
Questions / Réponses
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
Merci
Retrouvez cette présentation sur www.site-ngo.fr
Yohann CERDAN <[email protected]> Thomas LEROY <[email protected]>
T3UNI11
01.07.2011