comment extraire un classement de forbes

Post on 30-Jun-2015

1.265 Views

Category:

Technology

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Tutoriel présentant une méthode pour extraire des classements de Forbes et autres sites et les exporter vers un fichier Excel grâce à OutWit Hub

TRANSCRIPT

Comment extraire un classement de Forbes?

www.outwitter.fr

Pré-requis :Pour mettre en pratique ce tutoriel, vous avez

besoin de :- Firefox 2 ou 3- OutWit Hub.

Vous pouvez les télécharger sur :

OutWit Hub sur www.outwit.comFirefox 2 sur www.outwitter.frFirefox 3 sur www.mozilla.org

Nous allons extraire ce classement des hommes les plus riches du monde en 2008 de Forbes.

Ce classement s’étale sur plusieurs pages liées par le lien Next. OutWit Hub reconnaît ce Next et cette série de pages.

1ère partie

Lancez OutWit Hub : cliquez sur l’icône d’OutWit Hub ou allez dans Outils > OutWit > OutWit Hub.

Vous voyez apparaître la page actuelle dans l’onglet page (1) et son URL dans la barre d’adresse d’OutWit Hub (2).

2e partie

Cliquez sur data (1) puis sur tables (2) : OutWit Hub a extrait le tableau de Forbes en gardant les mêmes rubriques pour les colonnes.

Cochez Catch selection (1). Maintenez la touche ctrl enfoncée et cliquez sur les lignes du tableau que vous voulez (2). Cliquez sur Catch (3).

Cliquez sur browse : OutWit Hub capture toutes les lignes qu’il trouve dans les pages parcourues

3e partie

Sélectionnez toutes les lignes de Catch (Ctrl+A).Cliquez sur File > Export Selection as (Ctrl+E).

Choisissez le nom de la feuille Excel et le dossier où le tableau sera enregistré (1). Cliquez sur Enregistrer (2).

Ouvrez votre fichier Excel. Cette fenêtre apparaît. Cliquez sur Oui.

Changez les noms des colonnes inexactes, supprimez les lignes et colonnes en trop et le tour est joué !

Conclusion :Dans ce tutoriel, la fonction table marche très bien pour extraire le tableau.

Cependant, si vous tombez sur un tableau qui ne peut être extrait avec table, suivez la même méthode mais avec la fonction guess. Les plus courageux pourront également créer un scraper.

A bientôt sur

www.outwitter.fr

top related