Sep. 08 04

Version imprimable Outwit, un plugin Firefox pour collecter et structurer les données du web


-


Outwit Hub est un plugin Firefox proposé par la société Outwit qui devrait ravir les super-crunchers. Il s'agit en effet d'un outil qui permet de récupérer des données sur une ou plusieurs pages web et de les structurer, par exemple sous forme de tableau. Par rapport à des outils de capture comme Zotero ou Scrapbook, conçus avant tout pour capturer des pagesentières, son avantage est dans la possibilité de collecter des données à un niveau de granularité plus fin.
Il est ainsi capable de récupérer :
  • des images (avec possibilité de lancer un diaporama)
  • des liens
  • des adresses emails,
  • du texte non-structuré (qui sera ensuite structuré)
  • les données présentes dans des tableaux
  • des listes
  • des adresses de fils RSS,
  • ...
Olivier Ezraty, qui l'a testé en long, en large et en travers (voir ici ou ), nous propose à ce sujte des tutoriels plutôt convaincants. La facilité avec il collecte les données des entreprises du fichier Forbes 2000 et les transfère sous Excel est bluffante.
Outwit Hub agit donc comme un chaînon manquant entre le non-structuré et le structuré et peut s'avérer
particulièrement utile pour tous ceux dont la tâche consiste (entre autres choses) à collecter les données non-structurées issues de sources éparses afin d'en tirer de la matière informationnelle, je pense en premier lieu aux veilleurs.
Voir également les tutos de ce blog.

Commentaires

1 - Lien croisé

Outwit, un plugin Firefox pour collecter et structurer les données du web : " Autres actualités de cette journée : 05/09/2008"

 


Anonyme | Le Vendredi 05/09/2008 à 22:49 | [^] | Répondre

2 - Lien croisé

Actulligence.com - Intelligence Economique, veille, recherche d informations - O : "ute; une série de billets sur la veille tarifaire (et d'ailleurs j'en ai toujours un en attente de trrasncription de mes notes...), c'est donc avec un vif intérêt que j'ai consulté le billet de Christophe qui est de retour de vacances et qui nous parle de Outwit, un outil d'extraction de contenu à l'intérieur d'une page web."

 


Anonyme | Le Mardi 09/09/2008 à 10:20 | [^] | Répondre

3 - Lien croisé

: "J'ai récemment réalisé une série de billets sur la veille tarifaire (et d'ailleurs j'en ai toujours un en attente de trrasncription de mes notes...), c'est donc avec un vif intérêt que j'ai consulté le billet de Christophe qui est de retour de vacances et qui nous parle de Outwit, un outil d'extraction de contenu à l'intérieur d'une page web. Outwit c'est un peu la passerelle entre contenu non-structuré (en gros les pages HTML et l'internet en général... et le contenu structuré (base de données, fiches Exel, etc.) Outwit vous permet, une fois lancé, d'extraire par exemple "

 


Anonyme | Le Dimanche 14/09/2008 à 00:40 | [^] | Répondre

4 - Lien croisé

Outils Froids : " 05/09/2008 13:00 | A lire sur : http://www.outilsfroids.net/news/outwit-un-plugin-firefox-pour-collecter-et-structurer-les-donnees-du-web"

 


Anonyme | Le Lundi 22/09/2008 à 11:55 | [^] | Répondre

 

Nuage de mots-clés des articles