Outwit, un plugin Firefox pour collecter et structurer les données du web

Publié le Jeudi 4 Septembre 2008, 16:00 dans Outils par Christophe Deschamps - Lu 11410 fois. Version imprimable

-


Outwit Hub est un plugin Firefox proposé par la société Outwit qui devrait ravir les super-crunchers. Il s'agit en effet d'un outil qui permet de récupérer des données sur une ou plusieurs pages web et de les structurer, par exemple sous forme de tableau. Par rapport à des outils de capture comme Zotero ou Scrapbook, conçus avant tout pour capturer des pagesentières, son avantage est dans la possibilité de collecter des données à un niveau de granularité plus fin.
Il est ainsi capable de récupérer :
  • des images (avec possibilité de lancer un diaporama)
  • des liens
  • des adresses emails,
  • du texte non-structuré (qui sera ensuite structuré)
  • les données présentes dans des tableaux
  • des listes
  • des adresses de fils RSS,
  • ...
Olivier Ezraty, qui l'a testé en long, en large et en travers (voir ici ou ), nous propose à ce sujte des tutoriels plutôt convaincants. La facilité avec il collecte les données des entreprises du fichier Forbes 2000 et les transfère sous Excel est bluffante.
Outwit Hub agit donc comme un chaînon manquant entre le non-structuré et le structuré et peut s'avérer
particulièrement utile pour tous ceux dont la tâche consiste (entre autres choses) à collecter les données non-structurées issues de sources éparses afin d'en tirer de la matière informationnelle, je pense en premier lieu aux veilleurs.
Voir également les tutos de ce blog.

Articles portant sur des thèmes similaires :


Commentaires

  1. Lien croisé

    Ecrit par Anonyme, le Vendredi 5 Septembre 2008, 22:49

    Outwit, un plugin Firefox pour collecter et structurer les données du web : " Autres actualités de cette journée : 05/09/2008"

  2. Lien croisé

    Ecrit par Anonyme, le Mardi 9 Septembre 2008, 10:20

    Actulligence.com - Intelligence Economique, veille, recherche d informations - O : "ute; une série de billets sur la veille tarifaire (et d'ailleurs j'en ai toujours un en attente de trrasncription de mes notes...), c'est donc avec un vif intérêt que j'ai consulté le billet de Christophe qui est de retour de vacances et qui nous parle de Outwit, un outil d'extraction de contenu à l'intérieur d'une page web."

  3. Lien croisé

    Ecrit par Anonyme, le Dimanche 14 Septembre 2008, 00:40

    : "J'ai récemment réalisé une série de billets sur la veille tarifaire (et d'ailleurs j'en ai toujours un en attente de trrasncription de mes notes...), c'est donc avec un vif intérêt que j'ai consulté le billet de Christophe qui est de retour de vacances et qui nous parle de Outwit, un outil d'extraction de contenu à l'intérieur d'une page web. Outwit c'est un peu la passerelle entre contenu non-structuré (en gros les pages HTML et l'internet en général... et le contenu structuré (base de données, fiches Exel, etc.) Outwit vous permet, une fois lancé, d'extraire par exemple "

  4. Lien croisé

    Ecrit par Anonyme, le Lundi 22 Septembre 2008, 11:55

    Outils Froids : " 05/09/2008 13:00 | A lire sur : http://www.outilsfroids.net/news/outwit-un-plugin-firefox-pour-collecter-et-structurer-les-donnees-du-web"

Nuage de mots-clés des articles