Juin 09 29

Version imprimable TextRunner un moteur de recherche sémantique pour interroger le web


-

TextRunner, mis en ligne récemment par le Department of Computer Science Engineering de l''Université de Washington, nous donne un bel avant-goût de ce que l'on peut attendre de la recherche sémantique.
Il permet en effet d'interroger 500 millions de pages web en utilisant des triplets. Kesako? Le triplet est ce qui va vous permettre de lancer des requêtes plus "intelligentes" que celles permises par les moteurs classiques en vous donnant la possibilité de les structurer un minimum. Comme son nom l'indique le triplet est composé de 3 éléments : un sujet, un prédicat, un objet. Cela ne vous dit toujours rien? Alors faisons simple : Who killed Kennedy?

  • who = sujet
  • killed = prédicat
  • Kennedy = objet
Facile non? (que les pros du web sémantique n'hésitent pas à compléter mes approximations). Bon alors voilà le résultat lorsque vous interrogez Textrunner ainsi :


Comme vous le voyez le moteur vous propose par défaut toutes les phrases qu'il a trouvé et qui incluent le prédicat et l'objet. Le sujet est en revanche libre et vous présente toutes le hypothèses présentes sur les sites web indexés par ordre de fréquence. Dans notre exemple "CIA" (29), "Lee Harvey Oswald" (20), "Castro" (13), "four gunmen" (4), "mafia" (2), etc.
En descendant dans les résultats vous pouvez voir que le terme Kennedy est évidemment pris tel quel puisque l'on retrouve également Bob Kennedy et Jacky Kennedy.
Sur le côté droit d'autres formes du mot "killed" vous sont proposées et vous permettent d'accéder aux résultats correspondants dans la page en un clic. Si maintenant vous cliquez sur un nombre de résultats une fenêtre apparaît qui replace chacun d'eux dans son contexte. Un dernier clic et vous ouvrez la page web d'où il est issu. On regrette d'ailleurs que celle-ci ne s'affiche pas dans un nouvel onglet, obligeant ainsi à des retours en arrière sans fin, mais gageons que c'est un défaut qui sera vite corrigé.


Nous n'en avons toutefois pas encore terminé avec Textrunner puisqu'il va également vous permettre de focaliser sur le sujet ou l'objet (qu'il appelle "argument 1" et "argument 2") et d'aller ainsi directement aux résultats qui vous intéresse ou, plus intéressant encore, de vous faire découvrir des pistes/idées, que vous ne connaissiez pas (un autre excellent moyen d'outiller la sérendipité).


Enfin vous pouvez tout simplement explorer des pistes en utilisant qu'un ou deux éléments du triplet, exemple : en indiquant Google en sujet vous obtenez des pages où Google est cité comme "actant". Si vous le mettez en objet il devient "acté". Exemple :


Tout comme l'excellent Evri chroniqué il y a quelques mois, Textrunner nous donne une bonne idée de ce que le web sémantique peut nous apporter en terme de recherche d'information et nous permet de nous familiariser simplement avec ce nouveau mode d'interrogation. Pour être encore plus utile il lui manque bien sûr la possibilité de classer les informations par dates mais ceci est lié au problème global de datation des pages web et non à l'outil. Evri le permet mais il ne travaille que sur de l'actualité automatiquement datée, forcément c'est plus simple.

Pour plus d'infos sur les triplets et le RDF voir l'article RDF pour tous.

Si vous avez aimé ce billet vous pouvez :

Le promouvoir :



En parler sur Twitter :


Juin 09 29

Version imprimable Marklets.com, l'annuaire des bookmarklets




Je vous ai souvent parlé des bookmarklets, ces petits bouts de codes qui s'intègrent à votre navigateur comme des favoris et lui ajoutent toutes sortes de fonctionnalités (j'ai même créé une rubrique à ce sujet). Avec l'avènement des services 2.0 ils se sont multipliés à un tel point qu'il devient difficile de s'y retrouver.
Marklets.com est tout simplement un annuaire qui les répertorie et vous permet de les retrouver par mots-clés.
S'il ajoute une description à chacun, ainsi qu'un système d'étoile permettant de faire émerger les plus populaires, on regrettera qu'il ne joue pas son rôle d'annuaire jusqu'au bout en les classant par catégories.
En vous inscrivant au compte Twitter de Marklets vous pourrez être alerté des nouveaux bookmarklets ajoutés à la base.
Vu chez Sylvain Drapeau
.


Juin 09 26

Version imprimable Cartographier les relations business des entreprises avec Market Visual


-

Tellement content de ma petite découverte du WE que je n'ai pas pu attendre lundi pour l'évoquer.
L'outil, puisque d'outil il s'agit, se nomme Market Visual et a pour objectif de vous permettre de cartographier les relations existantes entre une entreprise et d'autres entreprises ou entre  leurs dirigeants (détection de réseaux). Il ressemble d'ailleurs beaucoup à ce que l'on retrouve sur Société.com mais permet d'aller plus loin.

L'interface initiale de Market Visual est simple mais se complexifie dès la première interrogation (trop?). Il est posible de tirer 3 types de cartographies de ce service :

  • Relations directes. Ex : relations directes entre Bill Gates et Steve Ballmer
  • Relations indirectes. Ex : relations des membres du conseil d'administration de Microsoft avec des entreprises et des associations à but non-lucratif.
  • Relations communes. Ex: les liens directes et indirectes partagés par deux entités : relations potentielles des membres des conseils d'administration de Microsoft et Google liées à des études effectuées dans les mêmes universités (carto).


Une interface de filtrage avancée permet d'envisager tous les croisements possibles et propose même une prévisualisation de la carto.



Un autre exemple de carto autour d'Auchan.

L'interface peut également faire apparaître chaque entité et ses relations sous forme d'une liste (cliquer "View list"). Ce qui peut accompagner utilement une cartographie.



Le service "basique" est gratuit mais il est possible d'obtenir plus d'infos sur les entités (personnes et organisations) en s'abonnant. Idem si vous voulez sauvegarder les cartos générées ou les commander.

Via Cool Infographics.


Si vous avez aimé ce billet vous pouvez :

Le promouvoir :



En parler sur Twitter :


Juin 09 25

Version imprimable Interrogez des bouquets de moteurs personnalisés avec Searchbastards




J'ai bien fait de surmonter mes réticences à tester un plugin affublé d'un nom aussi peu vendeur.
Searchbastards est en effet un puissant outil d'aide à la recherche d'informations puisqu'il vous permet de créer très facilement des multimoteurs personnalisés et de les intégrer dans Firefox via une barre d'outils.
Une fois installé l'outil va vous proposer des créer des dossiers vous permettant de classer par thème les moteurs déjà présents dans votre barre de recherche Firefox : généralistes, de personnes, actualités,...
Vous pouvez ajouter de nouveaux moteurs d'au moins 3 manières :

  1. En incluant des "Searchbastards engines" c'est à dire des moteurs adaptés par l'auteur de ce plugin, Bjorn Rosell, pour mieux s'y intégrer (voir notamment Google Translate ou Facebook).
  2. En ajoutant des moteurs à Firefox via Mycroft.
  3. En utilisant l'extension Add to search bar (cette solution est la plus simple et fonctionne environ 80% du temps, en cas d'échec voir Mycroft)
Une fois vos moteurs installés vous allez donc les classer par groupes dans l'inteface de paramétrage :


Une fois cela fait la barre d'outils Searchbastards apparaît ainsi dans votre navigateur :


Lorsque vous interrogez Searchbastards vous obtenez une page vous présentant les résultats par moteurs grâce à des sous-onglets :


Vous l'aurez compris, le résultat est que vous avez dorénavant la possibilité de créer autant de dossiers thématiques que vous le souhaitez et de pouvoir interroger d'un clic les moteurs qui y sont intégrés .
Personnellement je me suis créé les dossiers suivants :
  • Moteurs généralistes
  • Références (dicos, encyclopédies,...)
  • Moteurs PDF
  • Moteurs de recherche de personnes
  • Moteurs de recherche par similarité
  • Moteurs temps réel (of course)
  • Moteurs P2P
  • Moteurs d'actualités
  • Moteurs scientifiques
  • Outils de traduction
Searchbastards est doté de très nombreuses autres fonctionnalités que vous pouvez découvrir sur le wiki de présentation. Vous pouvez notamment le paramétrer pour qu'il remplace la barre de recherche par défaut de Firefox ou encore "invoquer" les groupes de moteurs par un alias.
C'est à mon sens une extension indispensable pour toute personne menant quotidiennement des recherches sur le web.

Si vous avez aimé ce billet vous pouvez :

Le promouvoir :



En parler sur Twitter :


Juin 09 24

Version imprimable Xmarks et Deeper Web dans La Lettre Recherche & Référencement




Vous trouverez respectivement dans les numéros de mai et de juin de La Lettre Recherche & Référencement d'Abondance un article à propos d'Xmarks, service permettant à la fois de mieux gérer ses favoris et d'améliorer ses recherches sur le web, et un second sur Deeper Web, un très bel outil d'aide à la recherche sur Google, assez proche de l'excellent Search Cloudlet que j'avais traité dans cette même revue en janvier dernier.

Sommaire du numéro de mai :




Sommaire du numéro de juin :

L'abonnement à la Lettre R&R est payant. Voir les conditions par ici.


Juin 09 23

Version imprimable Comparatif de 14 moteurs de recherche "temps réel"




Quelques évènements récents dont la contestation en Iran ou l'atterrissage d'un avion sur l'Hudson ont fait prendre conscience de l'intérêt de disposer d'une information en "temps réel". Comme j'avais accumulé plusieurs moteurs de ce type dans Diigo je me suis dit qu'il était temps de rentrer dans les détails en tentant une petite comparaison.
Vous ne trouverez pas ici des outils comme Tweetmeme ou Twitter Search qui, certes, pourraient rentrer dans cette catégorie, mais me sont limités du fait que leurs résultats ne proviennent que de Twitter alors que les sources potentielles de l'information "temps réel" sont bien plus larges.

J'ai choisi les critères comparatifs suivants :

  • Sources prises en compte.
  • Représentation graphique des données : c'est à dire le traitement statistique des informations captées par le moteur afin d'en faire émerger des tendances, de les présenter sous forme de graphiques qui permettent de mieux mesurer les évènements ou de naviguer différement dans les informations.
  • Possibilité de générer un flux RSS par requête afin de s'y abonner dans un agrégateur.
  • Défilement de l'information en temps réel qui permet de suivre les résultats d'une requête en direct et sans avoir à recharger la page.


13 moteurs de recherche en temps réel - 13 real-time search engines (cliquer ici pour avoir uniquement le tableau)

Deux outils me semblent émerger de ce comparatif :
  1. Social Mention pour ses très nombreuses fonctionnalités et les multiples sources qu'il prend en compte
  2. Yauba pour les mêmes raisons, même s'il lui manque pour l'instant les capacités de traitement statistiques du précédent.
D'autres sont prometteurs, comme Almost.at ou Crowdeye.


Juin 09 17

Version imprimable Téléchargez la boîte à outils de l'IE pour les PME (dossier ICOMTEC vainqueur de Cogénie 2009)


- - -

Décidemment les étudiants du Master intelligence économique et communication stratégique de l'ICOMTEC n'en finissent plus de s'illustrer en cette fin d'année scolaire 2009. Après leur première place dans le Trophée Sun Tzu et le Trophée Com, ils se sont vu remettre hier, lors du salon i-Expo, le premier prix du concours Cogénie 2009 qui consistait cette année à produire une boîte à outils de l'intelligence économique pour le PME.

Téléchargez ce dossier.

"Dossier réalisé dans le cadre du Concours Général de l'Intelligence Economique 2009 par l'équipe de l'ICOMTEC (Université de Poitiers) en Master Intelligence Economique et Communication (promotion 14) : Garderon Julien, Boudaud Baptiste, Baret Catherine, Stefani Romain, Besnard Marion, Vincent Lauriane, Souesme Julien, Andriamiamina Hasina, et sous la direction de M. Nicolas MOINET."


Juin 09 14

Version imprimable 15 définitions de l'e-réputation + géolocalisation des offres commerciales




Le blog Caddereputation a publié la semaine dernière un très bon billet dans lequel l'auteur a demandé à plusieurs bloggueurs (dont je suis merci :-) de donner leur définition de l'e-réputation (d'une organisation s'entend).
C'est donc près d'une quinzaine de définitions qui ont été ainsi compilées puis analysés sémantiquement grâce à Tropes Zoom et présentées sous forme d'un nuage de mots-clés (Wordle).

Voici celle que j'ai donné dans sa version longue :

L'e-réputation d'une organisation est composée des données explicites et implicites, diffusées sur le web à la fois par l'organisation elle-même, ses employés, ses clients, ses concurrents ainsi que par des personnes-relais qui ne sont ni les uns, ni les autres (bloggeurs, twitterrers,...). Une veille d'opinion/image spécifique est nécessaire pour suivre ce que disent ces acteurs et y répondre si nécessaire.

L'e-réputation est créée par :

  • ce que l'organisation dit sur elle explicitement  :
    • actions de communications corporate, communiqués de presse
    • interviews de ces dirigeants, cadres,...
  • ce qu'elle dit sur elle implicitement :
    • actes qui peuvent être traçables
      • ex : modification de la page la concernant sur la wikipedia
  • ce que ses employés disent d'elle explicitement (mais généralement de manière anonymeme) :
    • exemple : sites pour noter son entreprise
  • ce que ses employés disent d'elle implicitement :
    • ex : données professionnelles mises en ligne sur ou Viadeo (fonction, sujet de travail) qui, une fois agrégées, peuvent fournir d'intéressantes informations.
  • ce que ses client disent d'elle explicitement :
    • ex : blogs d'utilisateurs d'un produit, forums de discussion
  • ce qu'ils en disent implicitement :
    • systèmes de notation d'entreprise (empreinte écologique, travail des enfants, ...)
  • ce que ses concurrents disent d'elles explicitement :
    • publicités comparatives, interviews comportant des attaques des produits concurrents
  • ce qu'ils disent de manière anonyme :
    • attaque dans des forums de discussion, création de vrais-faux blogs et tout ce qui s'apparente à des actions de déstabilisation par l'information.
  • ce que des personnes-relais qui ne sont aucune des entités déjà identifiées en disent :
    • bloggeurs qui relaient une info
    • twitterers 
Tant que j'y suis j'attire votre attention sur un autre de leur billet visant à localiser les offres commerciales francophones autour de la gestion de l'e-réputation sur une Google Maps


Plus d'articles :

 

Nuage de mots-clés des articles