Juin 09 29

Version imprimable TextRunner un moteur de recherche sémantique pour interroger le web


-

TextRunner, mis en ligne récemment par le Department of Computer Science Engineering de l''Université de Washington, nous donne un bel avant-goût de ce que l'on peut attendre de la recherche sémantique.
Il permet en effet d'interroger 500 millions de pages web en utilisant des triplets. Kesako? Le triplet est ce qui va vous permettre de lancer des requêtes plus "intelligentes" que celles permises par les moteurs classiques en vous donnant la possibilité de les structurer un minimum. Comme son nom l'indique le triplet est composé de 3 éléments : un sujet, un prédicat, un objet. Cela ne vous dit toujours rien? Alors faisons simple : Who killed Kennedy?
  • who = sujet
  • killed = prédicat
  • Kennedy = objet
Facile non? (que les pros du web sémantique n'hésitent pas à compléter mes approximations). Bon alors voilà le résultat lorsque vous interrogez Textrunner ainsi :


Comme vous le voyez le moteur vous propose par défaut toutes les phrases qu'il a trouvé et qui incluent le prédicat et l'objet. Le sujet est en revanche libre et vous présente toutes le hypothèses présentes sur les sites web indexés par ordre de fréquence. Dans notre exemple "CIA" (29), "Lee Harvey Oswald" (20), "Castro" (13), "four gunmen" (4), "mafia" (2), etc.
En descendant dans les résultats vous pouvez voir que le terme Kennedy est évidemment pris tel quel puisque l'on retrouve également Bob Kennedy et Jacky Kennedy.
Sur le côté droit d'autres formes du mot "killed" vous sont proposées et vous permettent d'accéder aux résultats correspondants dans la page en un clic. Si maintenant vous cliquez sur un nombre de résultats une fenêtre apparaît qui replace chacun d'eux dans son contexte. Un dernier clic et vous ouvrez la page web d'où il est issu. On regrette d'ailleurs que celle-ci ne s'affiche pas dans un nouvel onglet, obligeant ainsi à des retours en arrière sans fin, mais gageons que c'est un défaut qui sera vite corrigé.


Nous n'en avons toutefois pas encore terminé avec Textrunner puisqu'il va également vous permettre de focaliser sur le sujet ou l'objet (qu'il appelle "argument 1" et "argument 2") et d'aller ainsi directement aux résultats qui vous intéresse ou, plus intéressant encore, de vous faire découvrir des pistes/idées, que vous ne connaissiez pas (un autre excellent moyen d'outiller la sérendipité).


Enfin vous pouvez tout simplement explorer des pistes en utilisant qu'un ou deux éléments du triplet, exemple : en indiquant Google en sujet vous obtenez des pages où Google est cité comme "actant". Si vous le mettez en objet il devient "acté". Exemple :


Tout comme l'excellent Evri chroniqué il y a quelques mois, Textrunner nous donne une bonne idée de ce que le web sémantique peut nous apporter en terme de recherche d'information et nous permet de nous familiariser simplement avec ce nouveau mode d'interrogation. Pour être encore plus utile il lui manque bien sûr la possibilité de classer les informations par dates mais ceci est lié au problème global de datation des pages web et non à l'outil. Evri le permet mais il ne travaille que sur de l'actualité automatiquement datée, forcément c'est plus simple.

Pour plus d'infos sur les triplets et le RDF voir l'article RDF pour tous.

Si vous avez aimé ce billet vous pouvez :

Le promouvoir :



En parler sur Twitter :


Commentaires

1 - Lien croisé

Que peut-on attendre de la "recherche sémantique"? : pintiniblog : " Outils Froids présente: un moteur de recherche sémantique pour interroger le web ", mis en ligne récemment par le Department of Computer Science Engineering de l''Université de Washington, nous donne un bel avant-goût de ce que l'on peut attendre de la recherche sémantique. Il perm"

 


Anonyme | Le Mercredi 01/07/2009 à 09:11 | [^] | Répondre

2 - Lien croisé

FB - FriendFeed : "RT @albertedenisTextrunner, un moteur de recherche sémantique pour interroger le web http://www.outilsfroids.net/news..."

 


Anonyme | Le Mercredi 01/07/2009 à 19:58 | [^] | Répondre

3 - Greper moteur de reponse communautaire

Dans le meme genre, je crois que l'on peut rajouter Greper
un tout jeune moteur de recherche communautaire de question/réponse
fonctionnant sur le principe du QQOQCCP (qu est ce que/quand/ou/qui/comment/combien/pourquoi)


l'algo du moteur s'appuie sur une analyse morpho-syntaxique et permet aux utilisateurs d'effectuer des recherche en langage dit "naturel"

le but de Greper est de fournir à chaque question, une réponse unique modifiable par les contributeurs (les Grep Members) et les Anonymes
facilitant ainsi la recherche et réduisant le temps passé à trouver des réponses sur les moteurs généralistes.

Le moteur propose à ses membres (devenir contributeur ne requière qu'une inscription) de figurer sur un classement des 100 meilleurs contributeurs (le Grep Awards) ou ces derniers seront classés par ordre de pertinence sur les réponses apportées au moteur.
(il y a d'autres critères mais ils faut y jeter un œil pour comprendre)

Alors pour le petit test qui s'est révélé pertinent malgré le faible poids de la base de données à l'heure actuelle, du fait de la jeunesse du projet
(à peine un mois) :

Ma question, << Pourquoi ce nom Greper ? >>
Réponse << Aucun utilisateur n'a encore répondu >>

Je dépose alors mon adresse mail sur la question pour être prévenu
lors d'une réponse.
Quelques heures plus tard je reçois un mail m'informant qu'un Grep Member venait de répondre à la question

en voici le lien www.greper.com/search

Bon sur le coup je suis resté compréhensif vu l'age du moteur
puis apres reflexion ben je me suis dis que la prochaine personne qui poserait la question obtiendrait sa réponse.

Ensuite pour faire une comparaison rapide avec un moteur classique
tel que google j'ai lancer une recherche sur google
<< comment devenir navigateur sous marinier >> (bon parce que j'ai un ami qui compte en faire sa spécialité)
Et bien on ne trouve pas tant de résultats que ça, ou bien il faut creuser
sur les premiers sites donnés et encore en changeant les mots clés.

Sur Greper ce genre de requêtes ne pose aucun problème du moment qu'un contributeur est passé avant vous.
Vous avez un accès direct à la solution.

En conclusion pour mon avis personnel :
Plus il y a de contributeurs (sérieux), plus la mine se remplit d'or
La preuve concrète avec l'exemple de Wikipédia.

 


Dash | Le Vendredi 03/07/2009 à 03:00 | [^] | Répondre

4 - Lien croisé

TICE & DOC : " un moteur de recherche sémantique pour interroger le web Jun 30, 2009 16:01:13 GMT"

 


Anonyme | Le Mardi 07/07/2009 à 15:39 | [^] | Répondre

5 - Lien croisé

Que peut-on attendre de la "recherche sémantique"? - Paperblog : " Outils Froids présente: un moteur de recherche sémantique pour interroger le web ", mis en ligne récemment par le Department of Computer Science Engineering de l''Université de Washington, nous donne un bel avant-goût de ce que l'on peut attendr"

 


Anonyme | Le Dimanche 02/08/2009 à 02:47 | [^] | Répondre

6 - Lien croisé

Outils Froids : " 30/06/2009 16:01 | A lire sur : http://www.outilsfroids.net/news/textrunner-un-moteur-de-recherche-semantique-pour-interroger-le-web"

 


Anonyme | Le Jeudi 19/11/2009 à 20:33 | [^] | Répondre

7 - Lien crois&#38;eacute;

Que peut-on attendre de la « recherche sémantique ? « pint : " Outils Froids présente: un moteur de recherche sémantique pour interroger le web"

 


Anonyme | Le Samedi 13/03/2010 à 15:05 | [^] | Répondre

 

Nuage de mots-clés des articles