Mars 06 04

Version imprimable 2006, année charnière pour les moteurs de recherche d’entreprise?


-

Ci-dessous un article que j'ai rédigé pour Veille Magazine de Janvier 2006:
2006, année charnière pour les moteurs de recherche d’entreprise ?
L’année 2005 a vu s’opérer plusieurs opérations financières et stratégiques importantes dans le secteur des moteurs de recherche d’entreprise et pourrait bien être considérée comme un tournant pour ce marché jusque là plutôt ronronnant.

L’annonce du rachat en novembre dernier de Verity par Autonomy pour un montant de 500 millions de dollars a bien sûr été le point culminant de ces mouvements, mais d’autres avaient précédemment laissé entrevoir un frémissement du marché. Ainsi Verity a racheté en juin dernier 80-20, une solution de « desktop search » lui permettant d’étendre sa gamme. IBM pour sa part a multiplié les annonces avec le lancement d’Omnifind et la mise à disposition en Open Source d’UIMA (Unstructured Information Management Architecture), une plateforme globale de traitement de données non-structurée. Plus récemment, Big Blue a annoncé des accords avec X1 et Google autour de solutions de « desktop search », ainsi que le rachat de la société iPhrase en décembre dernier. Pour finir 2005 a également vu le rachat de Triplehop, l’éditeur du moteur statistique Matchpoint, par Oracle, ainsi que l’arrivée remarquée du français Exalead sur le marché américain.

 

Autonomy-Verity, le signal d’une restructuration du marché ?

 

Difficile donc de nier l’effervescence autour des moteurs de recherche d’entreprise, d’autant que comme le précise Susan Feldman, vice-présidente de la recherche sur les technologies de contenu chez IDC : « Il y a eu près d’une centaine de fusions ou acquisitions sur le marché de la gestion de contenu (recherche, gestion des « assets » numériques, records management) dans les 3 - 4 dernières années ». Doit-on pour autant voir dans ces mouvements le signal d’une consolidation générale ?

C’est que ce marché est plutôt paradoxal. Malgré une croissance du secteur estimée par IDC à 25% par an les sociétés dégagent des chiffres d’affaire bien moins importants que ceux de la plupart des autres secteurs de l’industrie informatique. Et encore faut-il prendre en compte la part importante des activités de conseil et d’intégration dans les résultats de ces sociétés. Le rapport annuel de Verity montre par exemple que la vente de logiciel en 2005 a généré 80 millions de $ dont plus de 60% en conseil. Cette compétence serait d’ailleurs une des raisons principales de son rachat par Autonomy.

On explique généralement ces faibles résultats par un morcellement des acteurs créant un manque de visibilité et entraînant la frilosité des investisseurs. Une tendance que l’opération Autonomy-Verity pourrait modifier selon l’avis de Martin White, rédacteur de l’Enterprise Search Guidebook 2005: “Je ne vois pas d’autres contrats du type Autonomy-Verity se profiler explique t-il, parce que tout le monde va attendre de voir ce qui se passe pour ces deux-là mais je pense qu’on va assister à une arrivée plus importante d’investisseurs car cette acquisition a valorisé ce marché ».

Le site CMS Watch, éditeur le l’« Enterprise Search Report », en donne une vision qui, à défaut d’être dynamique, présente une segmentation claire (voir tableau n° 1)

 

Les « Big Three »

Acteurs « traditionnels »

Autonomy-Verity

Convera

Fast Search & Transfer

 

Editeurs à forte spécialisation

Se concentrent sur les besoins spécifiques de certains secteurs tels le CRM ou l’e-commerce

Endeca

Inquira

iPhrase (IBM)

Lextek

Stratify

Teratext

 

Vendeurs d’infrastructures et de solutions de gestion de contenu

Recherche présentée comme élément d’une plateforme de gestion de contenu

Hummingbird

IBM

Microsoft (Sharepoint)

Opentext

Oracle

SAP

 

Challengers de milieu de gamme

Offrent des moteurs de recherche assez complets pour des prix raisonnables

Arikus

Copernic (Mamma)

Isysusa

Speedofmind

 

« Search appliances »

Boîtiers « plug and play » de plus en plus populaires mais surtout adaptés aux fichiers HTML et bureautiques classiques

 

Google

Thunderstone

Services hébergées

Service en mode ASP, plutôt adapté aux fichiers HTML

Atomz

Blossom

Crownpeak

 

Solutions bas-coût

Idéales pour les recherches de fichiers HTML et bureautiques classiques

Dtsearch

Innerprise

Ultraseek (Autonomy-Verity)

Youramigo

Mondosoft

 

Open Source

Moins puissants que leurs contreparties commerciales mais bien réalisés et soutenus par une communauté de développeurs

 

ht://dig

Swish-e

Lucene

 
Les clients mettent la pression

 Cette vision figée n’informe évidemment pas sur les enjeux du marché. Il faut comprendre en effet que, depuis 3 ou 4 ans, la situation a changé et que Google en est le principal responsable. En effet, les personnes qui l’ont utilisé durant leurs études ne comprennent pas que rechercher sur l’intranet ne soit pas aussi simple que de rechercher sur le web. Il faut dire que pour ceux qu’on appelle les travailleurs du savoir cette activité est à la fois indispensable et chronophage : indispensable parce que les cabinets d’études s’accordent à affirmer que 80 à 85% de l’information numérique disponible dans les organisations est non-structurée, chronophage parce que, selon IDC, ils consacrent en moyenne 9,5 heures par semaine à la rechercher, soit entre 20 et 25% de leur temps de travail total[1].

L’étude « Global Executive Survey » menée en 2005 sur 7800 managers par Mc Kinsey Consulting[2] nous apprend par ailleurs que 30% des chefs d’entreprise interrogés considèrent qu’il est difficile de trouver l’information utile à la prise de décision.

 Rendre simple ce qui ne l’est pas : l’équation impossible

 Ce dont les utilisateurs n’ont pas forcément conscience c’est que la recherche d’information en entreprise est plus complexe à mettre en œuvre que la recherche sur le web. A cela plusieurs raisons.

Tout d’abord les internautes ont vis-à-vis d’un moteur comme Google des attentes modérées. Même s’ils souhaitent un minimum de pertinence ils ont conscience que les résultats obtenus sont génériques. Autant le Pagerank Google se révèle performant dans un contexte général autant il n’a pas de raison d’être dans une entreprise composée de groupes d’individus pour lesquels la pertinence est relative aux métiers exercés. Ainsi là où les ingénieurs d’une société pharmaceutique auront besoin de retrouver des formules chimiques, les comptables de cette même société voudront pouvoir extraire d’un coup les bilans des dix dernières années et les commerciaux identifier des contacts via l’application de CRM.

Quand l’internaute lance ses requêtes comme autant de bouteilles à la mer le travailleur du savoir sait exactement ce qu’il attend et se sent frustré par le manque de résultats.

Autre problème de taille, celui de la restriction d’accès aux données de l’entreprise. C’est une chose de mettre en place un moteur en open source capable d’indexer des bases documentaires, c’en est une autre que de permettre de rechercher des documents en respectant une politique de droits d’accès. Cela nécessite des réglages pointus, voire des développements supplémentaires pouvant lourdement grever le budget initial d’un projet.

Enfin, et pour faire court, citons aussi le problème de la variété d’entrepôts informationnels présents dans une organisation : fichiers bureautiques, bases de données relationnelles, messageries, annuaires LDAP, documents html présents sur l’intranet, l’extranet et le site web de la société, sans oublier le contenu de systèmes anciens mais toujours fonctionnels de type mainframes ou les bases documentaires de fournisseurs de contenus.

Au final c’est autant de connecteurs qu’il faudra développer pour permettre la prise en compte de ces données hétérogènes par un moteur de recherche.

Google dynamise le marché

 C’est sans doute ce que Google (encore lui) n’avait pas bien perçu il y a 3 ans en lançant son offre de « search appliances ». Ces boîtes noires mixant hardware et software présentées comme le « plug and play » de la recherche d’information connaissent une grande popularité. Normale, la société a cassé les prix et propose son produit à partir de 30000$ là où l’offre de ses concurrents oscille entre 50000 et 1 million de dollars. Google propose même Google Mini, une version bridée à 50000 documents pour 2995$ ; plutôt tentant pour une PME.

Avec cette entrée remarquée Google s’est attaqué au cœur du problème, le prix !

En effet, un moteur de recherche d’entreprise c’était jusque là de nombreuses fonctionnalités, des possibilités de réglages fins, des offres modulaires mais aussi des prestations de conseil en amont, un temps de déploiement pouvant atteindre plusieurs semaines et une maintenance indispensable.

En ramenant le moteur de recherche d’entreprise à sa simple expression Google a donné l’impression que tout cela n’était pas si compliqué et que les éditeurs traditionnels avaient peut-être exagéré la difficulté d’intégration pour améliorer leurs marges.

Si les services marketing de ces sociétés ont forcément joué de ces arguments pour vendre de la prestation il faut reconnaître que c’était à peine amplifié et c’est ce que Google est en train de découvrir. La firme de Mountain View a en effet annoncé en septembre dernier qu’elle créait un programme de partenariat intitulé « Google Enterprise Professional » afin de travailler avec des intégrateurs. Les « search appliances » ne seraient-elles pas si « plugs and play » que cela finalement ?

Malgré tout il faut reconnaître que si Google a appris à ses dépens qu’une diversification était toujours délicate à mener, son arrivée a forcé ses concurrents à se questionner sur leurs offres et à les faire évoluer. C’est ainsi par exemple que Verity a racheté Ultraseek en 2002 afin de proposer un produit d’entrée de gamme. Cà a été aussi pour eux l’occasion d’affûter leurs argumentaires afin d’expliquer pourquoi leurs solutions étaient plus que de simples « appliances » et en quoi cela était important en terme de retour sur investissement.

Angela Ashenden, consultante senior chez Ovum, analyse: « le changement que nous sommes en train de voir actuellement est la création de ce que j’appelle le marché de la «recherche simple» (simple search), dans lequel les fonctionnalités fournies ne sont pas les plus perfectionnées mais sont évolutives et faciles à déployer et à maintenir. (…) Il y aura encore besoin de technologies telles que celles fournies par Autonomy et Verity, mais leur prix sera remis en question (…) Cette acquisition donne à la nouvelle compagnie une position renforcée (…) et lui offre peut-être sa meilleure chance de rester dans la course. »

 IBM, Oracle et Microsoft se positionnent

 Rester dans la course face à Google reste donc envisageable pour les acteurs traditionnels du marché tant que ce dernier ne décide pas de racheter une société proposant un moteur de recherche perfectionné. L’inquiétude pour eux vient surtout d’acteurs dont la puissance est sans doute pour beaucoup dans l’opération Autonomy-Verity. Susan Feldman indiquait dans une interview donnée à Searchmanagement.com au moment du rachat « qu’elle serait surprise qu’il n’y ait pas plus de consolidation (…) Les « large players » arrivent sur le marché et la recherche d’information est un élément indispensable de toute architecture informatique (…) tous les grands acteurs des systèmes d’information sont en train de doter leurs plateformes d’un module de recherche ».

Ainsi comme on l’a vu les mouvements stratégiques sont patents. IBM par exemple, semble maintenant réunir toutes les briques nécessaires à la fourniture d’une offre modulaire permettant de répondre au mieux aux besoins de ses clients.

L’offre d’Oracle incluant Matchpoint de Triplehop n’est pas encore au point mais elle completera, voire remplacera, Oracle Text. Difficile en revanche de savoir si, comme Omnifind, elle sera fonctionnelle en dehors de l’environnement de l’éditeur.

Seul Microsoft semble être une fois de plus en panne sur ce marché. La société intègre bien sûr des fonctionnalités avancées de recherche sur son portail collaboratif Sharepoint Server et a présenté cette année son Desktop Search Engine. Pourtant même si on se doute que le géant de Redmond a des ambitions, ses annonces entretiennent le flou. Ainsi après avoir clamé en début d’année que Vista, son nouveau sytème d’exploitation, intègrerait de puissantes fonctionnalités de recherche la société a prévenu récemment qu’elles ne seraient sans doute pas disponibles fin 2006, date programmée de sa sortie.

 Nouvelles tendances des moteurs de recherche d’entreprise

Si les alliances et les rachats sont une manière de résister, l’innovation en est une autre. 2005 a sans conteste été l’année de la prise en compte des besoins de l’utilisateur final via la mise à disposition des fameux moteurs de recherche personnels (« desktop search »). Biens que des outils comme DTsearch ou Armadillo existent depuis plusieurs années ils restaient confinés dans le petit cercle des professionnels de l’information. Ce qui est nouveau c’est que les « majors players » n’hésitent plus à développer ou à racheter ces solutions. Pourquoi cet engouement ? La raison en est simple, outre le fait qu’ils répondent à un besoin réel des utilisateurs[3] ils sont considérés par ces sociétés comme un « pied dans la porte » indispensable : séduisez les employés par un logiciel de productivité personnelle performant et vous jouirez d’une image de marque susceptible d’influer sur le choix de plateformes plus conséquentes.

Par ailleurs n’oublions pas que ces solutions, souvent gratuites, sont aussi des supports publicitaires générant un revenu non négligeable.

2006 devrait donc voir apparaître de nouveaux moteurs de recherche personnels mais aussi se généraliser des fonctionnalités encore à l’état de tendances (voir encadré). Citons pêle-mêle la recherche floue, l’extraction et le classement automatique de noms de personnes ou d’entreprises, des fonctionnalités de text-mining, la création de requêtes implicites en fonction du contexte de l’utilisateur, le langage naturel ou encore la recherche distribuée (P2P). Mais la tendance forte pourrait encore une fois venir du web et notamment de ce qu’on appelle dorénavant les « folksonomies », téléscopage de l’anglais « folks », les gens, et du terme taxonomie. L’expression désigne une manière de classer l’information à plusieurs et de faire ainsi émerger un vocabulaire spécifique aux différents métiers d’une organisation. Ces folksonomies ne remplaceraient évidemment pas les moteurs de recherche mais pourraient permettre de mieux cibler des requêtes en les couplant à un système de classification à facettes.

Gageons qu’avec ce potentiel d’innovation et l’ensemble des mouvements stratégiques qui agitent ce marché l’année 2006 devrait encore se révéler passionante.

 

L’innovation dans les moteurs de recherche d’entreprise : paroles d’expert

Voici les réponses de 3 experts que nous avons interrogé à la question suivante : Quels sont d’après vous les prochains grand challenges (techniques, commerciaux,…) pour les éditeurs de moteurs de recherche d’entreprise :

Susan Feldman
, Research Vice President Content Technologies d’IDC : « Les challenges techniques de l’année à venir sont d’unifier l’accès à des formats multiples répartis dans des lieux de stockage variés, rechercher à la fois dans des données et du contenu et devenir plus « interactifs ». Dans le champ technique pure les solutions « pure players » sont loin devant leurs concurrents »

Avi Rappoport, consultante spécialisée (www.searchtools.com): « Je dirais l’extraction de noms propres automatique (entity extraction), l’association automatique de métadonnées, la possibilité de fractionner un document multi-thématique en sous-documents, la prise en compte des documents multimedias et l’intégration avec les systèmes de gestion de contenu. »

 
Martin White, rédacteur de l’Enterprise Search Guidebook 2005 (www.freepint.com) :

« - Rendre l’intégration plus simple
- Pouvoir chercher en même temps dans des données non-structurées et structurées. C’est actuellement possible mais peu convaincant
- Pouvoir chercher de manière plus précise dans des documents multimedias
- Convaincre les organisations des bénéfices apportés par un moteur de recherche performant »


Sites ressource :

CMSwatch : http://www.cmswatch.com/

Information Today : http://www.infotoday.com/

Search Tools: http://www.searchtools.com/

Freepint: http://www.freepint.com/

 

[1] The Hidden Costs of Information Work. Susan Feldman Joshua Duhl, Julie Rahal Marobella and Alison Crawford. IDC White Paper 05c4405A, Mars 2005.

[2] The Global Survey of Business Executives , July 2005

 [3] 94% des personnes interrogées dans l’enquête Forrester citée plus haut classent les technologies leur permettant d’améliorer leur poste personnel comme les plus importantes pour leur activité

 

Commentaires

1 - Lien croisé

Actu'live - Actu'live - WIW2.COM, L'actualité du web 2.0 : "2006, année charnière pour les moteurs de recherche d entreprise?"

 


Anonyme | Le Samedi 04/03/2006 à 15:53 | [^] | Répondre

2 - Lien croisé

Flux RSS - Outils Froids : "Envoyer l'article2006, année charnière pour les moteurs de recherche d entreprise?Par Outils Froids Le 05.03.06 à 10:49Tags : infos, resso"

 


Anonyme | Le Mardi 07/03/2006 à 16:12 | [^] | Répondre

3 - Lien croisé

2006, année charnière pour les moteurs de recherche d entreprise? - glump : " -dessous un article que j'ai rédigé pour Veille Magazine de Janvier 2006:2006, année charnière pour les moteurs de recherche Sun, 05 Mar 2006 09:49:29 -0000 Source: http://www.outilsfroids.net/news/1206.shtml To unsubscribe from this feed, click here To manage other subscriptions, click "

 


Anonyme | Le Mercredi 08/03/2006 à 17:20 | [^] | Répondre

4 - Lien croisé

mondosoft - Sujets chauds : "2006, année charnière pour les moteurs de recherche d entreprise?" rel="nofollow"

 


Anonyme | Le Dimanche 13/08/2006 à 18:34 | [^] | Répondre

5 - Lien croisé

autonomy - Sujets chauds swicki - powered by eurekster : "OF - 2006, année charnière pour les moteurs de rec..."

 


Anonyme | Le Samedi 27/01/2007 à 01:35 | [^] | Répondre

6 - Lien croisé

Descripteurs: De retour de Londres : Online 2008 : ">Retour sur l’intervention de Theresa Regli de CMS Watch. CMS Watch est une société américaine d’analyse technologique, indépendante des éditeurs. La société poursuit ses investigations du marché des Vendeurs de solutions technologiques et a repris en l’adaptation, le « découpage » proposé en 2006 (voir Outils froids en 2006)"

 


Anonyme | Le Samedi 06/12/2008 à 14:39 | [^] | Répondre

 

Nuage de mots-clés des articles