Depuis 20 ans que je forme à la recherche d’information en ligne et à la veille web, je dois constater, à regret, que peu de choses ont changé quant à la bonne utilisation de Google.
1er constat : j’entends régulièrement dire « je ne trouve rien sur Google« , mais force est de constater que ceux qui se plaignent ne savent pas utiliser les opérateurs de Google, voire, ne les connaissent pas du tout. Autre problème, notamment chez les documentalistes, l’usage de la logique booléenne (ce qui est bien), en utilisant des opérateurs que Google ne reconnait pas (ce qui l’est moins). Exemple : le « SAUF » ne s’écrit ni SAUF, ni NOT dans Google mais tout simplement – (symbole moins, ➡cf. ci-dessous).
2ème constat : de nombreux jeunes osinters, malgré la nécessité pour eux de maîtriser les Google dorks, sont également très loin d’avoir un usage optimal des opérateurs.
Il y a longtemps que je suis persuadé que savoir bien rechercher dans Google (et les autres moteurs web) pour des professionnels de l’information tels que les veilleurs, documentalistes, ou osinters, n’est pas une simple commodité, mais une compétence métier au sens propre du terme. Nous devons savoir trouver plus vite et mieux que Gégé de la compta, qui s’y connaît en informatique. C’est une composante clé de notre valeur ajoutée et c’est la raison pour laquelle j’ai décidé de refaire un tour d’horizon des principaux opérateurs booléens et de ciblage, afin de réexpliquer quelques basiques et d’indiquer ce qui fonctionne bien ou ne fonctionne plus (parfois depuis longtemps).
Les opérateurs booléens
Les opérateurs booléens sont des mots-clés particuliers, utilisés dans les équations de recherche pour combiner ou exclure des termes dans le but d’affiner les résultats.
Les principaux opérateurs booléens sont les suivants :
AND (ET) : Cet opérateur permet de trouver des résultats qui contiennent tous les termes spécifiés. Par exemple, si vous recherchez « chats AND chiens », vous obtiendrez des pages où les deux mots sont présents.
Sauf que, cet opérateur ne s’écrit pas dans Google, je répète : on n’écrit pas AND dans Google. Pourquoi ? Parce que pour Google (et les autres moteurs web), chaque espace est considéré comme un AND. Donc pour rechercher des résultats contenant « chats AND chiens », on écrit tout simplement : chats chiens
Si vous n’êtes pas convaincu, rendez-vous sur l’interface de recherche avancée de Google et utilisez le premier champ intitulé « tous les mots suivants » pour écrire « chiens chats »,
Puis lancez la requête et regardez comment Google l’a interprétée…
« OK, mais j’obtiens quand même des résultats quand j’ajoute AND entre deux mots« .
Oui, c’est vrai. Le problème, c’est qu’on ne sait pas ce que l’on obtient précisément puisque Google n’a jamais documenté l’utilisation du « AND ». On va donc utiliser des résultats sans comprendre comment ils sont arrivés là. Un peu gênant pour des professionnels de l’info.
OR (OU) : Cet opérateur permet de trouver des résultats qui contiennent au moins un des termes spécifiés. Par exemple, « chats OR chiens » vous donnera des pages qui parlent soit de chats, soit de chiens, soit des deux, car les moteurs web utilisent un OR dit inclusif, et non pas le XOR, dit OR exclusif, qui supprimerait les pages contenant les deux mots.
NOT (NON ou SAUF) : Cet opérateur exclut des termes de vos résultats de recherche. Par exemple, « chats NOT chiens » vous donnera des résultats qui parlent de chats, mais pas de chiens. Sauf que, là encore, Google a sa manière bien à lui d’utiliser le NOT. Il faut utiliser le symbole moins « – » collé au mot que l’on ne souhaite pas voir apparaître dans les résultats, sinon il ne comprend pas. Par exemple :
AROUND(…) : Cet opérateur est utilisé pour trouver des termes qui apparaissent proches les uns des autres dans un texte. La parenthèse permet d’inclure une variable et de spécifier ainsi une distance maximale entre les mots. Par exemple, si vous utilisez la requête :
« chat AROUND(3) souris »
vous obtiendrez des pages où le mot « chat » et le mot « souris » apparaissent à une distance maximale de trois mots l’un de l’autre. Cela peut être utile pour trouver des phrases ou des contextes spécifiques où les termes sont liés, sans avoir à être exactement côte à côte. Par exemple deux mots cités dans la même phrase, le même paragraphe, etc
Expression exacte : La recherche par expression exacte consiste à chercher une phrase ou un groupe de mots exactement comme il est écrit, sans aucune modification ou variation. Cela signifie que les résultats de la recherche doivent contenir cette expression précise, dans le même ordre et avec les mêmes mots. Pour effectuer une recherche par expression exacte, on utilise des guillemets. Par exemple, si l’on recherche « chat noir », on obtiendra des pages qui contiennent exactement cette expression :
Sans guillemets, on a toutes les chances d’obtenir des pages qui, par exemple, citent le mot « chat » dans le premier paragraphe et le mot « noir » dans la conclusion, sans qu’il y ait le moindre rapport entre les deux mots dans le texte. L’exemple ci-dessous n’est pas aussi extrême, mais l’on voit bien que l’expression « chat noir » n’est pas exactement présente dans la page de résultats.
Étonnamment, il s’agit d’un des concepts les plus difficiles à faire passer en formation. Donc, pour simplifier : lorsque vous ne savez pas si vous devez mettre ou non des guillemets, mettez-vous à la place de l’auteur (journaliste, chercheur, écrivain,…) qui aurait pu rédiger les textes que vous cherchez à obtenir via Google :
- Aurait-il écrit exactement « chanson amour » ou « chanson d’amour » ?
 - Aurait-il écrit exactement « Préfecture Marne » ou « Préfecture de la Marne » ?
 - Aurait-il écrit exactement « histoire France » ou « histoire de France » ?
 
Facile non ?
La troncature
Autre source d’erreurs récurrente, la troncature à droite. Cette fonctionnalité, très présente dans les logiciels et plateformes documentaires, permet d’inclure différentes variations d’un mot en utilisant un symbole spécifique, généralement un astérisque (*). Par exemple, une requête avec chat* remontera des pages contenant « chat », « chats », « chaton », « chatons », « chatière », etc.
Cela permet donc de trouver des résultats qui contiennent des mots ayant la même racine. Mais attention : cela n’existe pas (et n’a jamais existé dans) Google.
Il est toutefois facile de se tromper, puisque l’astérisque peut bel et bien être utilisé dans Google, mais pas pour le même usage. En effet, on va s’en servir comme d’un caractère de remplacement pour représenter un ou plusieurs mots manquants dans une phrase ou une expression. Cela permet de rechercher des phrases incomplètes tout en laissant un espace pour un mot ou des mots que vous ne connaissez pas ou que vous souhaitez explorer.
Exemple :
La suite au prochain épisode.
Partie 2 : Les opérateurs de ciblage
Article publié initialement le 06/12/2024, sur LinkedIn.
