Infographie animée par Pat Grivet

"Aucune requête ne doit rester sans réponse"

Pour répondre aux 15 % de nouvelles requêtes émises par jour, l’équipe de Google travaille à l’amélioration quotidienne du moteur de recherche et de ses algorithmes. Afin de fournir des résultats pertinents et de qualité en moins d’une demi-seconde.

4 minutes de lecture

Depuis le premier jour, l’objectif du moteur de recherche Google est de permettre à tous d’accéder à des informations pertinentes et fiables à tout moment et en tout lieu. Pour cela, 20 milliards de sites sont visités chaque jour par les logiciels d’exploration, qui indexent leur contenu. Ces informations sont par la suite organisées dans l’Index Google (qui référence 130 milliards de pages Internet) et triées par degré de pertinence. « C’est la partie la plus importante de notre travail, estime Cathy Edwards, vice-présidente de la recherche chez Google. Elle consiste à organiser et filtrer ces milliards de pages pour trouver la bonne information. »

Pandu Nayak est vice-président, responsable du moteur de recherche. Avec son équipe, il veille à ce que les internautes trouvent des informations dignes de confiance. Sa devise est : « Aucune requête ne doit rester sans réponse. » Pour s’en assurer et que les personnes puissent s’orienter dans la multitude d’informations, l’équipe de Pandu Nayak utilise, entre autres, les mécanismes du classement. « Sans classement, personne ne serait capable de trouver son chemin sur le Web. »

Question de contexte

Plus de 6,9 milliards de requêtes sont effectuées dans le monde chaque jour – soit 80 000 requêtes par seconde – et environ 15 % des requêtes quotidiennes sont nouvelles. Lors de ces opérations, Google trie les pages Web en fonction de divers facteurs tels que la pertinence, la fiabilité et l’actualité. Pour aller plus loin, les ingénieurs de Google ont eu recours à l’intelligence artificielle et mis au point DeepRank. Développé au cours des 5 dernières années dans le but de mieux cerner les subtilités linguistiques et contextuelles des recherches, cet algorithme permet d’apporter les réponses les plus pertinentes possible. Elizabeth Tucker, analyste de données chez Google, précise que « DeepRank est conçu pour mieux identifier et analyser les requêtes et leur contexte. » Par exemple, si vous tapez « lasagne » dans le moteur de recherche, vous pouvez trouver des recettes, les informations nutritionnelles sur ce plat, ou la biographie de Louis Lasagna, un des pères de la pharmacologie. L’outil adaptera les résultats en fonction.

"Sans classement, personne ne serait capable de trouver son chemin sur le Web."

Responsabilité

Développé dès 2010, un autre outil permet aux utilisateurs de gagner un temps précieux, il s’agit d’autocomplete. Cette fonctionnalité intégrée au moteur de recherche permet de compléter en temps réel les termes de la recherche, en fonction des premiers mots que l’utilisateur a commencé à écrire. Pour cela, Google a établi une politique claire et publique en termes de suggestions. « Nous ne voulons pas suggérer de discours haineux, d’appel à la violence ou au racisme, ou encore de messages à caractère sexuel. Nous prenons ainsi nos responsabilités vis-à-vis des utilisateurs », relate Reese Pecot, directrice de la recherche. À la fin des années 1990, lorsque le moteur de recherche a été créé, environ 25 millions de sites Web étaient recherchés pour chaque requête. Aujourd’hui, il y en a plusieurs centaines de millions pour chaque requête, et davantage chaque jour. Toutefois, selon Pandu Nayak, environ 40 % des sites Web sont des spams et certains diffusent délibérément de fausses informations. Afin de fournir un accès continu à des informations fiables, Pandu, Cathy, Elizabeth et Reese et toute leur équipe mettent constamment à jour le moteur de recherche. L’an dernier, 600 000 expérimentations ont été menées et 4 500 améliorations ont été introduites.


Pour en savoir plus, découvrez un extrait du documentaire sur le fonctionnement du moteur de recherche Google.

Dans cette histoire : Recherche, Innovation, Compétences numériques

Histoires associées