Le plus grand changement de l’algorithme de Google ces derniers temps

Google a annoncé l’introduction du BERT, un changement important dans ses algorithmes de moteur de recherche, pour mieux comprendre la signification des demandes que nous écrivons lorsque nous recherchons quelque chose en ligne. Le changement affectera environ 10% des pages de résultats, avec des changements importants dans l’ordre des liens affichés. Google affirme qu’avec le nouveau système, il sera en mesure d’offrir un meilleur service, en particulier lorsque des phrases entières sont utilisées comme clés de recherche, ce qui rend la formulation des demandes sur son moteur de recherche plus naturelle.

BERT est l’abréviation de Bidirectional Encoder Representations from Transformers, un système de traitement du langage naturel (NLP) pour traiter automatiquement les informations écrites (et parlées) dans un langage naturel, c’est-à-dire dans la façon dont nous communiquons couramment. Le système fonctionne grâce à un réseau de neurones artificiels, un modèle informatique qui imite autant que possible le fonctionnement des neurones – les cellules du cerveau – et la façon dont ils communiquent et collaborent entre eux.

La nouvelle solution est basée sur les nombreuses avancées de Google dans le domaine de l’intelligence artificielle ces dernières années. Ses chercheurs ont développé des processus informatiques qui gèrent les mots d’une phrase en les reliant les uns aux autres, au lieu de les gérer individuellement comme c’était le cas jusqu’à présent. Les modèles basés sur BERT ont la capacité de prendre en considération l’ensemble du contexte dans lequel un mot a été utilisé, de le reconstruire et d’analyser les autres mots de la phrase. Ce mécanisme conduit à une interprétation plus précise du sens de la phrase et améliore par conséquent la qualité de la réponse, donnée par les liens sur la page de résultats du moteur de recherche.

La formation de l’intelligence artificielle derrière BERT a pris du temps et de nombreuses sessions. Pour simplifier, les chercheurs ont sélectionné des milliers de phrases significatives écrites en anglais et supprimé au hasard 15% des mots de chacune. Ensuite, ils ont demandé au BERT d’intervenir et d’essayer de reconstruire les phrases, en trouvant les pièces manquantes. Grâce à des millions de simulations, le système a «appris» à comprendre le fonctionnement du contexte dans les phrases et à appliquer les bonnes solutions pour donner un nouveau sens aux phrases mutilées par les chercheurs.

Google affirme que la nouveauté rend la recherche de choses en ligne plus pratique et plus facile, car BERT est plus précis dans la relation des mots entre eux. Avec le système précédent, une demande telle que «le voyageur brésilien 2019 aux États-Unis a besoin d’un visa» aurait été interprétée de manière assez grossière: l’algorithme aurait analysé les mots individuels, décidé lesquels étaient les plus pertinents et, sur la base de ceux-ci, aurait fourni le résultats. Ce faisant, le terme “verset” aurait été sous-estimé, conduisant à des réponses autres que la demande et qui auraient inclus des sites expliquant aux citoyens américains si un visa est requis ou non pour le Brésil.

BERT ne traite pas les mots sans discernement, mais les relie, et est donc capable de comprendre que le «vers» est important et indique une demande spécifique d’un endroit à un autre et non l’inverse. Ce qui est généralement une nuance négligeable pour un algorithme prend une signification beaucoup plus importante, comparable à ce que nous faisons lorsque nous lisons ou entendons ce terme dans une phrase.

Un autre exemple proposé par Google concerne la demande: “Vous pouvez récupérer un médicament pour quelqu’un d’autre dans la pharmacie”. L’ancien système aurait fourni des résultats génériques sur la façon dont les médicaments d’ordonnance sont retirés, tandis que le nouveau système basé sur le BERT parvient à comprendre l’importance de «quelqu’un d’autre» dans la phrase, et fournit par conséquent les résultats sur la façon de collecter les médicament vendu uniquement sur ordonnance pour le compte d’une autre personne.

Google estime que le nouveau changement affectera environ 10% des réponses fournies par son moteur de recherche, un changement énorme et le plus important de son histoire, qui affectera la façon dont nous trouvons les réponses. Le système peut également être utile pour Google Assistant, l’assistant vocal qui fournit directement des informations via Android ou des appareils “intelligents” pour la maison.

BERT fonctionne pour l’instant en anglais et n’est entré en service qu’aux États-Unis, mais Google est confiant de l’étendre à de nombreux autres pays au cours des prochains mois. L’un des avantages de la reconnaissance du langage naturel à travers les réseaux de neurones est que les systèmes s’adaptent facilement à d’autres langages, sans nécessiter de changements importants dans leurs algorithmes.

Comme cela se produit toujours dans ces cas, Google n’a pas fourni beaucoup d’autres informations sur les modifications apportées aux systèmes qui font fonctionner son moteur de recherche. L’ensemble complexe d’algorithmes qui interprètent et gèrent la hiérarchie des liens sur les pages de résultats est secret, un peu comme la recette complète de Coca-Cola. De cette façon, Google estime qu’il est plus difficile pour certains gestionnaires de sites de profiter des concurrents, en essayant de prévaloir sans offrir un contenu de qualité (ceux qui arrivent plus haut sur la page de résultats ont une plus grande visibilité et plus de chances de générer du trafic).

Google modifie périodiquement ses algorithmes, insérant des corrections et ajustements qui ne sont pas toujours annoncés et passent parfois inaperçus. La société a toutefois expliqué que dans ce cas, la nouveauté est plus importante que d’autres et qu’elle peut être considérée comme l’une des plus importantes puisqu’elle existe. Google est le moteur de recherche le plus utilisé au monde, avec une part de marché d’environ 92,6%: il gère chaque jour 5,4 milliards de recherches sur le Web.

Note

Cliquez un nb d’étoiles pour noter

Note moyenne 0 / 5. Nb de votes 0

Aucun vote pour l'instant! Soyez le premier à noter ce post.

fr_FRFrench
fr_FRFrench