Google manipule ses algorithmes plus qu'on ne le croit

On estime qu'environ 63 000 recherches sont effectuées sur Google chaque seconde. La précision des résultats proposés et la commodité avec laquelle vous pouvez trouver pratiquement tout ont fait de Google le moteur de recherche le plus utilisé au monde. Alphabet, la société qui le gère, détient essentiellement le monopole de la recherche en ligne, avec un pouvoir sans précédent parmi les sociétés Internet. En bref, Google détermine ce que nous savons du monde et de ce qui reste inconnu: la société affirme que ce sont ses algorithmes qui décident quoi afficher sur les pages de résultats, mais une longue enquête récemment publiée dans le Wall Street Journal révèle que les choses fonctionnent différemment: En plus des automatismes, de nombreuses interventions humaines ont pour but «d'ajuster» les réponses fournies quotidiennement par Google à des milliards de personnes.

Le fonctionnement des algorithmes de Google a toujours été gardé secret, un peu à la manière de la recette Coca-Cola, par crainte d'être imité par d'autres. La société affirme également qu'il est essentiel de ne pas révéler ses fonctionnalités pour empêcher toute personne d'en profiter pour donner plus d'importance à son site. Google indique que le système qui exécute son moteur de recherche est automatique et ne prévoit pas "d'intervention humaine pour collecter ou organiser des pages de résultats".

L'article du WSJ jette le doute sur ces affirmations, expliquant qu'il a mené plus de 100 entretiens et effectué de nombreux tests sur le moteur de recherche. Les auteurs de l'enquête ont conclu que, avec le temps, Google est devenu "plus actif pour décider de la manière dont les informations devraient apparaître" dans les résultats. En 2018, la société a apporté 3 200 modifications aux algorithmes de son moteur de recherche, ce qui représente une augmentation significative par rapport à l'année précédente, alors que les modifications avaient été d'environ 2 400. Les données représentent un nombre très important d'interventions, si l'on considère qu'en 2010, les changements avaient été de l'ordre de 500.

L'augmentation, dit Google, est justifiée par le fait que l'utilisation du moteur de recherche a changé ces dernières années: les gens se sont habitués à demander des informations en utilisant des phrases entières et non plus des clés de recherche individuelles, nécessitant de nombreuses modifications aux algorithmes pour les rendre plus précis.

Complétion automatique
Google active depuis longtemps une fonction qui suggère les mots à saisir lors d’une recherche, sur la base de ceux déjà écrits et d’autres informations concernant l’utilisateur, telles que sa localisation géographique et les recherches effectuées antérieurement par d’autres personnes qui: utiliser Google. Le système rend la recherche de contenu plus rapide, mais selon le WSJ, il est soumis à une modération constante, avec une intervention humaine pour empêcher que des mots inappropriés ne soient suggérés ou qui ne soient offensants. Comparé à d'autres moteurs de recherche, tels que Bing (Microsoft) et DuckDuckGo, Google semble appliquer une modération beaucoup plus cohérente dans son système de saisie semi-automatique.

La comparaison entre une recherche effectuée sur Donald Trump entre Google et DuckDuckGo est assez exhaustive pour le réaliser. Si vous écrivez "Donald Trump is" sur Google, les suggestions ne sont pas choquantes, tandis que sur l’autre moteur de recherche, les mots suggérés pour compléter la phrase sont "un imbécile" ou "un idiot" (les suggestions sur DuckDuckGo semblent avoir été supprimées pour certains). touches de recherche dans les derniers jours). Plus les gens recherchent Trump en l'associant à des mots offensants, plus ils devraient être suggérés dans le système de saisie semi-automatique, car ils sont plus fréquents. Selon le WSJ, l’activité de modération irait au-delà de cas très évidents comme celui-ci, conditionnant efficacement la façon dont nous cherchons en ligne et nous donnant une idée de ce que les autres recherchent.

L’achèvement automatique a été mis au point en 2004 par Kevin Gibbs, un développeur de Google, qui a ensuite déclaré qu’il était confronté au choix de modérer le contenu suggéré, précisément pour éviter l’apparition de contenus inappropriés. Gibbs a expliqué au WSJ que, laissant le système sans restriction, il pouvait arriver que des mots-clés tels que "Britney Spears" soient immédiatement suggérés par des mots liés à des actes sexuels ou à des parties intimes. Il était donc nécessaire d’intervenir pour réduire le problème en introduisant des listes de mots interdits (listes noires) qui ne figuraient pas dans les suggestions.

Sur ces aspects, Google n'a jamais révélé beaucoup d'informations, affirmant à plusieurs reprises qu'il n'existait pas de véritable liste noire pour certains types de mots. Une porte-parole a expliqué au WSJ qu'ils ne sont pas habitués à restreindre l'accès à certains types d'informations, par exemple liés à la politique, mais n'a pas fourni beaucoup d'autres détails.

Une intervention substantielle, et qui semble confirmer la présence de limitations dans l'achèvement, a toutefois intéressé Google en 2012, lorsque la société a conclu un accord confidentiel avec les autorités françaises pour limiter la présence de certains mots suggérés et imputables à l'antisémitisme. Le mot "Juif" a été suggéré par exemple lors de la recherche du nom de certains politiciens français, évidemment parce que de nombreux utilisateurs recherchaient des informations de ce type. Dans ce cas, Google a consenti à "atténuer de manière algorithmique" les suggestions automatiques, en veillant à ce qu'elles n'apparaissent pas de ce type.

Ces dernières années, Google a maintenu une plus grande transparence sur la question, clarifiant pour supprimer les "réclamations dénigrantes". La société a également ajouté une description dans ses propres conditions d’utilisation dans laquelle elle explique que les suggestions ne sont pas présentées dans les cas où elles peuvent impliquer: "Harcèlement, intimidation, menaces, descriptions sexuellement inappropriées ou dans le cas d’une suggestion qui pourrait rendre publique des informations privées et sensible ".

Pages de résultats
La page de résultats d'une recherche Google est pour la plupart des gens la passerelle vers Internet, l'endroit où tout commence et se termine souvent, sans un clic sur l'un des liens rapportés. Selon le cabinet d’études Jumpshot, 55% des recherches effectuées sur des appareils mobiles sur Google n’ont pas conduit à des clics ultérieurs en septembre dernier, ce qui a limité le moteur de recherche. Cela découle du fait que ces dernières années, Google a commencé à fournir des réponses directes aux utilisateurs, avec des aperçus et des informations tirés des milliards de sites figurant dans ses index. La distribution d'une série télévisée, les prévisions météorologiques, les prix d'une entreprise à la bourse et une multitude d'autres informations sont affichés directement sur la page des résultats, ce qui décourage grandement les clics sur des sites individuels.

Google estime que le contenu qu'il fournit directement est distinct du reste et peut donc recevoir une attention particulière, avec des modifications fréquentes effectuées manuellement et sans résistance pour ceux qui le demandent, contrairement à la section classique avec des liens vers d'autres sites. Les modifications apportées aux panneaux d'information, celles qui apparaissent à droite dans les pages de résultats (ou au-dessus dans la version mobile de Google), sont récurrentes et les exemples ne manquent pas.

Le WSJ cite l’histoire de la Heritage Foundation, une fondation de droite qui s’était tournée vers Google pour protester contre la définition de "propagande" associée à son film "Unplanned" et affichée dans un des panneaux d’information du moteur de recherche. Le film raconte l'histoire d'une ancienne directrice de Planned Parenthood, une organisation qui aide et protège les femmes en matière d'avortement. Après avoir démissionné, elle a changé d'orientation et est devenue anti-avortement. Après la manifestation, Google a présenté ses excuses à la Heritage Foundation et a supprimé le terme "propagande".

Blacklist
Outre les limitations de complétion automatique, le WSJ indique l'utilisation de listes noires par Google au moins dès les premières années suivant l'an 2000. À l’époque, des listes de sites contenant du spam avaient été créées et devaient donc être supprimées des index des moteurs de recherche ou beaucoup moins évidentes dans les pages de résultats (la plupart des utilisateurs ne vont jamais au-delà de la première page).

Les listes noires sont gérées par un groupe restreint d’employés qui s’organisent pour s’organiser et se contrôler mutuellement: un changement est signalé par un employé mais doit ensuite recevoir l’approbation d’un collègue avant d’être opérationnel.

Le WSJ a obtenu un document datant de l'été 2018 décrivant les règles à suivre pour bloquer les sites Web qui désinforment, afin qu'ils ne soient pas inclus dans Google Actualités ni dans les autres services de l'entreprise. Parmi les indications, il convient de prendre en compte le manque d'indications claires sur la propriété des produits éditoriaux, en plus de la présence de "contenus trompeurs". Le document indique expressément que: "Le but de la liste noire est d'empêcher ces sites d'accéder à toute recherche de nouvelles et à tout service de produit". Une porte-parole de Google a expliqué que l'ordre dans les résultats n'était pas déterminé manuellement et que pour certains services, tels que Google Actualités, les propriétaires de sites devaient accepter certaines règles concernant le contenu proposé et leur fiabilité.

Ordre des résultats
Être en haut de la page de résultats de Google fait une différence énorme pour les propriétaires de site: c'est l'endroit idéal pour être clairement visible et plus susceptible de recevoir des visites. Les positions sont déterminées par les algorithmes du moteur de recherche, qui reçoivent périodiquement des mises à jour pour améliorer la précision et éviter que quelqu'un en profite, après avoir compris à peu près comment ils fonctionnent.

Google a toujours maintenu que le plus grand secret autour de ses algorithmes est la meilleure garantie pour obtenir des résultats de qualité: si tout le monde savait comment ils fonctionnent, ils se préoccuperaient davantage de la façon dont ils présentent leur contenu que de leur qualité, en essayant de se retrouver dans plus de preuves dans les pages de résultats. Bien entendu, les propriétaires de sites Web essayent la même chose, avec des techniques permettant d'optimiser les performances de leurs contenus par rapport à la façon dont ils sont trouvés et analysés par les moteurs de recherche (SEO).

Selon plusieurs observateurs, Google devrait encore faire preuve de plus de transparence quant à la manière dont il organise ses recherches, considérant qu'il fonctionne essentiellement sous un régime de monopole, laissant très peu de place aux concurrents ne disposant pas de ressources économiques et technologiques comparables.

Les algorithmes de Google sont développés et mis à jour par certains des informaticiens les plus compétents et les plus compétents au monde. Ils sont appuyés par environ 10 000 collaborateurs externes, chargés d’évaluer la qualité des résultats. Chacune d’elles examine des centaines de pages de résultats par jour et indique si l’ordre dans lequel les liens vers les sites sont affichés doit être modifié. Les indications sont ensuite examinées par les gestionnaires de moteurs de recherche, qui décident si et comment modifier les algorithmes.

Le WSJ a recueilli le témoignage de Zack Langley, un homme de 27 ans qui, depuis le printemps 2016, travaille depuis un an comme examinateur des pages de résultats, par l'intermédiaire de la société Lionbridge Technologies, l'une des sociétés qui effectuent ce type de travail. en contrat. Langley a déclaré qu'il n'était jamais entré en contact direct avec Google et qu'il n'avait jamais reçu de retour d'information sur les instructions permettant de modifier l'ordre des résultats pour des recherches particulières. Comme les milliers de ses collègues, Langley a été invité à évaluer les pages de résultats en fonction de divers facteurs, tels que la qualité, la réputation et l’utilité des sites.

Langley a déclaré que parmi les nombreuses choses à évaluer, il avait également affaire à la clé de recherche: "Le meilleur moyen de se suicider". Les résultats ont montré dans les premières places des sites proposant de véritables tutoriels sur le suicide, ce qui, selon Langley, pourrait constituer un danger pour les personnes recherchant des informations de ce type. Il a déclaré que tous les résultats étaient inappropriés, mis à part ce qu'il avait appelé la ligne d'écoute principale et l'aide au suicide.

Peu de temps après l’indication de Langley, Lionbridge a reçu une communication de Google indiquant que le service d’aide devrait être répertorié comme le premier résultat à figurer dans les pages de résultats relatives à la recherche sur le suicide, de sorte que le travail d’évaluation apporterait l'algorithme pour se corriger et donner une preuve maximale de ce contenu. Langley a expliqué qu'à plusieurs reprises, Google avait envoyé à Lionbridge des instructions sur la manière d'évaluer certains sites afin de modifier leur ordre d'apparition dans les pages de résultats.

La société n’a pas nié les faits, mais a expliqué que les demandes adressées aux évaluateurs servent à "s’assurer que tout le monde suit la même approche en général", lorsqu’ils évaluent les pages de résultats. Comme le système n’est pas transparent, certains critiques se demandent si cette solution est appliquée dans d’autres domaines, ce qui conduit à une plus grande pertinence des choix humains que ceux effectués automatiquement par des algorithmes et indiqués comme étant essentiels à la préparation des résultats.

Le WSJ rapporte que les employés de Google eux-mêmes discutent et discutent souvent des réponses fournies par leur moteur de recherche, sur des forums internes également consultés par leurs supérieurs. En 2015, à une époque où il y avait beaucoup de fausses rumeurs sur les vaccins et leur lien présumé avec l'autisme (en raison de l'une des plus grandes fraudes en matière de santé jamais vue), certains employés se sont plaints de ce que "la façon dont les vaccins causent autisme "est venu sur les sites contre les vaccins, et contenant de nombreuses inexactitudes scientifiques. Quelque temps plus tard, la page de résultats a été modifiée et même aujourd'hui, le premier résultat est un site qui répond avec éloquence: "Ils ne me font pas rater le bordel".

Dans certains cas, les modifications semblaient résulter d'un choix délibéré de masquer certains contenus. En 2018, le site d'information conservateur Breitbart, accusé dans le passé de diffuser de fausses informations, a publié une vidéo tournée lors d'une réunion pour les employés de Google, dans laquelle certains des principaux dirigeants de la société ont exprimé leur mécontentement à propos de l'élection de Donald Trump. . Certains employés de la société ont remarqué que cette vidéo n'était visible qu'après avoir atteint la douzième page des résultats sur le moteur de recherche, si l'un d'entre eux recherchait "la vidéo Trump de Google", et ils ont signalé la chose en interne. Peu de temps après le rapport, le contenu est devenu visible dans des positions plus évidentes dans les résultats.

Google a expliqué au Wall Street Journal qu'il pouvait arriver que certains contenus ne reçoivent pas immédiatement les preuves nécessaires et que la société tente de résoudre ces problèmes rapidement et de la meilleure façon possible.

PageRank
Depuis des années, le principe de base des algorithmes de Google est le PageRank, un système qui, selon les fondateurs de la société, Larry Page et Sergey Brin, permet de mesurer "objectivement et mécaniquement" le niveau d'intérêt des utilisateurs et de leurs utilisateurs. concentrez-vous sur le contenu disponible en ligne.

La version originale de ce système prévoyait que l'ordre dans lequel les sites étaient affichés sur la page de résultats était déterminé en grande partie par le nombre de liens dont ils avaient reçu le contenu. Le modèle a été largement révisé au fil du temps et repose aujourd'hui sur plus de 200 algorithmes différents, qui prennent en compte des milliers d'autres détails pour trier les résultats.

Les modifications les plus importantes apportées au PageRank de Google ont été introduites vers 2004, après une discussion de longue date entre les deux fondateurs sur les solutions à adopter pour réduire le spam sur les pages de résultats, à partir de sites liés les uns aux autres afin d'accroître les possibilités. pour finir haut sur les pages de résultats. De nouveaux algorithmes ont été introduits pour résoudre le problème et, surtout, nous avons commencé à accepter en interne le fait que, dans certains cas, nous pouvions intervenir manuellement pour changer les choses.

Comme les responsables de Google eux-mêmes l'ont expliqué au cours de certaines auditions du Congrès au cours des dernières années, en raison de modifications importantes apportées au système déterminant les positions sur les pages de résultats, le "comité de lancement" doit être utilisé, un comité composé de plusieurs dirigeants d'entreprise. . Le processus est assez bureaucratique et les réunions sont souvent très tendues, avec des factions favorables aux changements et d'autres qui permettraient au système de rester aussi proche que possible de la version originale. C'est également pour cette raison que les développeurs essaient de ne pas rester bloqués dans le système et d'essayer des itinéraires alternatifs, en impliquant uniquement lorsque cela est nécessaire le "comité de lancement".

La recette des algorithmes
Même si les critères de fonctionnement de l'algorithme ne sont pas connus, Google fournit néanmoins des informations permettant aux administrateurs de sites de faire ressortir leur contenu, en fonction des clés de recherche. Ces dernières années, Google a par exemple privilégié la "fraîcheur" du contenu, en mettant davantage l'accent sur les informations récemment publiées. Le résultat était la possibilité de trouver plus facilement des informations sur des événements qui venaient de se produire, mais en perdant la possibilité de rechercher un contenu plus ancien dans les archives des sites.

Depuis quelque temps, Google utilise également le temps passé par les utilisateurs sur une page pour détecter la qualité et l’importance. Un utilisateur qui clique sur un lien de la page de résultats, voit le site auquel il fait référence, puis revient rapidement, indique qu'il n'a pas trouvé ce qu'il voulait savoir et que, par conséquent, le contenu de ce site n'était pas aussi pertinent qu'une réponse à une donnée donnée. clé de recherche.

Google collecte une quantité gigantesque d'informations sur plus de 63 000 recherches effectuées sur son moteur de recherche toutes les secondes, et qui sont ajoutées à toutes les données collectées depuis son existence. C’est sur la base de ces informations qu’elle affine ses algorithmes, gère les systèmes d’affichage des publicités et génère des revenus de plusieurs milliards de dollars: 116,3 milliards de dollars l’an dernier seulement, y compris les revenus de YouTube.

Les données deviennent des ingrédients pour la recette de ses algorithmes et leur quantité constitue un avantage concurrentiel incomparable, une des réponses les plus convaincantes pour ceux qui se demandent comment il est possible que Google n'ait pas réellement un concurrent à sa hauteur et opère substantiellement en monopole. dans la plupart des pays où il est actif.

antitrust
Dans les économies avancées, il est inévitable que certaines entreprises deviennent si grandes qu’elles deviennent assimilables à un monopole. Les gouvernements tolèrent généralement cette situation, à condition que les entreprises concernées n’abusent pas de leur position dominante au détriment de la concurrence. C’est la raison pour laquelle Google – à l’instar de Facebook et d’autres grandes entreprises de l’Internet – constitue une surveillance spéciale de la part de nombreux gouvernements et institutions. Ce n’est que ces dernières années que la Commission européenne a détecté un comportement fautif de Google, largement dominant sur le marché européen, qui a imposé des amendes d’un montant supérieur à 8 milliards d’euros. Les litiges sont toujours ouverts, Google séduisant autant que possible, mais montre à quel point le marché de la recherche en ligne est déséquilibré.

Après des années de calme relatif, le consensus entre les démocrates et les républicains s'est également accru aux États-Unis quant à la nécessité d'examiner de plus près les grandes plates-formes, à la recherche de toute pratique empêchant la libre concurrence. Outre les initiatives évaluées par le Congrès, les procureurs généraux de 50 États et territoires des États-Unis ont lancé une enquête antitrust contre Google en septembre dernier, axée principalement sur les pratiques appliquées par la société dans le domaine de la publicité en ligne.

factionnalisme
L'intérêt de la politique découle d'une conviction de plus en plus récurrente chez les républicains, et poussée par Donald Trump et ses collaborateurs, selon laquelle Google travaillerait pour favoriser les intérêts des démocrates, même lorsqu'il s'agissait de rechercher des informations en ligne. Les entreprises de la Silicon Valley sont traditionnellement plus proches des messages progressistes et donc des démocrates, raison pour laquelle les républicains estiment être désavantagés et traités différemment.

Le WSJ, dont l'orientation est traditionnellement conservée et qui appartient à News Corp de Rupert Murdoch, rappelle que le prétendu parti pris de Google est devenu un sujet de discussion depuis l'élection présidentielle de 2016, que Trump a ensuite remportée. À l'époque, les comités et les organisations favorables à Trump et à ceux de son opposant, Democratic Hillary Clinton, ont mis en doute les résultats affichés par Google pour certaines clés de recherche.

Pour répondre aux critiques et essayer d'améliorer ses relations, Google a demandé à son exécutif de rester en contact avec des groupes conservateurs. Depuis lors, la comparaison signifie que l'entreprise gère les demandes visant à équilibrer la présence d'informations ayant des positions politiques différentes. Quelque chose de similaire a été fait en affectant un représentant à Washington aux démocrates et à leurs groupes d'intérêts.

La présence de chiffres de référence de ce type confirme que le travail dans l'organisation du contenu de Google est de moins en moins "mécanique" par rapport aux intentions initiales de ses fondateurs. Cependant, une porte-parole de la société a expliqué au Wall Street Journal que des positions telles que celles activées à Washington existent depuis plusieurs années et qu’elles sont la "chose responsable à faire" pour rester à égale distance.

Grandes et petites entreprises
Selon plusieurs analystes, les algorithmes de Google ont tendance à favoriser les grandes entreprises par rapport aux plus petites, du moins lorsqu'il s'agit de rechercher des produits en ligne. Le WSJ écrit que le choix est délibéré et découle du fait que les clients sont plus susceptibles d’acheter auprès de grandes entreprises, en lesquelles ils ont davantage confiance, en particulier pour ce qui est de confier leurs données, y compris celles de cartes de crédit.

Les grandes entreprises qui font de la publicité sur Google, contribuant à ses revenus de milliardaire, reçoivent des informations et des conseils dédiés non seulement pour améliorer la visibilité de leurs annonces, mais aussi pour vous permettre de mieux connaître leurs sites dans les pages de résultats, parmi les liens à ne pas paiement et où tout le monde devrait concourir au pair. Une source consultée par le WSJ, et qui fait référence à l’une des 500 sociétés les plus riches du classement du magazine Forbes, a confirmé la situation, ajoutant que Google attribue souvent une certaine valeur aux sites plus importants. Amazon, par exemple, est indexé plus fréquemment, de sorte que les innovations entre les produits soient reflétées aussi rapidement que possible dans les pages de résultats.

Cependant, être une grande entreprise ne vous protège pas contre les changements d'algorithmes. En 2014, eBay, l'un des sites d'enchères en ligne les plus utilisés et actif depuis de nombreuses années dans le commerce électronique avec des millions de petits vendeurs, a enregistré une baisse verticale des ventes en raison de certains changements apportés aux algorithmes de Google. Le site a menacé de suspendre ses dépenses publicitaires d'environ 30 millions de dollars en signe de protestation, mais a ensuite décidé de faire plus que tout contre le moteur de recherche afin d'améliorer la situation. Un compromis a finalement été trouvé: en échange d'un engagement de eBay à modifier certains paramètres de ses pages afin de les rendre "plus pertinentes", Google a promis d'améliorer le positionnement de eBay.

Le WSJ et Google
L'enquête WSJ montre que la gestion de Google est beaucoup plus complexe et complexe qu'on pourrait l'imaginer, et que dans certaines circonstances, l'intervention humaine est plus prononcée que ce que Google ne veut nous imaginer.

Au fil des ans, le Wall Street Journal a également maintenu une approche plutôt critique de Google. News Corp, la société propriétaire du journal, a déjà protesté à plusieurs reprises contre le choix de Google de donner moins de preuves aux sites d’information qui demandent le paiement d’un abonnement pour rendre leurs articles visibles ("paywall"). Après une longue confrontation avec News Corp et d'autres journaux, Google a finalement décidé de traiter les sites avec des écrans de paiement comme les autres.

En général, les éditeurs de journaux ne sont pas très satisfaits des politiques suivies ces dernières années par Google. Certains pensent que leur contenu est exploité par le moteur de recherche pour offrir directement des informations aux utilisateurs sur les pages de résultats, ce qui décourage les clics sur leurs sites. La présence sur Google reste l’une des principales sources de trafic pour les journaux en ligne, avec les réseaux sociaux, et est donc stratégique pour la plupart des éditeurs.

Note

Cliquez un nb d’étoiles pour noter

Note moyenne 0 / 5. Nb de votes 0

Aucun vote pour l'instant! Soyez le premier à noter ce post.

fr_FRFrench
fr_FRFrench