Donc, Google interfère avec ses algorithmes de recherche et modifie les résultats

Chaque minute, environ 3,8 millions de questions sont dactylographiées sur Google, ce qui incite ses algorithmes à afficher les résultats des tarifs des hôtels, des traitements du cancer du sein ou les dernières nouvelles du président Trump. Ce sont probablement les lignes de code de calcul les plus puissantes de l’économie mondiale qui contrôlent l’accès aux informations sur Internet du monde entier et le point de départ de milliards de dollars de commerce.

Il y a vingt ans, les fondateurs de Google ont commencé à construire ce Goliath en partant du principe que ses algorithmes de recherche pourraient faire un meilleur travail que les humains. Les responsables de Google ont répété à plusieurs reprises – lors de réunions privées avec des groupes externes et dans le témoignage du Congrès américain – que les algorithmes sont objectifs et essentiellement autonomes, sans influence de préjugés humains ou de considérations commerciales.

La société déclare dans un blog: “Nous n’utilisons pas les actions humaines pour collecter ou organiser les résultats sur une page”. Il dit qu’il ne peut pas divulguer de détails sur le fonctionnement des algorithmes, car la société est engagée dans une bataille longue et difficile avec ceux qui veulent profiter des nuances du système. Mais ce message se heurte souvent à ce qui se passe dans les coulisses. Selon une enquête du Wall Street Journal, au fil du temps, Google a de plus en plus repensé et gêné les résultats de la recherche dans une mesure beaucoup plus grande que celle reconnue par la société et ses dirigeants.

Ces actions répondent souvent aux pressions exercées par les entreprises, les groupes d’intérêts externes et les gouvernements du monde entier. Ils ont fortement augmenté depuis les élections de 2016 et l’augmentation de la désinformation en ligne.
Cette évolution de l’approche de Google marque la transition de sa philosophie fondatrice, “l’organisation de l’information du monde”, à une philosophie beaucoup plus active pour décider de la manière dont cette information devrait apparaître.

Plus de 100 entretiens et tests réalisés par la revue elle-même sur les résultats de recherche de Google montrent que:

Google a apporté à ses résultats de recherche des modifications algorithmiques favorisant les grandes entreprises par rapport aux plus petites. Dans au moins un cas, elle a été effectuée pour le compte d’un grand annonceur, eBay, contrairement à sa position publique qui affirme le contraire. La société fait également la promotion de sites Web importants, tels qu’Amazon et Facebook, selon des personnes familiarisées avec le sujet.
Les ingénieurs de Google apportent régulièrement des ajustements dans les coulisses à d’autres informations que la société stratifie de plus en plus sur les résultats de recherche de base. Ces fonctionnalités incluent des suggestions de saisie semi-automatique, des zones appelées “panneaux de connaissances” et “extraits de code”, ainsi que des résultats d’actualités, qui ne sont pas soumis aux mêmes règles d’entreprise qui limitent ce que les ingénieurs peuvent supprimer ou modifier.
Bien qu’il ait déclaré le contraire en public, Google maintient des listes noires, afin de supprimer certains sites ou d’empêcher d’autres sites de faire surface dans certains types de résultats. Ces actions sont distinctes de celles qui bloquent des sites à la suite de demandes émanant de lois américaines ou d’États étrangers, telles que celles impliquant des abus d’enfants ou des droits d’auteur, et des modifications visant à affaiblir les sites de spam qui tentent de tromper les système avec des résultats plus élevés.
Dans la fonction de saisie semi-automatique, la fonction qui prédit les termes de recherche lorsque l’utilisateur tape une question, les ingénieurs de Google ont créé des algorithmes et des listes noires afin d’éliminer les suggestions les plus incendiaires, pour des sujets controversés tels que l’avortement ou l’immigration. obtenu les résultats les plus probants sur des sujets de premier plan.
Les employés et les cadres de Google, y compris les cofondateurs Larry Page et Sergey Brin, n’étaient pas d’accord sur l’ampleur des tâches à effectuer concernant les résultats de la recherche et dans quelle mesure. Les employés peuvent faire pression pour obtenir des commentaires sur des résultats de recherche spécifiques, notamment sur des sujets tels que la vaccination et l’autisme.
Pour évaluer les résultats de la recherche, Google emploie des milliers de contractants à faible coût dont le but, selon l’entreprise, est d’évaluer la qualité du classement par algorithmes. Encore une fois, les contractants ont indiqué que Google avait fourni des commentaires à ces opérateurs pour leur communiquer ce qu’ils considéraient être le placement correct des résultats et avait révisé leurs évaluations en conséquence, selon des sources consultées par le WSJ. Les évaluations collectives des contractants sont ensuite utilisées pour ajuster les algorithmes.

Ce que le WSJ a découvert porte atteinte à l’un des principaux moyens de défense de Google contre les autorités mondiales, préoccupé par la manière dont il exerce son immense pouvoir ou par le fait que la société n’exerce pas de contrôle éditorial sur ce qu’elle montre aux utilisateurs. Les autorités sont notamment préoccupées par les pratiques anticoncurrentielles, les préjugés politiques et la désinformation en ligne.

Loin d’être des programmes informatiques autonomes et ignorants des pressions externes, les algorithmes de Google sont soumis à des manipulations régulières de la part des gestionnaires et des ingénieurs qui tentent de fournir des résultats de recherche pertinents tout en satisfaisant un large éventail de les 30 milliards de dollars de bénéfices annuels de la société mère. Google est maintenant le site Web le plus occupé au monde, dépassant 90% de la part de marché de tous les moteurs de recherche. La capitalisation boursière de la société mère, Alphabet, s’élève à plus de 900 milliards de dollars.

Google a apporté plus de 3 200 modifications à ses algorithmes en 2018 et plus de 2 400 en 2017, contre environ 500 en 2010, selon Google et une source proche du sujet. Google a déclaré qu’aujourd’hui, 15% des recherches portent sur des mots, ou des combinaisons de mots, que l’entreprise n’a encore jamais vus, ce qui met davantage de pression sur les ingénieurs pour qu’ils s’assurent que les algorithmes donnent des résultats utiles.

Une porte-parole de Google a contesté les conclusions du journal en déclarant: “Nous faisons aujourd’hui ce que nous avons toujours fait, fournissons des résultats pertinents à partir des sources les plus fiables disponibles”. Lara Levin, la porte-parole, a déclaré que la société était transparente en ce qui concerne ses directives pour les évaluateurs et ses projets d’algorithmes de comportement.

Dans le cadre de son enquête, le WSJ a testé les résultats de recherche de Google pendant plusieurs semaines l’été dernier et les a comparés à deux moteurs de recherche concurrents, Bing et DuckDuckGo de Microsoft, une entreprise axée sur la confidentialité qui construit ses résultats proviennent de flux syndiqués d’autres sociétés, notamment du moteur de recherche Yahoo de Verizon Communications.

Les tests ont montré de grandes disparités dans la manière dont Google a traité les requêtes remplies automatiquement et certains appellent les résultats définis par “recherche organique” de Google, qui est la liste des sites Web qui, selon Google, sont triés par algorithme en fonction de la pertinence des réponses. requête d’un utilisateur.
Mme Levin, porte-parole de Google, a refusé de commenter les résultats spécifiques des tests WSJ. En général, il a déclaré: “Nos systèmes visent à fournir des résultats pertinents provenant de sources faisant autorité”, ajoutant que les résultats de la recherche biologique en soi “ne sont pas représentatifs des informations rendues accessibles par la recherche”.

Le WSJ a testé la fonctionnalité de saisie semi-automatique, qui, selon Google, s’appuie sur sa base de données étendue d’informations de recherche pour prédire ce que l’utilisateur a l’intention de taper, ainsi que des données telles que son emplacement et l’historique de ses recherches. Le test a montré dans quelle mesure Google n’offre aucune suggestion par rapport aux autres moteurs de recherche.

Taper “Joe Biden est” ou “Donald Trump est” en auto-complétion, Google a proposé un langage de prédiction plus inoffensif que les autres moteurs de recherche. Des différences similaires ont été montrées pour d’autres candidats à la présidence testés par le Journal.

La Revue a également testé plusieurs termes de recherche dans la saisie semi-automatique, à savoir “immigrés” et “avortement”. Les recherches sur Google ont été moins fortes que celles des autres moteurs.

Gabriel Weinberg, directeur général de DuckDuckGo, a déclaré que, pour certains mots ou expressions entrés dans le champ de recherche, par exemple ceux qui pourraient être choquants, DuckDuckGo avait décidé de bloquer toutes ses suggestions de saisie semi-automatique, qu’il prenait de Yahoo. Il a déclaré que ce type de blocus n’était pas activé dans les recherches du journal concernant Donald Trump ou Joe Biden.

Un porte-parole de Verizon Media a déclaré: “Nous nous engageons à fournir une expérience de recherche sûre et fiable à nos utilisateurs et partenaires, et nous travaillons avec diligence pour nous assurer que les suggestions de recherche dans Yahoo Search reflètent cet engagement.”

Selon un porte-parole de Microsoft, “Nous travaillons pour que les résultats de nos recherches soient aussi pertinents, équilibrés et fiables que possible et, en règle générale, nous avons pour règle de minimiser les interférences avec le fonctionnement algorithmique normal”.

Dans d’autres domaines de l’analyse de la revue, les résultats de Google en matière de recherche organique et d’actualités sur un certain nombre de termes chauds et de noms de politiciens ont révélé une présence importante de médias tant conservateurs que libéraux.

Les algorithmes sont dans la pratique des recettes sous forme de code, qui fournissent des instructions pas à pas sur la façon dont les ordinateurs devraient résoudre certains problèmes. Ils ne pilotent pas seulement Internet, mais aussi des applications qui peuplent les téléphones et les tablettes. Les algorithmes déterminent quels amis apparaissent dans les flux d’actualités d’un utilisateur Facebook, quelles publications de Twitter risquent davantage de devenir virales et combien coûte un trajet en Uber aux heures de pointe plutôt qu’au milieu de la nuit. Ils sont utilisés par les banques pour examiner les demandes de prêt, par les entreprises pour rechercher les meilleurs candidats à un emploi et par les assureurs afin de déterminer la durée de vie prévue d’une personne.

Au début, leur pouvoir était rarement mis au défi. Dans Google, en particulier, ses algorithmes ont classé le contenu Web de manière innovante et extrêmement rentable. La société cherchait à rendre le Web utile, en partant du principe que seul le code pouvait permettre de comprendre comment classer les informations.

Mais les personnages inquiétants tentent de plus en plus de manipuler les résultats de recherche, les entreprises tentent de tirer parti du système et la désinformation se propage à travers les plateformes technologiques. Google a été confronté à une version des mêmes pressions sur Facebook, qui a longtemps prétendu qu’il ne s’agissait que de connecter des personnes, mais a ensuite été contrainte de contrôler de manière plus agressive le contenu de sa plate-forme.

Une enquête interne menée en 2016 sur Google avait montré, selon un responsable de Google qui y avait travaillé, qu’entre 0,1% et 0,25% des demandes de recherche renvoyaient des informations incorrectes. C’était un nombre limité en pourcentage mais, compte tenu de l’énorme volume de recherches de Google, il s’élèverait à près de 2 milliards par an.

En comparaison, Facebook devait faire face à une enquête du Congrès américain pour désinformation russe impliquant 126 millions d’utilisateurs. Mme Levin de Google a déclaré que le nombre inclut non seulement des informations erronées, mais également “un large éventail d’autres contenus définis comme inférieurs”. Il conteste l’estimation par le Journal du nombre de recherches impliquées. La société ne révèle pas de statistiques sur les recherches Google.
Google avait réuni une petite équipe d’exploitation pour résoudre le problème, qui s’appelait en interne «Projet Owl». En reprenant la stratégie utilisée auparavant pour lutter contre le spam, les ingénieurs s’efforçaient de mettre en valeur les facteurs d’une page qui sait «autorité». “, abaissant effectivement les pages qui n’ont pas affiché ces attributs.

D’autres plateformes technologiques, notamment Facebook, ont adopté une approche plus agressive en supprimant manuellement les contenus problématiques et en élaborant des règles autour de ce qu’elle définit comme de la désinformation. Google, pour sa part, a déclaré que son rôle “d’indexation” du contenu par rapport au contenu “d’hébergement”, à l’instar de Facebook, implique de ne pas jouer un rôle plus actif.

Un responsable de recherche Google a décrit le problème de la définition de la désinformation comme incroyablement difficile, ajoutant qu’au départ, la société ne souhaitait pas suivre la voie de la recherche d’une solution. Lorsque Google a commencé à s’attaquer à des problèmes tels que la désinformation, il a commencé à laisser place à davantage de plaintes, au point que l’intervention humaine est devenue plus courante, selon des sources proches du dossier, plaçant la société dans l’arbitrage. des questions plus compliquées. Certains changements dans les résultats de recherche pourraient être considérés comme raisonnables, par exemple en renforçant des sites Web fiables tels que la chaîne nationale de prévention du suicide, mais Google a fait peu de révélations quant à la date à laquelle les modifications ont été apportées et pourquoi.

Les entreprises, les législateurs et les annonceurs s’inquiètent de l’équité et de la concurrence sur les marchés où Google est un acteur majeur. Par conséquent, ses activités sont soumises à de lourds contrôles.

Le département de la Justice des États-Unis a ouvert une enquête antitrust plus tôt cette année, dans laquelle les politiques et les pratiques de recherche de Google devraient être au centre des préoccupations. Les responsables de Google ont été appelés à témoigner à deux reprises devant le Congrès au cours des 12 derniers mois pour des raisons de partialité politique. Dans l’Union européenne, Google s’est vu infliger une amende de plus de 9 milliards de dollars au cours des trois dernières années pour pratiques anticoncurrentielles, y compris l’utilisation présumée de son moteur de recherche pour favoriser ses produits.

En réponse, Google a fait valoir qu’il était confronté à une concurrence vive dans un secteur technologique dynamique et que son comportement visait à aider les consommateurs à faire leur choix, sans faire de mal à leurs concurrents. La société fait actuellement appel de décisions contraires au sein de l’UE et a nié toute prétention à un parti pris politique. Google publie rarement des informations détaillées sur les modifications apportées aux algorithmes. Ses initiatives ont tourmenté des entreprises et des groupes d’intérêts, convaincues qu’elles fonctionnaient conformément aux caprices du géant de la technologie.

Dans un changement fortement contesté au sein de Google, les ingénieurs ont choisi d’orienter les résultats afin de favoriser les grandes entreprises par rapport aux plus petites, en se basant sur la motivation selon laquelle les clients étaient plus susceptibles d’obtenir ce qu’ils souhaitaient. qui a plus de points de vente. Un des effets de ce changement a été une poussée vers les produits Amazon, même si les articles n’étaient plus à vendre, selon les personnes qui en auraient entendu parler. Le problème est apparu à plusieurs reprises au cours des années lors de réunions au cours desquelles les responsables de la recherche de Google ont discuté des modifications à apporter aux algorithmes. Chaque fois qu’ils ont choisi de ne pas changer ce changement, la source affirme être au courant des faits.

Les ingénieurs de Google ont déclaré qu’il était largement reconnu au sein de l’entreprise que la recherche était un jeu à somme nulle: un changement qui aide à obtenir un résultat en repousse inévitablement un autre, souvent avec un impact significatif sur les entreprises concernées. . Mme Levin a déclaré qu’il n’existait aucune directive Google prédominante suggérant que les grands sites fassent intrinsèquement plus autorité que les petits sites. “Il est inexact de suggérer que nous n’ayons pas résolu des problèmes tels que les produits abandonnés dont les résultats semblent élevés”, a-t-il ajouté.

De nombreux changements intervenus au sein de Google ont coïncidé avec son évolution progressive, passant d’une société à culture d’ingénierie presque académique à un géant de la publicité et à l’une des sociétés les plus rentables au monde. Les recettes publicitaires – qui comprennent des annonces sur des produits de recherche et d’autres produits tels que des cartes et YouTube – se sont élevées à 116,3 milliards de dollars l’an dernier.

Selon des sources interrogées par le WsJ, de très gros annonceurs ont reçu des conseils directs sur la manière d’améliorer leurs résultats de recherche naturels, un avantage qui n’est pas disponible pour les entreprises qui n’ont pas de contacts sur Google. Dans certains cas, cette aide incluait également l’envoi d’ingénieurs de recherche pour expliquer comment traiter un problème.

“S’ils ont une mise à jour [dell’algoritmo], nos équipes peuvent téléphoner avec elles et les examiner “, a déclaré Jeremy Cornfeldt, directeur général américain de iProspect du groupe Dentsu, qui, selon Cornfeldt, est l’un des principaux clients de l’agence de publicité Google. que l’agence ne reçoive pas d’informations que Google n’a pas partagées publiquement. Parmi celles qu’elle peut révéler, iProspect représente Levi Strauss, Alcon et Wolverine World Wide.

Un ancien dirigeant d’une entreprise Fortune 500 qui a reçu ce type de conseil a déclaré que Google régissait souvent la façon dont il surfait sur le Web et classait les pages relatives au traitement de sites Web volumineux spécifiques. Google met à jour plus fréquemment l’indexation de certains sites tels que Facebook et Amazon, ce qui les aide à apparaître plus souvent dans les résultats de recherche, selon une source proche du sujet.
“Il y a cette idée que l’algorithme de recherche est neutre, qu’il parcourt le Web et qu’il montre ce qu’il a trouvé, c’est un non-sens total”, a déclaré l’ancien dirigeant. “Google traite toujours des cas particuliers”.

Levin, un porte-parole de Google, a déclaré que la pratique de l’équipe de recherche n’était pas de fournir un guide spécialisé aux propriétaires de sites Web. Il a également déclaré qu’une indexation plus rapide d’un site ne garantissait pas un rang plus élevé. “Nous donnons la priorité aux problèmes en fonction de l’impact, pas des relations commerciales”, a-t-il déclaré.

Le marché en ligne d’eBay s’appuie depuis longtemps sur Google pour un tiers de son trafic Internet. En 2014, le trafic s’est soudainement effondré, ce qui a entraîné une baisse de 200 millions de dollars des recettes prévues pour cette année. Google avait indiqué à la société avoir décidé de réduire le nombre de pages eBay qui constituaient une source importante de trafic. Les dirigeants d’Ebay ont protesté contre le retrait de leurs dépenses publicitaires trimestrielles de 30 millions de dollars, mais ont finalement décidé d’augmenter la pression du lobby sur la société, en organisant des réunions entre les employés, les gestionnaires et les ingénieurs de recherche. faits. Un incident similaire avait frappé leur trafic plusieurs années auparavant et eBay s’était assuré que ce lobbying persuaderait Google de donner des conseils sur la façon de résoudre le problème, s’appuyant même sur un ancien employé qui, selon une source, aurait ensuite été embauché par eBay pour rentabiliser ses contacts.

Google a finalement accepté d’améliorer le classement d’un certain nombre de pages qu’il avait dégradées, tandis qu’eBay a mené à bien une étude plus approfondie de son site Web afin de rendre les pages plus “utiles et pertinentes”, a déclaré la source. L’examen a été ardu et coûteux à compléter, a déclaré l’un des participants, ajoutant qu’eBay avait par la suite subi d’autres dégradations sans l’aide de Google. “Nous assistons depuis des années à des baisses importantes et constantes du référencement de Google, ce qui nuit de manière disproportionnée aux petites entreprises que nous soutenons”, a déclaré un porte-parole d’eBay. Le référencement, ou optimisation des moteurs de recherche, consiste à essayer de générer plus de trafic sur les moteurs de recherche pour un site Web. Levin de Google a refusé de commenter sur eBay.

Les entreprises sans le poids d’eBay ont eu des expériences différentes. Dan Baxter se souvient du moment exact où son site Web, DealCatcher, a été impliqué dans un changement d’algorithme de Google. Il était 18 heures le dimanche 18 février. Baxter, le fondateur du site de coupon numérique, avait reçu un appel de l’un de ses 12 employés le lendemain matin. “Avez-vous surveillé notre trafic?”, Demanda l’employé avec frénésie, se souvint Baxter. Il était en baisse de 93% sans raison apparente. Samedi, DealCatcher comptait environ 31 000 visiteurs sur Google. Le lendemain, il était environ 2400. Il avait presque complètement disparu de la recherche Google.

Baxter a déclaré qu’il ne savait pas qui contacter chez Google. Il a donc engagé un consultant pour l’aider à identifier ce qui aurait pu se passer. L’expert a contacté Google directement, sans réponse. Il a ensuite essayé de publier sur un forum YouTube hébergé par un webmaster de Google pour lui demander s’il pouvait s’agir d’un problème technique, mais le webmaster semblait l’exclure. Exactement un mois plus tard, le trafic est revenu inexplicablement, et il ne sait toujours pas pourquoi. “On a l’impression d’être perdu dans le noir, et c’est la partie la plus effrayante de tout”, a déclaré Baxter. Ici aussi, Levin de Google a refusé de commenter.

Au cours des derniers mois, Google a poursuivi ses efforts pour clarifier le fonctionnement de ses services en mettant à jour les informations générales sur son site. À la fin d’octobre, il a publié une nouvelle vidéo intitulée “How Google Search Works”. Jonathan Zittrain, professeur à la Harvard Law School et directeur de la faculté du Centre Berkman Klein pour Internet et la société, a déclaré que Google avait décrit la fréquence ou les moments critiques de son intervention. La motivation de la société, pour laquelle elle ne peut pas révéler ces détails parce qu’elle lutte contre le spam “semble folle”, a déclaré Zittrain, “Cet argument aurait pu avoir un sens il y a 10 ou 15 ans, maintenant”, il a dit: “Cela s’appelle” la sécurité par l’obscurité “, faisant référence à l’idée démodée selon laquelle les systèmes peuvent être sécurisés en limitant les informations relatives à leur fonctionnement.”

Levin de Google a déclaré que “la transparence historiquement extrême a conduit à un renforcement des pires acteurs du marché, au détriment de nos utilisateurs et des propriétaires de sites Web qui respectent les règles”. “Construire un tel service signifie prendre des dizaines de milliers de décisions humaines vraiment compliquées, et ce n’est pas ce que les gens pensent”, a déclaré John Bowers, chercheur au Berkman Klein Center.
Les décisions de Google sont prises par les ingénieurs les plus expérimentés et les mieux rémunérés du monde, dont le travail consiste à gérer des millions de lignes de code complexes. D’autre part, il existe une armée de plus de 10 000 contractuels qui travaillent à domicile et qui sont payés toutes les heures pour évaluer les résultats de la recherche.

Les classements fournis par les contractants, qui travaillent selon un manuel Google de centaines de pages, peuvent indirectement déplacer un site plus haut ou plus bas dans les résultats finaux, selon les personnes qui connaissent le sujet. Et leurs réponses collectives sont mesurées par les dirigeants de Google et utilisées pour influencer les algorithmes de recherche. L’un de ces évaluateurs était Zack Langley, 27 ans, responsable de la logistique d’une entreprise de tourisme à la Nouvelle-Orléans. Langley a obtenu un contrat d’un an au printemps 2016 en évaluant les résultats de recherche de Google par l’intermédiaire de Lionbridge Technologies Inc., l’une des nombreuses entreprises utilisant Google et d’autres plates-formes technologiques pour le travail sous contrat.

Au cours de sa carrière en tant qu’entrepreneur, Langley a déclaré qu’il n’avait jamais eu de contact avec qui que ce soit sur Google et qu’il ne lui avait pas dit comment ses résultats seraient utilisés. Comme tous les évaluateurs de Google, il a signé un accord de confidentialité. Il gagnait 13,50 $ l’heure et travaillait jusqu’à 20 heures par semaine depuis chez lui. Langley, qui travaillait parfois en pyjama, a reçu des centaines de résultats de recherche réels et a été invité à utiliser son jugement pour les évaluer, entre autres facteurs, en fonction de la qualité, de la réputation et de l’utilité.

À un moment donné, Langley s’est dit insatisfait des résultats d’une recherche qui répondait à la question “quel est le meilleur moyen de me tuer”, à laquelle il a répondu en citant “comment faire” des liens semi-manuels. Il a déclaré qu’il avait réduit tous les autres résultats jusqu’à ce que la National Suicide Prevention Lifeline devienne le résultat numéro 1. Peu de temps après, Google a envoyé une note à Lionbridge pour lui dire que la ligne d’assistance téléphonique de l’association était: La prévention du suicide devait être classée comme le premier résultat de toutes les recherches liées au suicide, afin que les classements collectifs des évaluateurs ajustent les algorithmes pour obtenir ce résultat. Il a dit qu’il n’avait jamais appris si ses actions avaient un rapport avec le changement.

Langley a déclaré qu’il semblait que Google souhaitait qu’il modifie le contenu de la recherche afin que Google puisse obtenir ce qu’il appelle un déni plausible pour prendre cette décision. Il a ajouté que les sous-traitants recevaient des notes de Lionbridge qui, selon lui, provenaient de Google et suggérant les résultats “corrects” à appliquer à d’autres recherches. Et il a déclaré qu’à la fin des années 2016, à l’approche des élections, les responsables de Google étaient plus actifs pour dicter les meilleurs résultats, même si ce n’était pas nécessairement pour les problèmes de campagne. “Auparavant, ils avaient une approche non interventionniste, mais ensuite, cela a semblé changer”, a-t-il déclaré.

Levin, porte-parole de Google, a déclaré que la société “a depuis longtemps développé son approche en matière de collecte de commentaires sur ce type de questions, ce qui nous aide à développer des solutions et des fonctionnalités algorithmiques dans ce domaine”. Il a ajouté que dans Google “nous fournissons des mises à jour de nos lignes directrices pour garantir que tous les évaluateurs respectent le même cadre”. Lionbridge n’a pas répondu aux demandes de commentaires.

****
Chez Google, les employés utilisent régulièrement des babillards internes à l’entreprise et un module appelé “Go / Bad” pour appliquer les modifications apportées à des résultats de recherche spécifiques. (Go / bad est un système de génération de rapports qui permet au personnel de Google de générer des rapports. résultats de recherche problématiques.) Un des premiers problèmes est apparu en 2015, selon des personnes familières avec le problème, lorsque certains employés se sont plaints que la recherche sur “comment les vaccins causent l’autisme” avait fourni des informations rapport erroné sur les sites qui s’opposent aux vaccinations.
Au moins un employé avait défendu le résultat, écrivant que Google devrait “laisser les algorithmes décider” des informations à présenter, selon des sources du WSJ. Au lieu de cela, Google a modifié le texte pour que le premier résultat devienne un site appelé howdovaccinescauseautism.com – ce qui a été indiqué sur sa page d’accueil en grosses lettres noires: “Ils ne fument pas” (ne vous en foutez pas!). (La phrase est devenue un membre de Google.). Levin de Google a refusé de commenter.

À l’automne 2018, le site d’actualités conservateur Breitbart News Network a publié une vidéo révélant que les dirigeants de la société, dont Brin et le PDG de Google, Sundar Pichai, avaient été filtrés, a choqué et tourné. au personnel après que Trump ait été élu président deux ans plus tôt. Un groupe d’employés de Google a remarqué que la vidéo apparaissait sur la douzième page de résultats de recherche à la question “La vidéo de Google sur Trump avait filtré”, ce qui semblait indiquer que Google l’enfouissait. Ils se sont plaints sur l’un des panneaux d’affichage internes de l’entreprise, selon des sources au fait des faits. Peu de temps après, la vidéo ayant fui a commencé à apparaître plus haut dans les résultats de la recherche.
“Lorsque nous recevons des rapports sur des produits qui ne se comportent pas comme prévu, nous enquêtons pour voir s’il existe des informations utiles pour éclairer les améliorations futures”, a déclaré Levin.

*****
Depuis la création de Google, Page et Brin savaient que le classement des pages Web était une question d’opinion. “L’importance d’une page Web est une question intrinsèquement subjective, qui dépend des intérêts, des connaissances et des attitudes du [lettori]”, écrivait dans son article de 1998 introduisant l’algorithme PageRank, le système fondateur qui a lancé le moteur de recherche.

Le PageRank, ont-ils écrit, aurait mesuré le niveau d’intérêt et d’attention de l’homme, mais “de manière objective et mécanique”. Ils ont fait valoir que le système mesurerait mathématiquement la pertinence d’un site en fonction du nombre de fois où d’autres sites pertinents l’ont associé au Web.
Aujourd’hui, le classement PageRank a été mis à jour et intégré à plus de 200 algorithmes différents, en accord avec des centaines de signaux, maintenant utilisés par Google. (La société a remplacé PageRank en 2005 par une nouvelle version afin de mieux suivre le trafic considérable que le site attirait. À l’intérieur, il s’appelait “PageRankNG”, apparemment appelé “nouvelle génération”, selon des sources. connaissance du sujet. En public, la société s’appuie toujours sur PageRank et son site Web fait référence à l’algorithme original publié par Page et Brin pour expliquer le fonctionnement de la recherche. “L’intuition originale et la notion d’utilisation de diagrammes lien est quelque chose que nous utilisons encore dans nos systèmes “, a déclaré Levin.)

Au début des années 2000, les spammeurs submergeaient les algorithmes de Google avec des tactiques qui donnaient l’impression que leurs sites étaient plus populaires qu’ils ne l’étaient, faussant ainsi les résultats de recherche. Page et Brin n’étaient pas d’accord sur la façon de traiter le problème.

Selon des sources proches du dossier, Brin s’opposerait à une intervention humaine, affirmant que Google devait fournir les résultats les plus précis fournis par les algorithmes et que ces derniers ne devaient être modifiés que dans les cas les plus extrêmes. Page avait répondu que l’expérience utilisateur était endommagée lorsque les utilisateurs rencontraient du spam plutôt que des résultats utiles.

Google avait déjà entrepris ce que la société appelle des “actions manuelles” contre des sites Web spécifiques qui abusaient de l’algorithme. Dans ce processus, les ingénieurs de Google ont déclassé le classement d’un site Web en modifiant sa “pondération” spécifique. Par exemple, si un site Web était mis à niveau artificiellement en payant par d’autres sites Web pour y créer un lien, comportement que Google désapprouve, les ingénieurs de Google pourraient baisser le contrôle de cette pondération spécifique. La société pourrait également mettre le site sur une liste noire ou la supprimer complètement.

Brin était toujours opposé aux efforts à grande échelle pour lutter contre le spam, car il impliquait encore plus d’intervention humaine. Brin, dont les parents étaient des juifs émigrés de l’ex-Union soviétique, avait également personnellement décidé d’autoriser la présence dans les résultats de la recherche à la question “juive” de sites antisémites, selon des sources du WSJ. Google a ensuite publié un avis de non-responsabilité avec les résultats de cette recherche: “Nos résultats de recherche sont générés de manière totalement objective et sont indépendants des convictions et des préférences de ceux qui travaillent chez Google”.

Finalement, un jour de 2004, dans la salle de bain du siège de Google à Mountain View, en Californie, Page s’adresse à Ben Gomes, l’un des premiers gestionnaires de recherche de Google, pour exprimer son soutien à ses efforts dans la lutte contre le spam. . “Faites tout ce que vous avez à faire”, a déclaré Page, selon une personne familière avec cette conversation. “Sergey va ruiner cette entreprise.” Levin de Google a déclaré que Page, Brin et Gomes ont refusé de commenter.

Après cette conversation, la société a revu ses algorithmes de lutte contre le spam et rendu les règles d’intervention manuelle moins strictes, selon des sources du WSJ. Google a des directives pour changer ses algorithmes de classement, un processus exténuant appelé “comité de lancement”. Les dirigeants de Google ont indiqué ce processus de manière générale dans les témoignages du Congrès lorsqu’ils ont demandé comment ils modifiaient les algorithmes.
C’est comme un processus dans lequel une thèse est défendue et les réunions peuvent devenir très controversées, selon les personnes qui les connaissent bien. Comme ce processus est laborieux, certains ingénieurs tentent de l’éviter s’ils le peuvent, selon une source, et des modifications mineures peuvent parfois être apportées sans l’approbation du comité. Gomes fait partie du comité qui décide d’approuver ou non les modifications, et parfois d’autres gestionnaires de haut niveau y participent également.

Levin de Google a déclaré que chaque modification de l’algorithme n’était pas discutée lors d’une réunion mais “il existe d’autres processus permettant de contrôler les lancements plus simples à différents niveaux de l’organisation”, tels qu’une révision de courrier électronique. “Ces examens impliquent toujours des membres du comité de lancement”, a-t-il déclaré.

Aujourd’hui, Google ne révèle que certains des facteurs mesurés par ses algorithmes. Parmi ceux connus, il y a aussi la “fraîcheur”, qui donne la préférence au contenu nouvellement créé pour la recherche portant sur des sujets tels que l’actualité ou un événement sportif. Un autre facteur est la position de l’utilisateur: s’il recherche des “zoos”, les ingénieurs de Google souhaitent que les algorithmes fournissent le meilleur zoo de la région où il se trouve à ce moment-là. Les signaux linguistiques, c’est-à-dire la façon dont les significations changent lorsque des mots sont utilisés ensemble, tels que avril et poisson, sont parmi les plus importants, car ils aident à déterminer ce que demande réellement l’utilisateur.

Selon un ancien employé de la société, le temps restant sur les pages sur lesquelles ils ont cliqué avant de revenir à Google est un autre signal important. De longs temps de navigation sur un site augmenteraient le classement d’une page. Les rebonds rapides, qui indiquent qu’un site n’est pas pertinent, nuiraient gravement au classement, selon l’ancien employé. Au fil des ans, la base de données Google qui enregistre l’activité de ces utilisateurs s’est transformée en un avantage concurrentiel, contribuant à consolider sa position sur le marché des recherches. En effet, d’autres moteurs ne disposent pas de la quantité de données disponible, comme Google, le leader du marché de la recherche.

Cela rend l’impact de ses décisions opérationnelles immense. Lorsque Pinterest a souhaité être rendu public, au début de cette année, il a déclaré dans le prospectus que “les moteurs de recherche, comme Google, peuvent modifier leurs algorithmes et leurs règles ou appliquer ces règles de manière préjudiciable aux utilisateurs. nous”,

Ces fonctionnalités sont devenues de plus en plus importantes car Google a redoublé d’efforts pour conserver les utilisateurs sur la page de résultats où les annonces sont placées, au lieu de perdre les utilisateurs qui cliquent sur d’autres sites. Selon le cabinet d’études Jumpshot, environ 55% des recherches sur le téléphone portable de Google étaient des recherches sans clic, ce qui signifie que les utilisateurs n’ont jamais quitté la page des résultats.
Deux caractéristiques typiques de la page de résultats, les panneaux de connaissances, qui sont des collections d’informations pertinentes sur des personnes, des événements ou d’autres choses; et des extraits présentés, qui sont des résultats mis en évidence et qui, selon Google, offrent le contenu recherché par un utilisateur, sont les domaines dans lesquels les ingénieurs de Google apportent des modifications pour corriger les résultats, selon wsj.

En avril, la Heritage Foundation, fondation d’idées conservatrices, a appelé Google pour se plaindre du fait qu’un film appelé “Unplanned” avait été qualifié de “propagande” dans un panel de connaissances, selon une source proche du dossier. Le film raconte l’histoire d’un ancien directeur de Planned Parenthood qui a subi une transplantation cardiaque et d’un avorteur devenu pro-vie. Après que la Fondation du patrimoine se soit plainte à un contact de Google, la société s’est excusée et a supprimé la “propagande” de la description, a indiqué la source.
Levin de Google a déclaré que le changement “n’était pas le résultat d’une pression exercée par un groupe extérieur, mais bien d’une violation de la politique en matière de fonctionnalités”.

******
Google est devenu plus ouvert sur sa modération de l’auto-complétion, mais ne révèle pas encore l’utilisation de listes noires. Kevin Gibbs, qui a créé l’auto-complétion en 2004 alors qu’il était ingénieur chez Google, avait initialement développé la liste des termes qui n’auraient pas été suggérés, même s’il s’agissait des questions les plus courantes fournies par les algorithmes indépendants.
Par exemple, si un utilisateur recherchait “Britney Spears” – une recherche populaire de Google à l’époque, Gibbs ne souhaitait pas qu’un morceau d’anatomie humaine ou la description d’un acte sexuel apparaisse lorsque quelqu’un commence à taper le nom du chanteur. Les résultats non filtrés étaient “presque horribles”, a déclaré Gibbs dans une interview.

Il a dit qu’il était difficile de décider ce qui devrait ou ne devrait pas être sur la liste. Je me sentais mal à l’aise et je ressentais beaucoup de pression “, a déclaré Gibbs, qui a travaillé pendant environ un an à l’auto-complétion et a quitté la société en 2012.” Je voulais m’assurer qu’il représentait le monde équitablement et non ne laissant aucun groupe “.

Google maintient toujours des listes de phrases et de termes qui sont manuellement mis à l’index par l’auto-complétion, en fonction des personnes familiarisées avec le sujet. La société possède en interne un “ensemble de politiques clairement défini” sur lesquelles les termes ou expressions pourraient être mis à l’index dans la saisie semi-automatique, et qui suit ces règles, selon une personne familière du sujet. Les listes noires influencent également les résultats de la recherche organique et de Google Actualités, ainsi que d’autres produits de recherche, tels que les réponses Web et les panels de connaissances, selon les personnes qui connaissent le sujet.

Lors de son témoignage devant le Congrès, Google a déclaré de ne pas utiliser de liste noire. Karan Bhatia, vice-président de la politique publique de Google, a demandé lors d’une audience en 2018 si Google avait inscrit sur la liste noire une “entreprise, un groupe, un individu ou un point de vente pour des raisons politiques”. / liste blanche pour influencer nos résultats de recherche “, selon la transcription.
Levin a déclaré que ces déclarations concernaient des listes noires ciblant des groupes politiques, mais que la société ne les conserve pas.
Les premières listes noires de Google remontent au début des années 2000, lorsque l’entreprise avait dressé une liste des sites de spam retirés de l’indexation, selon une source. Cela signifie que les sites n’apparaîtront pas dans les résultats de la recherche. Les ingénieurs appelés “mainteneurs” sont autorisés à apporter et approuver les modifications apportées aux listes noires. Il faut au moins deux personnes pour le faire; l’un fait le changement, tandis qu’un second l’approuve, selon les sources de Wsj.

La Revue a examiné une ébauche du document de politique d’août 2018 qui explique comment les employés de Google devraient mettre en place une liste noire anti-désinformation visant à empêcher certains éditeurs d’apparaître sur Google Actualités et d’autres produits de recherche. Le document indique que les ingénieurs doivent se concentrer sur “un éditeur qui présente de manière erronée des biens immobiliers ou des propriétés Web” et qui a un “contenu trompeur”, c’est-à-dire des sites qui cherchent activement à induire en erreur ceux qui ont un contenu inexact. “Le but de la liste noire sera d’empêcher les sites de figurer dans toute fonction de recherche ou site d’actualités sur les produits”, déclare le site.

 

*******
Les critiques concernant un prétendu parti pris politique dans les résultats de recherche de Google se sont accrues depuis les élections de 2016. Les groupes d’intérêts de gauche et de droite ont assiégé Google de questions sur le contenu affiché dans les résultats de recherche et sur les raisons pour lesquelles les algorithmes de l’entreprise ont été utilisés. renvoyé des informations par rapport à d’autres. Selon des personnes proches du dossier, Google a nommé un dirigeant de Washington, Max Pappas, pour traiter les plaintes de groupes conservateurs. Pappas travaille avec les ingénieurs de Google sur les modifications à apporter lorsque les points de vue conservateurs ne sont pas correctement représentés, selon les groupes d’intérêts interrogés par le Journal, même si cela ne représente qu’une partie de son travail.

“Les conservateurs ont besoin que les gens se tournent vers ces entreprises”, a déclaré Dan Gainor, directeur du Centre de recherche sur les médias conservateur, qui s’est plaint à Google de divers problèmes. La société a également nommé au moins un autre dirigeant de Washington, Chanelle Hardy, pour travailler avec des groupes libéraux extérieurs, selon des personnes proches du dossier.

Levin a déclaré que les deux postes existaient depuis de nombreuses années. Et que Google estime que c’est “la chose la plus responsable à faire” pour comprendre les commentaires des groupes et a déclaré que les algorithmes et les règles de Google ne tentent pas de porter un jugement fondé sur les tendances politiques d’un site Web. Pappas a refusé de commenter et Hardy n’a pas répondu à une demande de commentaire.

Au cours de l’année écoulée, des groupes d’avorteurs se sont plaints de résultats de recherche montrant les sites Web de “centres de crise de grossesse”, des organisations qui conseillent les femmes contre l’avortement, selon des personnes qui connaissent bien le sujet. L’une des organisations à l’origine de la plainte est Naral Pro-Choice America, qui suit les activités des groupes anti-avortement par l’intermédiaire de son département de recherche sur l’opposition, a déclaré la porte-parole, Kristin Ford. Naral s’est plaint à Google et à d’autres plateformes technologiques que certaines des annonces, des messages et des résultats de recherche des centres de crise pour femmes enceintes soient trompeurs et trompeurs, a-t-il déclaré. Certaines des organisations ont prétendu offrir des avortements et ont ensuite conseillé aux femmes de ne pas le faire. “Ils ne révèlent pas leur véritable agenda”, a déclaré Ford.

En juin, Google a mis à jour ses règles en matière d’avortement, précisant que les annonceurs doivent indiquer sur le site s’ils fournissent des avortements ou non. Ford a déclaré que Naral n’était pas informé avant le changement de politique. Levin a déclaré que Google n’a apporté aucun changement à la manière de classer les centres d’aide en cas de grossesse pour les applications d’avortement.

Le WSJ a vérifié le terme “avortement” dans les résultats de recherche organiques 17 jours entre juillet et août. 39% de tous les résultats de la première page contenaient le domaine www.plannedparenthood.org, le site de la Planned Parenthood Federation of America, organisation à but non lucratif en faveur du droit à l’avortement. À titre de comparaison, dans 14% des cas, la première page de Bing et 16% de DuckDuckGo contenaient le lien vers la planification familiale. Levin a déclaré que Google n’avait pas d’exécutions particulières concernant le classement de la parentalité planifiée.La pratique consistant à créer des listes noires pour certains types de sites ou de recherches a alimenté des allégations de partialité politique de la part d’ingénieurs de Google et de publications de droite ayant affirmé avoir vu des extraits de ces listes. Certains des sites Web que Google semble avoir ciblés dans Google Actualités étaient des sites et des blogs conservateurs, selon des documents examinés par le Journal. Dans une liste noire partielle examinée par le Journal, certains sites Web conservateurs et de droite, tels que The Gateway Pundit et The United West, figuraient sur une liste de centaines de sites Web qui n’auraient pas paru dans les actualités ou dans les produits présentés, même s’ils peuvent apparaître dans les résultats de recherche organiques.

Google a répété à plusieurs reprises qu’il ne prenait pas de décisions politiques et les employés actuels et anciens ont signalé au Journal qu’ils n’avaient constaté aucune preuve de parti pris politique. Et pourtant, ont-ils déclaré, les politiques changeantes de Google en matière d’ingérence – et de manque de transparence à cet égard – obligent inévitablement les employés à devenir des arbitres de ce qui est acceptable, un dilemme qui ouvre la porte à des accusations de préjudice ou de favoritisme. Levin de Google a refusé de commenter.

******
Les demandes de changement émanant du gouvernement ont augmenté rapidement depuis 2016. De 2010 à 2018, Google a reçu des demandes de pays, dont les États-Unis, de supprimer 685 000 liens de ce que Google appelle des recherches sur le Web.

Note

Cliquez un nb d’étoiles pour noter

Note moyenne 0 / 5. Nb de votes 0

Aucun vote pour l'instant! Soyez le premier à noter ce post.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

fr_FRFrench
fr_FRFrench