comment l'IA transforme le journalisme

Trouver le bon titre est l’une des choses les plus frustrantes du journalisme. Synthétique et brillant, honnête et capable de séduire le lecteur sans céder – mais à l’époque d’Internet, c’est maintenant une chimère – du plus facile à cliquer. Selon certains, aucun journaliste ne devrait commencer à écrire sans en avoir une en tête. La bonne nouvelle est que l’intelligence artificielle pourrait bientôt nous donner un coup de main; Ce qui est moche, c'est que cela ressemble à un clou supplémentaire sur le cercueil d'un commerce qui risque de plus en plus d'être remplacé par des robots. En fait, cela se produit déjà.

Comment pouvez-vous être sûr que c'est vraiment un être humain, et non une machine, qui a écrit cet article? Que se passe-t-il lorsqu'un certain arrangement de mots, ou à la répétition d'expressions familières, se désintègre et laisse la place à l'ordre arbitré par un algorithme? Ce ne sont pas des questions vaines, car, comme le dit Matt Carlson, auteur de "The Robotic Reporter" -, plusieurs grands journaux utilisent déjà le mécanisme de l’apprentissage automatique pour transformer les données en contenu journalistique, pratiquement en temps réel.

Getty Images

Cela se produit, pour le moment, presque exclusivement dans le secteur de l'information financière. Là où les histoires sont pleines de chiffres et de formules répétitives, et déjà les articles écrits par des journalistes en chair et en os semblent – avouons-le – produits par un algorithme. À tel point que Bloomberg a été l’une des premières entreprises à mettre en œuvre les logiciels qui les ont produits. Mais il y a aussi Forbes, qui dans la version américaine utilise un programme d'intelligence artificielle appelé Bertie, qui fournit aux journalistes un premier brouillon des nouvelles à développer.

Grâce à un programme de reportage appelé Heliograf, le Washington Post a publié plus de 850 articles en 2018 et a remporté un prix intitulé "Excellence dans l'utilisation des robots", pour son travail en vue de l'élection présidentielle de 2016. Le journal appartenant à Jeff Bezos tient toutefois à faire savoir aux gens qu'il souhaite utiliser ce système uniquement pour que ses signatures fonctionnent, pour le rendre plus léger et surtout pour ne pas les remplacer. En outre, Heliograf peut parcourir les moteurs de recherche et le Big data pour identifier des tendances particulières et avertir le rédacteur qu'il existe une histoire potentielle à développer. Mais pour le moment, les générateurs automatiques d'articles de journaux sont restés essentiellement un genre satirique sur Facebook: jamais entendu parler de Concita parler de la Coupe du monde?

Getty Images

En ce qui concerne les titres, qui sont de vrais textes miniatures, l'impact de l'IA pourrait être plus immédiat. Le magazine Axios en parle, qui a été le premier à tester un logiciel récemment créé par Primer, une startup qui fonctionne avec l'IA. Le journaliste Kaveh Waddel a joué le rôle de cobaye en proposant quatre articles précédemment écrits au logiciel. Ceux-ci portaient les titres suivants: "Découvrir la vérité sur l'IA secrète du gouvernement"; "La guerre des acquisitions de l'IA"; "Les métayers de l'IA"; "La recherche désespérée de fosses communes au Liban". Dans l’expérience, l’algorithme Primer avait pour tâche d’inventer des titres sans en connaître les originaux. Voyons voir comment ça s'est passé.

Les deux premiers titres générés par ordinateur sont terribles, quelle que soit la norme journalistique que vous lisiez: "IA et surveillance"; "Comme les sociétés d'intelligence artificielle ouvrent de nouveaux espaces depuis 2010". Le premier, en particulier, manque clairement de planéité et de généralité, et un stagiaire novice pourrait faire mieux. La seconde est trop longue, déroutante et pas du tout attrayante. Les deux autres – "Les nouveaux métayers"; "Souvenirs manquants de Beyrouth" – ils sont acceptables. Certainement pas capable de déplacer le lecteur comme un titre de Il Giornale ou Libero (des journaux qui, si nous y réfléchissons, semblent n'exister que sur les tableaux indignés des réseaux sociaux), mais au moins passables pour une séance de remue-méninges à la rédaction.

Getty Images

Pour enseigner l'algorithme à écrire, ceux de Primer ont traité plus d'un million d'articles de presse ainsi que les titres auxquels ils étaient associés. Une seule règle à suivre: ces titres devaient être entièrement composés de mots déjà présents dans l’article. (Une règle qui, après tout, au moment de l'optimisation des médias sociaux, tous les journalistes ont déjà appris à respecter, même s'ils ne sont pas des techniciens). Une fois formé à l’utilisation de formules mathématiques et statistiques complexes, l’algorithme Primer était capable de lire n’importe quel article et de rassembler le meilleur ensemble de mots pour le transformer en un titre cohérent. Le premier pas a été fait.

Ce n'était pas le plus important, cependant. Le coordinateur du projet, John Bohanon, a réalisé une sorte de "test de Turing" pour l'algorithme, en soumettant à un jury de journalistes professionnels un ensemble de titres – à moitié créés par l'ordinateur et à moitié créés par des êtres humains – sans lui dire ce que le le premier et le second: à la fin, donné à chaque titre un vote (compte tenu de l'efficacité, de la capacité de synthèse et de toutes les autres qualités définissables dans un titre), celui créé par Primer a égalé, ou égalé, ces humains la moitié des cas.

Getty Images

Mais, en moyenne, les titres créés par l'homme ont atteint une note légèrement supérieure à celle générée par l'IA. Cela dépasse les difficultés objectives de distinguer l’un de l’autre. La chose qui intéresse le plus les chercheurs est que, quelles que soient les variables saisies dans le logiciel, les titres générés par ordinateur sont toujours différents de ceux générés par les humains. En tout état de cause, il ne suffit pas d'inquiéter immédiatement les journalistes. Le langage des clients est encore trop compliqué.

Aujourd'hui, il est peu probable que la phase d'invention des titres soit un plaisir pour la créativité de l'auteur. C’est un processus qui est souvent forcé de cynisme, car il s’agit de suivre les milliers de règles de positionnement idéales pour les moteurs de recherche et pour Facebook: il faut prendre en compte les mots "googlé" à un moment précis, leur longueur, leur capacité Il est vrai que, dans les journaux papier, il existe encore d'importantes exceptions (presque toutes, hélas, dans le secteur des tabloïds papier qui font de l'actif un effet de choc plus précieux, et pourtant ce monde nous a également donné des titres mémorables). Pour être honnête, à l'ère de la dictature du référencement, nous sommes fondamentalement un esclave de clickbait, même si nous essayons de le pratiquer décemment et éventuellement sans tromperie. Mais, à ce stade, ne vaudrait-il pas mieux confier cette tâche à une machine?

Getty Images

Cependant, le développement de capacités de lecture et de synthèse de texte à l'aide d'algorithmes pourrait avoir d'autres implications plus importantes. Imaginons par exemple un logiciel permettant de résumer une énorme quantité de documents, pouvant aider un étudiant avec son immense bibliographie, ou un avocat sur le point de préparer un procès. Bien sûr, il faut faire très attention à ne pas perdre des détails décisifs, cachés entre les lignes. Pour cette raison, la littérature scientifique présente un avantage certain par rapport à la littérature humaniste, souvent construite sur des nuances et des atmosphères. Cependant, Bohannon en est certain: à l'avenir, les machines nous aideront à disposer de millions de pages en quelques heures. L'important est de faire comprendre à l'algorithme ce qui est vraiment important pour nous.

Le paradoxe, dans les titres ou résumés plus complexes, pourrait être qu'une trop grande capacité de synthèse annulerait l'effet de suspense des titres accrocheurs et des titres non dits de certains essais; dont la thèse finale, comme dans certains jaunes, est moins importante que le chemin emprunté pour y arriver. Le problème avec les machines est peut-être qu'elles risquent d'être trop honnêtes et trop intelligentes.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *