D’ici 15 ans, 90% des informations pourraient être produites par des robots. Cette prédiction, glissée du bout des lèvres par Kristian Hammond, le dirigeant de Narrative Science, une start-up qui produit des articles de façon automatique, fait froid dans le dos. Les lecteurs font-ils seulement la différence entre les contenus écrits par les journalistes et ceux rédigés par des programmes informatiques? Pas si sûr.
En 2011, les robots écrivant des articles journalistiques étaient encore rares. Désormais, ils sont en ordre de marche. Et ils fonctionnent à merveille lorsqu’il s’agit de compiler des bouts de texte factuel et des données – les scores des matchs sportifs, les résultats financiers des entreprises, la magnitude d’un séisme, les votes obtenus aux élections.
De part et d’autre de l’Atlantique, de plus en plus de médias publient des contenus automatisés.
Branché sur les alertes du centre américain qui surveille les secousses sismiques, il est programmé pour rédiger des papiers en fonction du niveau de l’alerte reçu. Ensuite, le papier est mis dans le système de publication du Los Angeles Times en attente d’une validation humaine. C’est ce qu’il s’est passé lundi 17 mars 2014. A 6h25 du matin, un tremblement de terre secoue la Californie. Trois minutes plus tard, à 6h28, figure déjà sur le site du Los Angeles Times un papier de 700 signes sur le séisme, rédigé par Quakebot, et relu par Ken Schwencke, journaliste et programmateur au Los Angeles Times, sorti de son lit par ce séisme.
“Nous avons l’information, nous la publions en premier, nous informons notre audience. Si nous pouvons l’automatiser, pourquoi s’en empêcher?”, justifie-t-il.
Un rêve de rédacteur en chef?
Dans une rédaction, un robot travaille vite, ne dort pas, ne prend pas de congés et… ne râle pas. “Quand nous avons commencé, nous étions des parias dans cet univers”, reprend Joe Procopio, d’Automated Insights, qui se défend de créer des rédactions low-cost. Pour lui, le système est vertueux: il libère les journalistes d’une partie ingrate de leur travail – par exemple la rédaction de dépêches factuelles – pour leur permettre de se concentrer sur des enquêtes à haute valeur ajoutée ou des reportages qui nécessitent un peu de finesse dans l’approche.
Les limites des robots
Et si les rédactions confiaient aux robots l’écriture des “breaking news” – Facebook peut déjà vérifier les contenus de ses utilisateurs en temps réel alors que ceux-ci partagent 684.478 éléments par minute sur le réseau social -? Voire leur sous-traitaient leur secrétariat de rédaction?
Puisque les robots sont les rois de la compilation de données, il est logique qu’ils puissent servir à monter et éditer des pages imprimées. Cela existe déjà avec The Long Good Read, une expérience menée par le Guardian dont l’objectif est de réussir “à presser quelques boutons pour imprimer un journal” dont le contenu a du sens pour les lecteurs. Le principe? Un algorithme maison, baptisé Ophan, pioche dans les articles les plus vus, les mots clés cherchés par les lecteurs du Guardian et une somme d’autres critères pour sélectionner les contenus à imprimer.
Le Guardian, qui a le goût du défi, a voulu savoir si un robot pouvait aussi écrire des articles très “anglés” et livrer des analyses. Pour ce faire, ils ont développé un autre robot en interne, le “Guardbot”. Bilan de l’expérience? “Nous avons peut-être été un peu trop optimistes”, tempère la rédaction.
Car réaliser des interviews, manier les formules et offrir un récit qui ne soit pas trop “brut de décoffrage” restent des tâches impossibles à automatiser.
Mais la veille et la “curation” d’informations pourraient aujourd’hui être assurés par des robots. Pas question, a tranché Mark Thompson, le patron du New York Times, au moment d’annoncer le lancement de l’application mobile NYT now: “la sélection humaine, et par là, le jugement humain, demeurent fondamentaux… peut-être pas pour tout le monde, mais pour une part importante et qualifiée de notre audience”.
Quand les lecteurs n’y voient que du feu…
Comment les lecteurs jugent-ils les contenus écrits par des robots – qui ne sont pas toujours annoncés comme tels? N’y voient-ils que du feu? Christer Clerwall, un chercheur de l’Université suédoise de Karlstad, a recueilli les réactions de lecteurs face à des articles sportifs réalisés d’un côté par des étudiants en communication et journalisme et de l’autre par des automates.
Dans l’étude qu’il a publiée fin février, il ressort que ces lecteurs ont beaucoup de mal à discerner les contenus produits par humains et ceux rédigés par des robots. Et quand ils font la différence, ils jugent les informations délivrées par les robots “plus justes, plus fiables, plus objectives” que celles des journalistes et que l’écriture robotisée “est perçue comme plus descriptive, plus informative, et plus ennuyeuse” que l’écriture humaine.
C’est vrai qu’un robot ne votant pas, ne déjeunant pas avec ses sources, il ne peut a priori pas se faire manipuler par celles-ci. Du journalisme enfin objectif? Si les lecteurs sondés par l’étude paraissent le croire, la neutralité des robots est un mythe.
Le mythe de la neutralité
Lorsque les ingénieurs conçoivent un programme, ils “font des choix dans les paramètres, basés sur leurs intuitions, or celles-ci ne sont jamais neutres”, expliquent Gilad Lotan, expert des données, et Kelly McBride, de Poynter, lors d’une discussion sur les algorithmes, le journalisme et la démocratie à South by Southwest.
Sur ce point, il n’y a pas de transparence. Aucune charte éditoriale n’indique encore comment sont “paramétrés” ces robots de l’information ni qu’il faille préciser aux lecteurs si un article est écrit par un humain ou non.
Retrouvez dimanche à 12h30 sur France 5 le débat de Médias Le Mag sur les robots journalistes. Et n’ayant pas encore de robot pour ce faire, merci de partager cet article sur les réseaux sociaux s’il vous a plu.
Alice Antheaume
lire le billet>> Read this article in French >>
Algorithms, smart robots which sort loads of information and arrange it according to users’ requests, are entering the newsroom. This automated-manual coexistence already occurs when journalists try to make content “facebookable” or Google-friendly. To do so, they rely on algorithms roughly based on the same principle as those used for displaying “most sent/commented/blogged articles”. Robots took over human for such tasks.
What is the next step? Will such robots become standalone content creators working like online news Trojans? A piece from The Week wonders: “Are computers the cheap, new journalists?” Behind these questions, a software program designed by Narrative Science, a Chicago-based startup, can write articles made up of … comprehensible sentences.
How does it work? An algorithm agreggates data and converts it into articles. Until now, this technology has been effective only for sports pieces. But Narrative Science says that this technology can apply for finance (by scanning companies’ financial accounts) and politics (through opinion polls and election results).
Beware, Journalists… Artificial intelligence researcher Kris Hammond, who has been quoted by The New York Times, predicted that “within five years, a computer will win a Pulitzer Prize”. “For very simple, brief information, automated writing can do the trick”, says Frédéric Filloux, editor or the Monday Note and a professor at Sciences Po School of Journalism. “But for everything else, you have to look at the pole vaulting theory: Everyone can jump 5.9 feet (Editor’s note: with at least a bit of practice), but not many can jump 7.5 feet. That’s the difference between very good and great.”
Not human, no journalistic soul
Alexandre Malsch, a 26-year-old engineer who heads Melty Network, agrees with this view. “A robot will never be able to make a play on words, unless you record all existing wordplays in a huge database… In any case, a robot will never be able to write an article with soul.” And Malsch knows a lot about robots. About thirty algorithms permanently scan his Melty.fr website aimed at teenagers (four million unique visitors). Its goal is to “help” writers produce content in the right format, on the right subject, and at the right time. (Needless to say, there is no point in posting a story about Lady Gaga when the target audience is at school.)
Heading towards all-automated journalism?
In order to be highly visible on internet search engines, the young developer designed a publishing tool called CMS (Content Management System) that has been providing journalists since 2008 with a “practically all-automated” system. What length does the headline have to be to appear among Google’s top hits? “No writer can calculate the optimal length; only a robot can”, says Malsch.
Indeed, in CMS, the robot turns a title to green when it has the right length and to red when it is too long or too short. Same goes for key words used in a title. The writer can suggest three different titles for each content, and the robot gives each one a success rating, so the writer just has to select the title which gets 90 or 95%. In Melty’s CMS, another parameter outsourced to robots is the number of links that a specific article should contain. Robots go further than that: they also say at what time the article should appear online by analyzing a huge amount of data to figure out when the article will be the most visible on Google – something that is totally impossible for a journalist.
This hit-boosting tool is just one example of the automation being applied to publishing systems. It does not touch or change the text (except for the links and titles). “It’s just like a new Word—a tool that helps journalists but doesn’t replace their jobs, interviews, or analysis.”
Putting a human touch into the work of machines
Is this all impressive? Absolutely. Is there any cause for concern? Maybe, but all-automated journalism is certainly not around the corner. “When you see how difficult it is for translation tools to produce relevant results in real time, you realize that it is not going to happen tomorrow,” explains Filloux. All the more so since before a journalist actually starts to write a piece, he or she must collect source material that is far more important than what he or she finally uses… The original volume should be 5-10 times greater than the actual published content.”
As a (paradoxical) result, Malsch and his development team are injecting manual work back into the machines, especially for editing and selecting content, and for forcing the publication of content in real time rather than waiting for the robot to get it out. “As the world is moving forward, human choice becomes increasingly important,” concludes Malsch. “Manual work is regaining currency.”
Note: This article was written by a human being.
>> Read this article in French >>
Alice Antheaume (translated by Micha Cziffra)
lire le billet>> Lire cet article en Anglais >>
Les algorithmes, ces robots intelligents qui trient des tonnes d’informations pour les classer selon la demande des utilisateurs, sont – déjà – les collègues des journalistes. La cohabitation automatique/manuel a déjà lieu lorsque les journalistes tentent de rendre un contenu “facebookable” (visible sur le fil d’actualités de Facebook) ou “Google friendly” (visible sur Google) en utilisant les paramètres des algorithmes. Ou lorsque les éditeurs sous-traitent une partie de la page d’accueil de leurs sites d’infos – de fait, les boîtes avec les articles les plus envoyés, les plus commentés, les plus populaires sont gérées par des robots, non par la main humaine.
Quelle est la prochaine étape? Ces robots vont-ils pouvoir produire du contenu de façon autonome, façon forçats de l’information en ligne? Telle est la question posée par cet article, “les ordinateurs sont les nouveaux journalistes pas chers?“, publié sur The Week. Derrière ces interrogations, un logiciel inventé par Narrative Science, une start-up basée à Chicago, aux Etats-Unis, capable de rédiger des articles en faisant des phrases… compréhensibles.
Comment ça marche? L’algorithme compile des données pour les transformer en articles. Jusqu’à présent, cette technologie n’était opérante que pour le sport. Désormais, Narrative Science assure que le travail peut être fait pour l’économie (en scannant des comptes financiers d’entreprises) et la politique (à l’aide des résultats de sondages, et d’élections). Tremblez, journalistes, “d’ici 5 ans, un programme informatique gagnera le prix Pultizer”, croit Kris Hammond, chercheur en intelligence artificielle, cité par le New York Times.
“Pour certaines informations très brèves, très simples, une rédaction robotisée peut fonctionner”, estime Frédéric Filloux, auteur de la Monday Note et professeur à l’Ecole de journalisme de Sciences Po. “Mais pour le reste? C’est la théorie du saut en hauteur. Sauter 1,80 m, tout le monde peut y arriver (à condition de s’entraîner, ndlr). Mais 2,30 m, qui peut le faire? Voilà toute la différence entre du très bon et de l’excellent.”
Pas d’humain, pas d’âme journalistique
Même avis du côté d’Alexandre Malsch, 26 ans, ingénieur et directeur général de Melty Network. “Un robot ne saura jamais faire un jeu de mots, à moins peut-être de renseigner tous les jeux de mots de la Terre dans une base de données… Dans tous les cas, un robot ne saura pas écrire un article en y mettant une âme”.
Pourtant, les robots, Alexandre Malsch connaît. Une trentaine d’algorithmes scannent en permanence son site aux 4 millions de visiteurs uniques, destiné aux ados (Alexandre Malsch préfère le terme “jeunes”), Melty.fr. Objectif: “aider” les rédacteurs à produire du contenu au bon format, sur le bon sujet, au bon moment – en clair, pas la peine de mettre en ligne un contenu sur Lady Gaga si le public cible de la chanteuse est à l’école au moment où l’article est publié.
Vers le tout automatique?
Afin, donc, d’être le plus visible possible sur les moteurs de recherche, le jeune développeur a imaginé, dès 2008, un outil de publication (CMS, content management system) qui offre du “presque tout automatique” pour les journalistes. Quelle longueur doit faire le titre de l’article pour arriver en premier dans les résultats de Google? “Aucun rédacteur ne peut en calculer la longueur optimale”, reprend Alexandre Malsch, “seul un robot en est capable”. En effet, dans le CMS, le robot met le titre que tape le rédacteur en “vert” quand il fait la bonne longueur, et en rouge quand il est trop long ou trop court. Idem pour les mots-clés utilisés dans un titre. Le rédacteur peut en proposer trois différents pour chaque contenu produit, le robot donne pour chacun un pourcentage de réussite, le rédacteur n’ayant plus qu’à opter pour le titre ayant obtenu 90% ou 95%.
Autre paramètre sous-traité aux robots dans le CMS de Melty: le nombre de liens que doit contenir tel ou tel article. Et, plus poussé encore, l’heure de la mise en ligne de l’article. A quel moment l’article sera-t-il le plus visible sur Google? Le robot peut le savoir, en analysant de multiples données en un instant, pas le journaliste.
Cette machine à booster le référencement est un exemple de robotisation du système de publication. Le texte, pas touche – à part les liens qu’il contient et le titre. “C’est juste un nouveau Word, un outil pour aider les journalistes, mais cela ne remplace en rien leur travail, leurs interviews, leurs analyses.”
Remettre de l’humain dans les machines
Impressionnant? Aucun doute. Inquiétant? Peut-être. Mais le tout automatique n’est pas encore au programme. “Quand on voit la difficulté qu’ont les outils de traduction à donner des résultats pertinents en temps réel, on comprend que ce n’est pas tout à fait pour demain”, dit encore Frédéric Filloux. D’autant que, rappelle-t-il, avant d’écrire un article, un journaliste doit recueillir une matière première beaucoup plus importante que ce dont il se sert au final… Il faut un volume initial au moins 5 à 10 fois supérieur à la publication.”
Résultat – et c’est paradoxal: Alexandre Malsch et ses développeurs remettent du manuel dans leur machine, par exemple dans l’édition et la sélection des contenus, et dans le fait de pouvoir “forcer” la publication d’un contenu en temps réel, plutôt que d’attendre que le robot le pousse. “Plus le monde avance, plus la sélection humaine a l’importance”, conclut-il. “Le fait à la main redevient une valeur.”
NB: Cet article a été écrit par une humaine.
>> Lire cet article en Anglais >>
Alice Antheaume