Le boom des robots de l’information

Crédit: Flickr/CC/salforduniversity

D’ici 15 ans, 90% des informations pourraient être produites par des robots. Cette prédiction, glissée du bout des lèvres par Kristian Hammond, le dirigeant de Narrative Science, une start-up qui produit des articles de façon automatique, fait froid dans le dos. Les lecteurs font-ils seulement la différence entre les contenus écrits par les journalistes et ceux rédigés par des programmes informatiques? Pas si sûr.

En 2011, les robots écrivant des articles journalistiques étaient encore rares. Désormais, ils sont en ordre de marche. Et ils fonctionnent à merveille lorsqu’il s’agit de compiler des bouts de texte factuel et des données – les scores des matchs sportifs, les résultats financiers des entreprises, la magnitude d’un séisme, les votes obtenus aux élections.

De part et d’autre de l’Atlantique, de plus en plus de médias publient des contenus automatisés.

  • Forbes a des papiers écrits par le robot de Narrative Science.
  • Associated Press et Yahoo! font appel aux programmes d’une autre start-up américaine, Automated Insights.
  • France TV Info a, lors des élections municipales, mis en place un robot sur Twitter à qui les utilisateurs pouvaient demander de les alerter des résultats obtenus dans leur ville dès que ceux-ci étaient disponibles.

Le robot de France TV Info sur Twitter lors des élections municipales 2014

Branché sur les alertes du centre américain qui surveille les secousses sismiques, il est programmé pour rédiger des papiers en fonction du niveau de l’alerte reçu. Ensuite, le papier est mis dans le système de publication du Los Angeles Times en attente d’une validation humaine. C’est ce qu’il s’est passé lundi 17 mars 2014. A 6h25 du matin, un tremblement de terre secoue la Californie. Trois minutes plus tard, à 6h28, figure déjà sur le site du Los Angeles Times un papier de 700 signes sur le séisme, rédigé par Quakebot, et relu par Ken Schwencke, journaliste et programmateur au Los Angeles Times, sorti de son lit par ce séisme.

“Nous avons l’information, nous la publions en premier, nous informons notre audience. Si nous pouvons l’automatiser, pourquoi s’en empêcher?”, justifie-t-il.

Quakebot


Un rêve de rédacteur en chef?

Dans une rédaction, un robot travaille vite, ne dort pas, ne prend pas de congés et… ne râle pas. “Quand nous avons commencé, nous étions des parias dans cet univers”, reprend Joe Procopio, d’Automated Insights, qui se défend de créer des rédactions low-cost. Pour lui, le système est vertueux: il libère les journalistes d’une partie ingrate de leur travail – par exemple la rédaction de dépêches factuelles – pour leur permettre de se concentrer sur des enquêtes à haute valeur ajoutée ou des reportages qui nécessitent un peu de finesse dans l’approche.

Les limites des robots

Et si les rédactions confiaient aux robots l’écriture des “breaking news” – Facebook peut déjà vérifier les contenus de ses utilisateurs en temps réel alors que ceux-ci partagent 684.478 éléments par minute sur le réseau social -? Voire leur sous-traitaient  leur secrétariat de rédaction?

Puisque les robots sont les rois de la compilation de données, il est logique qu’ils puissent servir à monter et éditer des pages imprimées. Cela existe déjà avec The Long Good Read, une expérience menée par le Guardian dont l’objectif est de réussir “à presser quelques boutons pour imprimer un journal” dont le contenu a du sens pour les lecteurs. Le principe? Un algorithme maison, baptisé Ophan, pioche dans les articles les plus vus, les mots clés cherchés par les lecteurs du Guardian et une somme d’autres critères pour sélectionner les contenus à imprimer.

Le Guardian, qui a le goût du défi, a voulu savoir si un robot pouvait aussi écrire des articles très “anglés” et livrer des analyses. Pour ce faire, ils ont développé un autre robot en interne, le “Guardbot”. Bilan de l’expérience? “Nous avons peut-être été un peu trop optimistes”, tempère la rédaction.

Car réaliser des interviews, manier les formules et offrir un récit qui ne soit pas trop “brut de décoffrage” restent des tâches impossibles à automatiser.

Mais la veille et la “curation” d’informations pourraient aujourd’hui être assurés par des robots. Pas question, a tranché Mark Thompson, le patron du New York Times, au moment d’annoncer le lancement de l’application mobile NYT now: “la sélection humaine, et par là, le jugement humain, demeurent fondamentaux… peut-être pas pour tout le monde, mais pour une part importante et qualifiée de notre audience”.

Quand les lecteurs n’y voient que du feu…

Comment les lecteurs jugent-ils les contenus écrits par des robots – qui ne sont pas toujours annoncés comme tels? N’y voient-ils que du feu? Christer Clerwall, un chercheur de l’Université suédoise de Karlstad, a recueilli les réactions de lecteurs face à des articles sportifs réalisés d’un côté par des étudiants en communication et journalisme et de l’autre par des automates.

Dans l’étude qu’il a publiée fin février, il ressort que ces lecteurs ont beaucoup de mal à discerner les contenus produits par humains et ceux rédigés par des robots. Et quand ils font la différence, ils jugent les informations délivrées par les robots “plus justes, plus fiables, plus objectives” que celles des journalistes et que l’écriture robotisée “est perçue comme plus descriptive, plus informative, et plus ennuyeuse” que l’écriture humaine.

Résultats des tests menés auprès des lecteurs

C’est vrai qu’un robot ne votant pas, ne déjeunant pas avec ses sources, il ne peut a priori pas se faire manipuler par celles-ci. Du journalisme enfin objectif? Si les lecteurs sondés par l’étude paraissent le croire, la neutralité des robots est un mythe.

Le mythe de la neutralité

Lorsque les ingénieurs conçoivent un programme, ils “font des choix dans les paramètres, basés sur leurs intuitions, or celles-ci ne sont jamais neutres”, expliquent Gilad Lotan, expert des données, et Kelly McBride, de Poynter, lors d’une discussion sur les algorithmes, le journalisme et la démocratie à South by Southwest.

Sur ce point, il n’y a pas de transparence. Aucune charte éditoriale n’indique encore comment sont “paramétrés” ces robots de l’information ni qu’il faille préciser aux lecteurs si un article est écrit par un humain ou non.

Retrouvez dimanche à 12h30 sur France 5 le débat de Médias Le Mag sur les robots journalistes. Et n’ayant pas encore de robot pour ce faire, merci de partager cet article sur les réseaux sociaux s’il vous a plu. 

Alice Antheaume

lire le billet

Les trois préoccupations des Assises du journalisme 2010

Les Assises du journalisme, 4e du nom, se sont tenues pendant trois jours à Strasbourg. Que faut-il retenir de la trentaine de débats/tables rondes qui ont eu lieu (1)? Résumé en trois points.

>> Pour voir les photos, c’est ici >>

1. L’AFP en «mutation»

Sur le programme des Assises du journalisme, les organisateurs ont annoncé une «carte blanche à Emmanuel Hoog, président de l’AFP, et Philippe Massonnet, directeur de l’information de l’AFP: quel avenir pour les agences de presse face aux révolutions numériques?». Ceux-ci ont choisi de se livrer à une énumération des «chantiers» de l’AFP.  Dont le sport, la nécessaire internationalisation, et le développement de la présence numérique… Emmanuel Hoog en a fait une priorité. Et il insiste: on ne pourra plus dire «l’AFP sur Internet, jamais».

Plus loin, la question du statut de l’AFP, inchangé depuis 1957 (actuellement, c’est un organisme sans capitaux ni actionnaires), se pose toujours. Le ministre de la Culture et de la Communication Frédéric Mitterrand a redit, au début du mois de novembre, que le statut de l’AFP était «obsolète par rapport au fonctionnement des agences à travers le monde», à savoir Reuters et Associated Press, ne disposant pas «de l’organisation juridique, ni des moyens capitalistiques ni de l’organisation qui lui permettrait de faire face à ces enjeux (la mondialisation, ndlr)». Pour Emmanuel Hoog, l’AFP doit «arriver à reconstruire une politique de partenariat avec la presse française». Laquelle représente désormais moins de 10% du chiffre d’affaires global de l’AFP, relève celle-ci dans une dépêche consacrée au sujet.

Réformer? «Je ne suis ni député ni sénateur, répond Emmanuel Hoog, cité sur le blog Médiatrend, et changer le statut de l’agence implique une intervention du législateur». Ce sera chose faite, dès que sera présentée – «prochainement», a dit le gouvernement – une proposition de loi pour réformer le statut de l’AFP, en la dotant de capitaux.

2. L’information en temps réel pointée du doigt

Aux Assises du journalisme, l’ambiance était à la dichotomie: d’un côté, le temps réel, les flux d’information sur le Net, les contenus diffusés sur les réseaux sociaux. De l’autre, les contenus de qualité, l’investigation, le temps du recul et de l’analyse. «L’immédiateté numérique nous bouscule tandis que la compression économique nous accule, plaide dans son éditorial Jérôme Bouvier, le président des Assises du journalisme. C’est dans le moment entre l’info reçue et l’info rendue que se joue pourtant l’acte d’informer. Tous ceux qui rêvent de l’abolir, de le réduire à rien, sont les assassins de nos métiers, de nos médias, de l’information de qualité.»

Or, l’expérience sur les sites d’informations montre que si, c’est possible de faire de l’investigation tout en couvrant l’actualité en temps réel.  Le temps de l’immédiateté et celui de l’analyse ne sont pas irréconciliables, ils existent et se complètent déjà. C’est même tout l’enjeu du journalisme numérique. Lequel n’est pas, contrairement à ce qui bruisse ici ou là, qu’un journalisme «assis» ou de desk. Avec la contrainte du temps qui se resserre, les journalistes Web trouvent des façons de travailler inédites, comme décrit dans ce W.I.P. sur la «rédaction secrète du Web français», pour à la fois donner l’information le plus vite possible, par exemple avec un «urgent», et la développer, via des décryptages, des reportages, des enquêtes, pour expliciter l’enjeu de ce qui n’était encore, quelques heures plus tôt, qu’un «urgent» rédigé en quelques lignes.

3. L’éthique de la profession, mise à jour ou pas?

Ménages, propos internes aux rédactions ayant fuité sur les réseaux sociaux, limite à la diffamation, concentration industrielle… tous les sujets évoqués aux Assises du journalisme posent, de près ou de loin, la même question: faut-il redéfinir la charte de déontologie des journalistes? Et faut-il créer un Conseil national de l’Ordre pour les journalistes, comme cela existe pour les médecins et les avocats? Débattue lors de plusieurs conférences, cette interrogation n’a pas trouvé de réponse pour l’instant.

Jusqu’à présent, deux textes sont en vigueur dans la profession. D’une part, la Charte des devoirs professionnels des journalistes français, créée en 1918, et d’autre part, la Déclaration des devoirs et des droits des journalistes, qui date de 1971. Désormais, un code rédigé par Bruno Frappat, chargé d’un groupe de travail sur l’éthique journalistique lors des Etats généraux de la Presse écrite, en 2008, circule… Mais ne fait pas l’unanimité, comme le souligne cet article de Libération, «L’éthique, ça gratte». Et cela risque de continuer à gratter.

AA

(1)  J’intervenais pour ma part à une table ronde sur «faut-il former les journalistes au personal branding?» en compagnie de Vincent Glad, Eric Mettout, Xavier Ternisien, et Marc Mentré, dont l’émission «L’Atelier des médias» s’est fait l’écho.

lire le billet

Associated Press, l’agence devenue connectée

Crédit: DR
Crédit: AA

Avec ses 3.700 employés dans le monde, Associated Press est à la fois une coopérative et l’une des plus grosses agences de presse de la planète (à titre de comparaison, AFP a 2.900 correspondants dans le monde). «Chaque jour, plus de la moitié de la population voit des informations signées AP», lit-on sur leur site Web.

Dans leurs bureaux de New York, le centre névralgique d’AP, le silence est notable. Surprenant pour une rédaction qui, sur le seul plateau new yorkais, voit se succéder 400 personnes jour et nuit. «Le jour de lélection présidentielle américaine, lorsque nous avons su qu’Obama était élu, il n’y a pas eu un bruit, sinon celui des doigts sur le clavier des journalistes qui écrivaient à toute vitesse des dépêches», me raconte Tom Kent, rédacteur en chef en charge de la déontologie.

Silence, on écrit

Pas un cri de joie ou soupir de mécontentement? «Peut-être qu’intérieurement, certains journalistes regrettaient ou se réjouissaient de la victoire d’Obama, reprend Tom Kent, mais ils ne l’ont pas exprimé ouvertement. Notre rédaction est neutre et objective, c’est la marque de fabrique d’AP.» Et ce, depuis 1846, date de création de l’agence.

Malgré le déluge de tweets et autres informations publiées sur le Web (en France, les infos AP sont accessibles sur Yahoo!), la tradition d’AP n’a pas bougé. Pas d’opinion personnelle, politique ou religieuse sur Twitter ou ailleurs. De même, interdiction pour un journaliste d’AP de faire un «breaking news» sur un réseau social avant que son agence ne la publie dans ses propres tuyaux.

Charte déontologique

Le travail de Tom Kent, c’est – entre autres – de gérer les questions éthiques à AP. «Je vérifie que les articles sont équilibrés, que les sources sont identifiées, et que les journalistes n’en écrivent pas davantage que ce qu’ils savent.» Pas de place à l’interprétation ni aux projections, donc. Des règles qu’AP a écrites dans une charte, disponible ici.

«Dans une dépêche de cette semaine, par exemple, on apprenait que, selon une étude, les Américains se marient plus tard. Le journaliste a interprété ce résultat comme étant peut-être une conséquence de la crise économique. Or si cela n’a pas été prouvé par une étude, on ne peut pas faire de conclusion hâtive.»

Comment faire pour vérifier la déontologie des centaines d’articles diffusés? «Nous avons une liste de mots-clés susceptibles de poser problème, liste que nous enrichissons de nouveaux termes en temps réel, m’explique Tom Kent. A chaque fois qu’un journaliste écrit un mot de cette liste dans une information, cela m’envoie un email d’alerte.» Dans cette liste se trouvent les mots «Dimitri Medvedev», parce qu’il est souvent mal orthographié, et… «Wikipédia». «Nous exigeons que nos correspondants n’utilisent pas l’encyclopédie en ligne comme source», reprend Tom Kent.

Sur le plateau, les rédacteurs ont devant eux quatre écrans. L’un pour Tweetdeck, le deuxième pour observer la concurrence, le troisième pour les mails et messageries instantanées en interne, et le quatrième pour publier, éditer et mettre à jour les dépêches de l’agence. Et cela va vite, très vite.

Crédit: AA

Crédit: AA

Le temps de dire ouf, et l’éditrice en charge du desk d’Amérique du Nord, Maria Sanminiatelli, a des dizaines de messages en attente qui clignotent dans sa boîte, en provenance des bureaux de Phoenix, de Louisiane, de Californie, de l’Indiana, lui annonçant quels sujets seraient suivis et comment. Faire une pause de deux minutes? Impensable. Non seulement des centaines d’informations arrivent, mais en plus plusieurs versions d’une même histoire (pour l’international, pour le national, pour le local).

Métronome horaire

Partout dans la rédaction trônent des écrans affichant l’heure aux quatre coins du globe. A 16h29 pile, Tom Kent interrompt notre discussion et file à la «réunion de 16h30». Des représentants des services business, économie, international, infographie et social média arrivent toutes affaires cessantes. «Londres? Washington?» 16h30, une partie des bureaux de la planète AP sont réunis via le téléphone «pieuvre». A l’écran, sont affichées les infographies prêtes à être publiées.

Les sujets sont passés au crible, les décisions pour mettre l’accent sur telle ou telle histoire se prennent quasi instantanément. «Nous n’avons pas de photo sur les inondations du Mexique. Les seules images dont nous disposons sont des vidéos tournées il y a une semaine!» Réponse du service international: «Un hélicoptère survole actuellement la zone, avec un de nos photographes à bord.» Tom Kent regarde la pendule, il est 16h39. «Il faut que cette réunion dure moins de 15 minutes», me confie-t-il. Le matin, celle de 8h45, idem. Seule la réunion de 10h30, la plus importante des trois, peut s’étendre pendant 30 minutes.

Quelle information mérite un «urgent» pour AP? «Avant, quand nous ne travaillions que pour les journaux imprimés, c’était simple. On se demandait “qu’est-ce qui pourrait faire la couverture des journaux demain?” Maintenant que nos informations sont publiées sur Yahoo!, sur Facebook, sur notre chaîne de vidéos YouTube, il faut tenir compte de l’audience. Les frasques de Lindsay Lohan intéressent le public, donc oui, on peut faire des urgents avec.»

A AP comme ailleurs, l’audience réagit aux choix éditoriaux. «Un lecteur mécontent nous a écrit un mail assez dur aujourd’hui. Il ne comprend pas pourquoi il reçoit des “pushs” sur son mobile à propos de, dit-il, “tout sauf ce qui le concerne, à savoir l’histoire de l’étudiant qui a ouvert le feu à l’Université au Texas et s’est tué“». Réponse du service incriminé: «Nous aurions dû envoyer un alerte sur cette info-là aussi». Fin du débat.

La transition

Le plus gros défi d’AP, estime Tom Kent, a été de passer aux informations multimédia (photos, sons, vidéos, infographies, etc). En interne, la transition ne s’est pas faite en douceur. Il y a d’abord eu ce discours du «board» d’AP en 2004, un discours dont les mots résonnent encore dans la tête des journalistes de l’agence.

«Notre avenir dépend du multimédia. Si on continue à ne faire que du texte, c’est simple, on ferme l’agence et on perd tous nos jobs.» Tout le monde a obéi à l’injonction, détaille Tom Kent. Bâtons et carottes ont complété le dispositif. Côté bâton, l’entretien individuel annuel dispose d’une case particulière: «est-ce que le collaborateur joue la collaboration avec les services multimédia? Oui/Non». Si la réponse est non, cela a un impact sur l’évaluation du salarié, et pénalise son augmentation salariale. Côté carotte, un système de récompenses a été mis en place. Chaque semaine, 500 dollars sont attribués à l’auteur ou aux auteurs de la meilleure information hebdomadaire. La «meilleure» information de la semaine n’est pas être une simple dépêche, il est préférable qu’elle ait été mise en scène de façon multimédia. A la fin de l’année, les comptes sont faits: le service qui a obtenu le plus de récompenses hebdomadaires gagne 2.000 dollars.

Une sorte de Google Analytics pour AP

Comme l’AFP, AP est tourmentée par le vol de ses contenus. Elle prépare donc la riposte avec un outil, baptisé «news registry», dont la sortie est prévue en décembre, qui permettra de traquer les contenus sur le Web, et d’avoir des données mises à jour en temps réel sur leur diffusion. Il s’agit de savoir quel site utilise quelles informations d’AP…

C’est donc une sorte de Google Analytics développé spécialement pour AP. L’objectif est double: 1. Mieux connaître les usages de l’audience et «nous améliorer en conséquence». 2. Obtenir des preuves que tel ou tel client doit payer son abonnement à AP car X contenus de l’agence sont diffusés sur sa plate-forme et lui apportent X trafic. «Nombreux sont nos partenaires qui disent qu’ils ne veulent plus nous payer puisque nos contenus sont indexés sur Yahoo!, en accès gratuit», assure l’un des journalistes. Une situation que connaît l’AFP, dont une partie des dépêches sont indexées par Google News. Et qui a aussi son outil, Attributor, pour repérer les contenus volés, comme l’expliquait Frédéric Filloux dans sa Monday Note. Oui, l’éthique avant tout.

Utilisez-vous AP en France? Faites-vous plus confiance aux contenus des agences que ceux des sites Web d’infos?

lire le billet

Liens du jour #31

Le site du Times passe au payant et… se passe de Google (Etreintes digitales, blog du Figaro.fr)

L’Associated Press du XXIe siècle s’appelle Publish2 News Exchange, une plate-forme d’échange de contenus journalistiques (Publish2blog)

Nos vies gérées par les données (Internet Actu)

lire le billet