Google fever

«Googlesque»? Osons ce néologisme tant le nom du géant américain de l’Internet ne cesse, chaque jour, chaque minute, d’entrer un peu plus profond dans nos vies et nos consciences. Nous avions bien évidemment entendu parler, sans véritablement comprendre, de l’appétence des responsables de Google pour la grippe. Mais l’affaire nous semblait lointaine et brumeuse, hasardeuse et sans doute aux frontières du commercial.flugoogle

Tel n’est plus le cas désormais. Le géant googlien a annoncé jeudi 8 octobre l’extension à seize nouveaux pays du monde d’un service permettant de suivre la progression de la pandémie grippale grâce aux recherches effectuées chez lui par les internautes.  Ce nouveau service concerne neuf pays européens: Autriche,  Allemagne, Belgique, France, Hongrie, Pays-Bas, Pologne, Espagne et Suède. Le Japon et la Russie sont également concernés.

Le maîtres googliens sont-ils des devins? Cet outil avait été forgé dès l’an dernier, bien avant l’émergence de la pandémie A(H1N1), aux Etats-Unis (pour la grippe saisonnière) avant, cas de force majeure, d’être rapidement étendu au  Mexique, à l’Australie et à la Nouvelle-Zélande. L’objectif? Tout simplement fournir des indications rapides sur les tendances de la grippe, sur une base quotidienne et ce pour permettre éventuellement une alerte précoce explique en substance Yossi Matias, l’un des experts de Google.

Mais encore? En pratique,  pour chaque pays concerné, Google a retenu  des «mots clés»; des «mots clés» dont le géant postule que la fréquence de leur recherche correspondrait à celle de la progression de la pandémie grippale. Tâche bigrement ardue quand on sait les multiples déclinaisons linguistiques que peut engendrer  la grippe due au A(H1N1), de «mexicaine» à «porcine». Ces «mots clés» peuvent aussi correspondre aux termes désignant la symptomatologie des syndromes grippaux (toux, éternuements, fatigue, courbature etc.); tâche encore plus ardue quand on sait qu’un syndrome grippal n’est pas ipso facto une grippe et qu’une grippe n’est pas ipso facto une infection due au A(H1N1)…

Et les mêmes experts de conclure que tous les mots clés ne sont pas rendus publics pour ne pas «corrompre» les  résultats qu’ils publient. S’intéresser à «fièvre» (en lien, par exemple, avec « arrêt de travail ») signifie-t-il que l’on est concerné ou que l’on craint de l’être. Antoine Flahault et moi-même, sur ce blog de Slate.fr, sommes-nous ou non (de la même manière que tous ceux qui échangent avec nous)  déjà membres de la cohorte de tous ceux qui aident Google à prendre le pouls pandémique de la population française sinon du monde francophone ? Si oui, qui nous le dira?

Les flux centralisés des mots échangés sur la Toile reflets de l’évolution quotidienne d’une réalité épidémiologique que les épidémiologistes peinent depuis toujours à établir? Pourquoi pas? Les maîtres googliens assurent que leurs premiers coups de sonde sur la grippe saisonnière de l’an dernier correspondaient bien aux données officielles communiquées par les autorités sanitaires américaines «plusieurs semaines plus tard».

Ils ajoutent: «Alors que certains outils de surveillance sanitaire traditionnels prennent des jours ou des semaines pour communiquer et diffuser les données, les  recherches sur Google peuvent être comptées en temps réel». Selon eux google.org/flutrends ne doit pas être considéré comme pas un substitut aux méthodes traditionnelles de la surveillance épidémiologique  effectuées par les autorités sanitaires nationales ou internationales. C’est un outil qui  se veut «complémentaire».  Jusqu’à quand?

Jean-Yves Nau

Veille sanitaire sur Internet : séparer le bon grain de l’ivraie

Dès 2008 nous avions repéré au sein de notre équipe de recherche « Sentinelles » de l’Inserm-UPMC UMR-S 707  les travaux publiés par Polgreen et coll. dans Clinical Infectious Diseases (résumé en anglais en ligne) sur l’utilisation de Yahoo pour estimer la morbidité et la mortalité des épidémies de grippe aux USA, et par Ginsberg et coll. dans la revue Nature (résumé en anglais en ligne) sur l’utilisation de Google pour détecter les épidémies de grippe, dans les deux cas avec deux à cinq semaines d’avance sur les Centers for Disease Control and Prevention (CDC) américains  (voir billet du 29 novembre 2008).

En févier dernier l’Ecole des Hautes Etudes en Santé Publique (Ehesp) a co-organisé à Vienne, dans le cadre d’une conférence internationale sur les maladies émergentes (pdf en ligne), un symposium spécial avec les auteurs de ces deux papiers et des responsables de réseaux de surveillance épidémiologique. C’est dire l’intérêt que nous portions au fait de savoir si  ces nouveaux outils pouvaient ou non s’avérer de puissants auxiliaires de la veille sanitaire. Bien sûr, leurs promoteurs ne prétendent pas remplacer la surveillance classique. Bien sûr, une fois l’alerte détectée, à partir d’une « épidémie » de requêtes tapées sur le clavier par de fébriles  (au sens propre du terme) internautes, convient-il de trier l’ivraie du bon grain, la fausse alerte de la vraie.

Les réseaux de surveillance – lorsqu’ils existent, tous les pays n’en ont pas – peuvent alors entrer  en action, comme source complémentaire indispensable pour croiser les informations initiales ; pour les confirmer ou les infirmer, ou souvent pour mieux les préciser. Pour notre part nous apprécions la philosophie générale  de gratuité et de mise à disposition du public (et donc des chercheurs) de la base des « mots clés » par Google. Nous avons alors travaillé sur les données françaises du réseau Sentinelles (également gratuites et libres d’accès en ligne), pour explorer si le moteur de recherche était capable d’étendre son champ d’action. D’abord en  en commençant par la grippe en France ; ce sont ces travaux qui sont aujourd’hui repris sur le site www.google.org/flutrends. Ensuite en l’étendant aussi aux gastroentérites et à la varicelle dans notre pays. Nous avons été impressionnés par la qualité de la détection « googlesque » tant les courbes produites par Google se superposaient avec celles des médecins sentinelles (Pelat et coll. Emerging Infectious Diseases, août 2009, article en anglais gratuit en ligne)

L’intérêt de ces sources complémentaires d’information est important à plusieurs titres. D’abord, comme source indépendante et complémentaire de données pour la veille sanitaire dans un pays qui dispose de réseaux de surveillance classiques. Il est toujours utile de croiser plusieurs sources concurrentes, notamment lorsque l’on doute d’une alerte, comme c’est le cas en ce moment vis-à-vis du démarrage de la pandémie de grippe à une période inhabituelle dans l’année. Mais aussi, comme source parfois unique et isolée d’information en temps réel dans tous les pays où les infrastructures de santé publique sont peu (ou ne sont pas du tout) développées.

Aujourd’hui encore peut-on penser que ces structures défaillantes accompagnent une utilisation encore très limitée de l’Internet, bien que cela reste à vérifier, tant l’Internet s’est répandu rapidement y compris dans les endroits les plus reculés du monde. Mais dans quelques années seulement (demain !)  l’Internet aura probablement progressé plus rapidement que les systèmes de santé publique dans les Etats parmi les plus défavorisés de la planète. Savoir que ces régions du monde disposeront d’un outil de détection d’alerte validé dans de nombreux autres pays, fonctionnant sans coût additionnel, et en temps réel, sera précieux pour les aider à intervenir de manière précoce  – et donc à bien moindre coût – sur des émergences ou réémergences de foyers de maladies infectieuses ;  les méningites dans le Sahel par exemple.

Couplés à d’autres systèmes de surveillance, météorologique, ou de veille entomologique ou animale, ces outils d’aujourd’hui –et bien plus encore de demain permettront probablement aussi de mieux anticiper et prévoir les dynamiques épidémiques à l’aide de modèles mathématiques voisins de ceux utilisés pour prédire les variations climatiques. Ils seront également utilisés par les médecins lors de consultations de patients de retour de voyages, pour guider leur diagnostic en cas d’épidémie suspectée dans le pays d’où le voyageur malade revient.

Antoine Flahault

3 commentaires pour “Google fever”

  1. “Les flux centralisés des mots échangés sur la Toile reflets de l’évolution quotidienne d’une réalité épidémiologique que les épidémiologistes peinent depuis toujours à établir? Pourquoi pas? Les maîtres googliens assurent que leurs premiers coups de sonde sur la grippe saisonnière de l’an dernier correspondaient bien aux données officielles communiquées par les autorités sanitaires américaines «plusieurs semaines plus tard»”
    Votre article invoque la difficulté de la méthode adoptée par Google pour obtenir des estimations justes. Certes, mais vous semblez en tirer la conclusion que le service fourni par Google n’est pas à la hauteur des ambitions affichées, sans en administrer la preuve factuelle.
    En tant que médecins et spécialistes n’avez vous pas à votre disposition les moyens d’évaluer les résultats de Google? On peut le regretter mais, en l’absence d’informations complètes sur la méthode de Google; seule la preuve de prévisions erronées peut amener au rejet de la méthode employée (sachant bien sur qu’une seule prédiction correcte ne suffirait pas à valider la méthode).
    Les ambitions commerciales de Google ne doivent pas masquer que ses équipes sont aussi composées d’expert en mathématique, en statistique, en linguistique … qui ont aussi certaines capacités à imaginer des systèmes performants ….

  2. Cet outil – qui fournit des données très réalistes – est intéressant pour les webmasters qui veulent savoir si la baisse ou la hausse de leurs stats est normale ou non. Par contre, il ne me semble être à prendre avec des pincettes : l’évolution de la pandémie est une chose, les tendances dans les serps une autre.

  3. C’est un outil un peu “gadget” tout de même!
    Je préfère que Google investisse dans Google Books plutôt que dans ce genre d’application “buzz”.
    Bonne fin de journée,
    Gael

« »