Big data : le mobile prend le pouls des foules

Le bonheur, c’est simple comme un coup de fil. » Ce vieux slogan des PTT a dû résonner dans les oreilles du Belge Vincent Blondel, de l’Université catholique de Louvain, lorsqu’il a fait une demande incongrue à son administration, en 2001  : accéder aux relevés des communications internes des postes fixes du campus pour faire des expériences. « J’avais développé des algorithmes pour explorer des réseaux, mais je n’avais pas de données pour les tester », se souvient l’informaticien – aujourd’hui recteur de cette université –, heureux à l’époque d’avoir récupéré les connexions entre 4 000 postes téléphoniques.

En 2008, publication de l’algorithme de Louvain

Mais pour explorer au maximum ses idées, il avait besoin de plus de données. Il contacte alors un opérateur mobile belge. En 2008, expérience réussie avec 4 millions d’utilisateurs  : il publie le ­premier algorithme efficace pour détecter automatiquement et rapidement les communautés, c’est-à-dire repérer dans des réseaux immenses quel groupe inter­agit le plus avec quel autre. Cet algorithme, dit « de Louvain », est maintenant utilisé par les plus grands sites Web, comme LinkedIn, Twitter, Flickr ou YouTube, pour fouiller dans leurs immenses réseaux.

Lire aussi : Les données très sensibles des portables

Ce coup de maître est aussi le déclencheur d’une nouvelle activité de recherche à partir de l’utilisation des données mobiles. Dans EPJ Data Science du 5 août, Vincent Blondel et deux autres collègues recensent déjà plus de 200 études aux conclusions étonnantes, voire sidérantes, dans des domaines inattendus.

Prévision des crimes, mesure des taux de chômage, des taux de pauvreté, détection de la personnalité, prévention des épidémies de paludisme, Ebola ou dengue, aide à la planification des réseaux électriques ou urbains, recensement… Tout cela en ne recourant qu’aux comptes rendus d’appels, qui contiennent les numéros mis en relation, les antennes concernées et les types de messages échangés (voix ou SMS), notamment. Mais pas de données GPS, ni de contenu des messages, ni d’autres traces laissées par les applications installées sur les smartphones.

La sociologie classique revisitée

Bien des domaines sont concernés. La sociologie, bien sûr, mais aussi la santé, l’économie, les statistiques publiques, l’urbanisme… Pas de doute, les chercheurs font parler nos téléphones ! « A la conférence Netmob d’avril 2015, nous avons enregistré 30 % à 40 % de contributions supplémentaires par rapport à 2013 », constate Vincent Blondel, co-organisateur de cet événement depuis 2011 au Massachusetts Institute of Technology (MIT).

La première phase de ce mouvement a consisté à revisiter des grands apports de la sociologie classique. Un exemple ? « Nous avons pu vérifier à grande échelle ce qu’il se passe pour le cercle d’amis lorsque des personnes déménagent, explique ­Zbigniew Smoreda, sociologue au laboratoire de recherche d’Orange. Les liens forts, c’est-à-dire les interactions fréquentes, résistent, mais les liens faibles disparaissent et se reconstituent dans le nouveau lieu. Nous avons pu mesurer, ce que nous ne pouvions faire avec nos échantillons réduits d’il y a quelques années, que le diamètre du cercle de nouveaux amis est le même avant et après le déménagement. »

«  Comment les gens bougent, comment ils se lient, comment l’information circule… sont des questions que nous pouvons reconsidérer grâce à ces données », estime Esteban Moro, de l’université ­Carlos III, à Madrid, co-organisateur de Netmob, qui a notamment trouvé des corrélations entre taux de chômage et profil d’utilisation du mobile. Une personne qui perd son emploi ne téléphone plus aux mêmes moments, contacte de nouvelles entreprises, rompt les liens avec des collègues…

Le big data, un bond en avant

Il a fallu néanmoins quelques progrès techniques, comme ceux de l’algorithme de Louvain, pour étudier ces réseaux. « Analyser des millions de lignes dans une base de données était impossible il y a quelques années », rappelle Esteban Moro. Les mathématiciens et les informaticiens ont su franchir ces obstacles (Le Monde du 29 janvier 2014).

Ces méthodes, aujourd’hui appelées big data, ont alors permis de tirer bien plus d’informations que celles intéressant la sociologie classique.

«  En 2011, sur une terrasse du MIT, nous cherchions une idée pour stimuler la recherche. Netflix venait d’obtenir du succès en lançant un défi pour améliorer son moteur de recommandation. Nous nous en sommes inspirés avec un objectif positif  : aider les pays en voie de développement », rappelle Nicolas de Cordes, vice-président marketing et anticipation chez Orange et pilote de ce projet baptisé Data for Development (D4D).

L’initiative repose sur différents jeux de données fournis par Orange. «  Nous attendions une cinquantaine d’équipes, plus de 250 ont répondu et plus de 80 ont pu soumettre leur projet avant la date butoir », indique Nicolas de Cordes. La première session concernait la Côte d’Ivoire, en 2013, la seconde le Sénégal, en 2015.

Des applications très diverses

Parmi les derniers lauréats récompensés cette année, une équipe de l’université de Manchester (Angleterre) a démontré qu’elle pouvait inférer la consommation électrique à partir des données de téléphonie et ainsi aider à gérer le réseau électrique. L’université de Louvain (Belgique) propose, elle, un indicateur du prix du millet à partir de l’activité des appels ainsi que de leur localisation. Celle de Delft (Pays-Bas) a conçu un modèle d’aménagement du territoire indiquant où construire les routes du Sénégal en tenant compte des déplacements des personnes.

Les idées ne manquent pas, qui pourraient mettre à profit une couverture mobile de 90 % de la population. Ne ­serait-ce que pour faire un simple recensement, dans des pays où l’administration n’en a pas les moyens.

Incidemment, ces applications révèlent une information un peu oubliée, contenue dans les mobiles. Ceux-ci permettent de suivre les déplacements des gens, même en l’absence de GPS ! Pour fonctionner, le réseau doit en effet savoir quelle antenne est proche de l’émetteur et du récepteur. En outre, comme le ­réseau est maillé, l’opérateur sait dans quelle zone autour de l’antenne se trouve la personne et il peut donc mesurer des flux entre zones ou des changements de zone. D’où une autre série de projets, ayant souvent eu plus d’échos, qui cherchent à améliorer les réponses face aux épidémies ou aux catastrophes naturelles (inondations, tremblements de terre…). Les informations sur la mobilité permettent d’anticiper le choix des endroits où concentrer les soins ou des pratiques de quarantaine. Ou de savoir en quels lieux envoyer des secours et en quelle quantité.

Anticipation de catastrophes

En septembre, dans la revue PNAS, une équipe exposait ainsi son modèle de prévision d’épidémie de dengue au Pakistan grâce aux données de l’opérateur Telenor, sur 40 millions de mobiles. Elle anticipe les zones géographiques qui seront touchées et le rythme de l’épidémie.

L’ONG Flowminder s’est spécialisée sur ce terrain de l’urgence, avec plus de 40 publications scientifiques. A Haïti, après le tremblement de terre de 2010, avec l’opérateur Digicel ; pour l’épidémie d’Ebola, en 2015, grâce à Orange ; au ­Népal, grâce à Ncell, pour le séisme d’avril 2015. Pour le paludisme en Tanzanie ou en Namibie, l’ONG convainc les opérateurs téléphoniques de la laisser­­ ­accéder aux comptes rendus d’appels  afin d’estimer les flux de déplacements des populations. Ces données restent chez les opérateurs. « Ces mouvements de population échappent aux satellites et aux hélicoptères, explique Linus Bengtsson, cofondateur de Flowminder. Certes les données mobiles ont des défauts, mais les autres informations sont bien pires ! »

Pour la partie plus purement technique, l’association a parfois travaillé avec l’entreprise belge Real Impact Analytics, autre acteur important de ce mouvement. « Ce sont des données riches pour les pays pauvres », explique Sébastien ­Deletaille, le fondateur de cette société à double activité – commerciale, en fournissant des services de big data aux entreprises, et sociale avec le volet humanitaire. « C’est motivant de voir l’impact que peuvent avoir 100 personnes sur la vie d’un continent tout entier, précise le dirigeant. En Afrique, les gens plaisantent souvent en disant que les données officielles sont de très bons générateurs aléatoires de nombres. Avec le mobile, nous pouvons capter beaucoup mieux ce qui se passe. » Récemment, avec l’Organisation des Nations unies pour l’alimentation et l’agriculture (FAO), notamment, l’entreprise a développé des indicateurs de pauvreté et de détresse alimentaire à l’aide des données mobiles et en s’appuyant sur le montant des cartes prépayées utilisées.

Lire aussi : Les lois imparables des réseaux mobiles

Des méthodes en voie d’expansion

Les téléphones apparaissent, sans que l’utilisateur en ait conscience, comme un très efficace capteur du pouls d’une société. Pourtant, malgré les succès des ­recherches et des cas particuliers réels liés à des catastrophes, ces réussites ne sont pas devenues des routines.

Cela pourrait changer sous l’impulsion des Nations unies. Lundi 28 septembre, à son assemblée générale, a été lancée officiellement l’initiative de partenariat global sur les données pour le développement durable. Cette initiative fait suite à un rapport de novembre 2014, intitulé « Un monde qui compte », qui pointait l’utilité d’exploiter de grandes masses d’informations pour aider les pays pauvres. Depuis 2010, un laboratoire de recherche de 30 personnes, Global Pulse, sous l’égide de l’ONU, aide les gouvernements à innover avec le big data – et pas seulement avec les données mobiles. «  Les choses pourraient aller plus vite qu’on ne pense. Depuis un an, les bureaux de ­statistiques nationales de quelques pays réfléchissent à inclure les informations ­tirées des mobiles dans leurs indicateurs ­officiels », indique Miguel Luengo-Oroz, ­directeur technique de Global Pulse.

«  Tous les opérateurs téléphoniques devraient utiliser les outils existants et ne pas attendre qu’un groupe de recherche ou une ONG vienne sur place en cas de crise pour déployer ces solutions, estime Sébastien Deletaille. ll ne manque pas de chercheurs et de publications. Il manque seulement plus d’applications qui répondent aux besoins des travailleurs humanitaires. Nous cherchons des fonds pour les développer. »

« Il faut pousser à de la standardisation »

«  Les barrières ne sont pas techniques. La difficulté, c’est de mettre ensemble ­plusieurs acteurs, des gouvernements, des régulateurs, des opérateurs, des entreprises… », constate Miguel Luengo-Oroz. « Nous avons montré que ces données ont de la valeur. Il faut maintenant pousser à de la standardisation et à des applications », indique Nicolas de Cordes.

Cette valeur intéresse bien sûr déjà les pays développés. En France, par exemple, Orange, indépendamment de son rôle dans D4D, fournit depuis la fin 2013 Flux vision, un service permettant d’analyser les flux de populations sur des sites touristiques, commerciaux, des gares… Dans les Bouches-du-Rhône, le système, qui n’utilise pas les comptes rendus d’appels mais des informations des antennes de l’opérateur, permet de distinguer des groupes (pas des individus) de touristes locaux, étrangers ou venant de l’extérieur du département. Il fournit des chiffres de fréquentation, des heures de pointe ou creuses. « Cela nous aide à décider plus vite où installer des points d’accueil dans le parc des Calanques, par exemple », indique Isabelle Brémont, la directrice de Bouches-du-Rhône Tourisme. Les téléphones n’ont pas fini de parler.

Le Monde 28-09/2015