Big data : l’accumulation de données transforme-t-elle le métier d’historien ?

La constitution de bases de données numériques immenses interroge sur le travail futur des historiens. La compétence des historiens peut-elle aider à mieux comprendre les enjeux du big data ? C’est l’un des thèmes de l’événement « L’Histoire à venir » dont la première édition se déroule à Toulouse du 18 au 21 mai. Entretien avec Claire Judde de Larivière, coordinatrice générale de « L’Histoire à venir » et maîtresse de conférences en histoire moderne, et Natacha Laurent, maîtresse de conférence en histoire contemporaine.

Comment l’accumulation de données dans de grandes proportions via le big data est-elle perçue par les historiens ?

Natacha Laurent : Nous sommes à un moment de l’Histoire où les données nous envahissent. Elles sont partout et le sentiment s’installe qu’elles nous submergent et que nous en serons bientôt les esclaves. Les images, par exemple, sont désormais si nombreuses qu’on ne peut plus les saisir et on peut se demander si la masse d’images peut finir par être un obstacle à la quête de sens. Certains de nos collègues (les préhistoriens, les historiens de l’antiquité et certains médiévistes) sont confrontés à la situation exactement inverse. La question des données, des vestiges et des archives est réactivée par le big data et c’est la raison pour laquelle une partie de l’événement est consacré au thème « Du silex au big data ».

Claire Judde de Larivière : Je suis fascinée par les bases de données actuellement en cours de constitution et par le pouvoir qu’elles sont en train de prendre. Ce qui s’est passé au moment de l’élection de Trump aux États-Unis, avec l’influence potentielle des algorithmes sur les votes, est un enjeu majeur du monde contemporain. Un enjeu techniquement complexe mais sur lequel les historiens ont des choses à dire. Car c’est leur travail de rassembler des données, les comparer, les critiquer, leur donner un sens et les faire parler. La façon dont on constitue une base de données n’est pas neutre en soi. Ceux qui les constituent aujourd’hui pour des entreprises ou des États peuvent y introduire des biais.

Les historiens ont-ils une expertise sur la question des big data ?

N. L. : Les données ne sont pas ‘données’, elles sont construites par des personnes qui choisissent de les construire avec leur propre objectif. Tout le travail des historiens est de reconstituer le travail de construction du corpus et d’identifier l’objectif dans lequel le corpus a été constitué. Je crois aussi qu’il faut casser cette impression que si on dispose de beaucoup de données, on est plus dans la vérité. La qualité n’est pas dans l’accumulation des données.

C. JdL : De façon très concrète, nous, historiens, pouvons montrer combien est légitime la demande faite à Google de plus de transparence dans la diffusion des données. Où les identifie-t-il, comment les sélectionne-t-elle et les prend-elle ? En tant que citoyens, nous devons avoir le droit de demander à ce qu’il y ait un débat public sur ceux qui possèdent les données, comment, pourquoi et avec quelle méthode ? Car, finalement, la question est de savoir quel profil des citoyens est dessiné à partir de données choisies par des gens qui, théoriquement, n’ont pas de mission publique pour le faire. Il ne doit pas y avoir de privatisation du présent, pas plus que du passé.

Les données du big data seront-elles un outil fiable pour les futurs historiens ?

C. JdL : Malgré la masse des données, certains sont dans l’inexistence numérique. L’inégalité numérique entre la campagne et la ville va créer des biais construisant, si l’on n’y prend pas garde, à une forme d’oubli politique ? Des millions de personnes sont exclues aujourd’hui du présent numérique. Dans 100 ans, comment sera regardée cette société où ceux qui n’ont pas accès au numérique ne laissent pas de traces ? Quelles archives pour ceux qui n’en laissent pas ? C’est une question importante. Par exemple, certains migrants laissent des traces, d’autres n’en laissent pas et il y a d’ailleurs beaucoup de projets citoyens qui visent à garder la mémoire des migrants.

Comment le travail des historiens évolue-t-il avec le numérique?

N. L. : Les futurs historiens vont être écrasés par les informations. Et c’est déjà le cas, par exemple, pour l’historienne du cinéma que je suis. C’est pourquoi il est important de se saisir aujourd’hui de toutes les questions liées au big data (la propriété des images et des données, la pérennité des supports, la question de la confiance sur Internet, etc.). Par ailleurs, il faut démocratiser la notion de dimension critique à l’égard des données et être de plus en plus attentif à l’origine des documents.

Le numérique décuple la violence et la diffusion de la manipulation. La Russie a une expérience pluriséculaire du suivi des opposants et de la réécriture de l’histoire, ainsi que les meilleurs informaticiens du monde. Les deux ensemble en font une donnée inquiétante, par exemple.

C. JdL : Les historiens actuels ont la chance d’avoir vécu dans leur travail l’avant et l’après internet. Rien sans doute ne remplace le travail sur la matérialité des archives – je travaille sur Venise au 16e siècle -, mais les historiens vont changer leurs pratiques. Cette année je fais un cours sur l’usage public de l’histoire et je travaille avec mes étudiants sur la vérité, la post-vérité, les fake news. Internet est le lieu où l’on ment tout le temps…

Enfin, le domaine des humanités numériques est en train de se développer et c’est un point très positif. À Toulouse, cette année, l’Université recrute un poste dans ce domaine dont le principe est de travailler les sciences humaines et sociales par le biais de la technologie.

« L’Histoire à venir »

L’événement « L’Histoire à venir » est né d’une réflexion de la librairie Ombres Blanches, du Théâtre Garonne, de chercheurs de l’Université Toulouse Jean-Jaurès et des éditions toulousaines Anacharsis. À l’origine, selon Claire Judde de Larivière, « une envie collective des historiens de se confronter, sur le plan scientifique, à l’état du monde actuel. L’objectif est de renforcer le pacte entre la démocratie et la connaissance. » En plus des temps forts consacrés au big data, le festival traitera deux thèmes généraux : « Histoire et démocratie » et « Écrire l’histoire », qui seront repris chaque année. Une cinquantaine d’étudiants de l’Université Toulouse Jean-Jaurès, des classes préparatoires du lycée Saint-Sernin et de Sciences Po Toulouse interviendront en tant que bénévoles.

L’historien Patrick Boucheron, qui a dirigé l’ouvrage Histoire mondiale de la France, fera le 18 mai la conférence inaugurale au Théâtre Garonne.

Propos recueillis par Emmanuelle Durand-Rodriguez
La Tribune 16/05/2017