L’ère des sciences sociales augmentées
Les traces que nous laissons sur les moteurs de recherche, les réseaux sociaux, les sites d’achat en ligne, ainsi que le nombre croissant des objets connectés (smartphones, montres, caméras, thermostats, enceintes, capteurs), nourrissent un fabuleux gisement de données numériques. Il éclaire jusque dans les micro-détails nos comportements quotidiens, nos déplacements, nos modes de consommation, notre santé, nos loisirs, nos centres d’intérêt, nos réseaux de sociabilité, nos opinions politiques et religieuses, sans que nous en ayons toujours conscience. La numérisation accélérée d’archives et documents, jusqu’ici inaccessibles, effectuée par les administrations, les entreprises, les partis, les journaux, les bibliothèques y contribue également.
Il en résulte des données hors norme par leur volume, leur variété et leur vélocité (les «3 V»), communément appelées le «big data». Et les moyens de les extraire, coder, quantifier et analyser en quelques clics se sont développés de concert, grâce aux progrès de l’intelligence artificielle (IA). Comme le souligne Dominique Boullier dans son dernier livre1>www.boullier.bzh/livres/propagations-un-nouveau-paradigme-pour-les-sciences-sociales , ce processus est en train de révolutionner le paysage des sciences sociales, pour le meilleur et pour le pire.
A cet égard deux thèses s’affrontent dès la naissance du Web. Dans un article au titre provocant, «The End of Theory: The Data Deluge Makes the Scientific Method Obsolete»2>www.wired.com/2008/06/pb-theory , Chris Anderson, rédacteur en chef du magazine Wired consacré aux nouvelles technologies, y voit la mort programmée des sciences sociales. Les corrélations vont remplacer la causalité, point n’est besoin de modèle explicatif ou de théorie unifiée et «les chiffres parlent d’eux-mêmes». En total désaccord, des chercheurs comme Burt Monroe3>pure.psu.edu/en/publications/no-formal-theory-causal-inference-and-big-data-are-not-contradict ou Gary King4>gking.harvard.edu/ saluent le potentiel de renouvellement des théories et des méthodes qu’apportent ces données et plaident pour l’hybridation des sciences sociales et de la «data science».
Dans la même ligne, je donnerai quelques exemples illustrant l’apport du big data, notamment sur des sujets sensibles comme le racisme ou la sexualité, difficiles à saisir dans les enquêtes par sondages ou par entretiens à cause des biais de «désirabilité sociale», soit la tentation face à l’enquêteur ou l’enquêtrice de dissimuler son opinion si elle n’est pas conforme aux normes sociales en vigueur.
Le champ des recherches sur le racisme, en particulier le racisme anti-noir, est particulièrement développé aux Etats-Unis et plusieurs enquêtes par sondage ont tout naturellement voulu mesurer son impact potentiel sur les votes en faveur........
© LeCourrier
