Histoire de chiffres !

Lors du dernier cours, M. Yves Gingras nous a présenté une façon différente de faire de l’histoire par l’analyse de textes provenant d’un corpus de lettres d’une façon purement mathématique. D’entrée de jeu, on peut dire que cette méthode est quelque peu déstabilisante pour un historien ou un chercheur en sciences humaines qui ne fréquente pas nécessairement le domaine des chiffres et des graphiques dans le cadre de ses recherches.

Cette méthode fait abstraction du contenu des lettres (ou de toute autre forme d’écrit) pour se concentrer uniquement sur la fréquence de certains mots ou de leur association avec d’autres mots afin d’en tirer des tendances. De ces tendances on peut par la suite établir des liens conceptuels ou sociaux entre les acteurs impliqués dans ces documents ou établir tout simplement la force d’un concept pour une période donnée.

Cette méthode se rapproche plus des sciences appliquées que des sciences humaines puisqu’elle se base sur l’analyse de chiffres obtenus à l’aide d’une méthode d’extraction (manuelle ou informatique) et qui sont par la suite transposés en graphiques (réseaux). Ce genre d’analyse est fréquent dans différents domaines de recherche des sciences appliquées (par exemple dans le cas de résultats d’analyses d’échantillons effectués sur une période X que l’on reporte par la suite sur un graphique), mais demeure relativement nouveau en histoire.

Par son détachement par rapport à l’objet de recherche, cette méthode permet d’avoir une vue d’ensemble différente du sujet, soit de l’ordre de la macro comme le soulignait M. Gingras lors de sa présentation. Cette vue d’ensemble permet donc d’orienter où d’aborder un sujet de recherche d’une façon différente.

Ce type d’analyse des textes peut se faire de façon manuelle pour de petits corpus. Toutefois, lorsque ce dernier prend de l’ampleur, il devient difficile, presque impossible, d’en faire une analyse efficace et complète sans un outil informatique adapté qui pourra faire l’opération de recherche en un court laps de temps. L’outil informatique permet de ne plus imposer de limite à la recherche et ainsi obtenir un portait globale du champ d’études. C’est le volume important qui peut-être traité qui rend justement intéressant ce genre d’analyse. Plus ce dernier est important, plus sera représentative l’analyse que l’on en fera.

Le problème est justement la disponibilité de ces corpus qui n’est pas toujours évidente et qui rend donc l’utilisation de cette méthode limitée pour le moment. La numérisation des documents d’archives prend de plus en plus d’ampleur pour les raisons que l’on a vues depuis le début du cours. Ce phénomène permettra donc d’accroître le nombre de corpus disponibles pour ce genre de recherche, à la condition que le format utilisé pour la numérisation permettre ce type d’interrogation et que ces corpus soient accessibles à la communauté et non concentrés dans des fonds d’archives privés (voir le texte de Daniel J. Cohen et Roy Rosenzweig au sujet de l’accessibilité des sources numériques http://chnm.gmu.edu/digitalhistory/introduction/).

Dans un futur pas si lointain, les archives du web constitueront une pièce maîtresse de l’étude historique des décennies 80, 90 et 2000. Ces archives, qui seront déjà sous une forme numérique, formeront donc un corpus incroyable pour ce type de recherches statistiques. Avec l’informatique, il n’y aura plus de limite aux nombres de données et les possibilités d’association de mots seront presque illimitées. Les bases de données ainsi crées seront donc des plus complètes et permettront d’établir des tendances fiables et pertinentes. L’avenir est donc prometteur pour cette méthode de recherche.

Jean-Philippe

 

Sources :

COHEN, Daniel J. et Roy ROSEINGBERG, «Introduction : Promise s and Perils of Digital History» dans Digital History: A Guide to Gathering, Preserving, and Presenting the Past on the Web, Philadelphie, University of Pennsylvanie Press, 2006. <http://chnm.gmu.edu/digitalhistory/introduction/> (23 octobre 2011).

GINGRAS, Yves, «Mapping the structure of the intellectual field using citation and co-citation analysis of correspondences », History of European Ideas, vol. 36, no 3 (2010) pp. 330-339. <http://www.chss.uqam.ca/Portals/0/docs/articles/2010/Correspondence%20HEI%28Gingras%29.pdf> (23 octobre 2011).



Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s