Roy Rosenzweig Center for History and New Media : Building a Better Yesterday, Bit by Bit

Source : http://www.zotero.org/

Depuis le début du cours, plusieurs références ont été faites, peut-être sans le savoir, à des documents ou des outils qui ont été produits et développés par le Centre for History and New Media (CHNM) de l’Université de George Mason en Virginie. Ce centre a été fondé en 1994 par Roy Rosenzweig et avait comme but premier la démocratisation de l’histoire (accessibilité des sources) par l’utilisation de l’informatique et des médias numériques. En avril 2011, suite au décès de son fondateur en 2007, le centre a été renommé Roy Rosenzweig Centre for History and New Media en son honneur. Les activités du CHNM se divisent en trois catégories principales : enseignement et apprentissage, recherche et outils et expositions et collecte, sections que l’on retrouve sur le site du CHNM.

La première section du site se consacre à l’éducation. Le CHNM présente ici une vingtaine de projets qui peuvent être utilisés dans le cadre de la planification d’un cours ou par les étudiants eux-mêmes dans le cadre de leurs travaux. Chaque site a un thème spécifique et présente dans la majorité des cas, une multitude de sources primaires qu’il est possible de consulter. Le site Teaching American History propose des plans de cours, des documents d’archives, des exercices d’analyse de sources primaires, etc. pouvant être utilisés dans le cadre d’un cours sur l’histoire américaine. Ils est donc possible de trouver de l’information sur l’histoire, majoritairement américaine, mais également sur d’autres périodes telles que la Révolution française (Liberty, Equality, Fraternity : Exploring the French Revolution).  Des sites plus généraux sont également présents comme World History Sources qui présentent un dossier complet sur l’analyse des différents types de sources que l’on utilise en histoire.

La seconde section présente différents outils qui peuvent être utilisés dans le cadre de recherche en histoire. Parmi les outils les plus connus développés par le CHNM, on retrouve Zotero et Omeka. On y retrouve également le livre de Daniel J. Cohen (directeur actuel du CHNM) et de Roy Rosenzwieg, Digital History : A Guide to Gathering, Préserving and Presenting the Past on the Web dont nous avons eu quelques chapitres à lire dans le cadre de notre cours. Parmi les autres outils présentés, on retrouve un outil de recherche de syllabus par sujet à travers un grand nombre d’universités et de collèges, une étude en cours sur l’utilisation de la recherche plein texte (text mining), un programme pour construire une ligne du temps, un moteur de recherche pour les départements d’histoire à travers le monde, etc. Cette section constitue donc une «boîte à outils» pour la recherche.

La dernière section est consacrée à la collecte d’archives numériques et à la présentation de quelques expositions, dont une sur les goulags en URSS. On y retrouve également un site consacré aux ouragans Katrina et Rita, mais la pièce maîtresse de cette section est sans nul doute le site consacré aux événements du 11 septembre 2001 (The Septembre 11 Digital Archives). Dans le cadre de ce projet, plus de 150 000 pièces numériques (courriels, images, articles, etc.) ont été recueillies et sont maintenant accessibles à tous. Ce projet démontre bien les préoccupations du CHNM, soit la conservation des archives et particulièrement celles du présent qui seront, pour les historiens du futur, leurs principales sources. Le numérique prend de plus en plus de place dans nos sociétés, mais les traces qu’il laisse sont parfois éphémères. Je vous invite à lire à ce sujet un article de Roy Rosenzweig, «Sacricity or Abundance ? Preserving the Past in a Digital Era», paru en juin 2003 dans The American Historical Review. Cet article portait sur le problème de la conservation des archives numériques. Étant rédigé par le fondateur du CHNM, ce texte aide à bien saisir le but de cette section du centre qui vise à préserver la mémoire collective par la contribution volontaire, la collecte, etc.

Le CHNM est donc un bon exemple de l’utilisation des médias électroniques et de l’informatique pour la diffusion de l’histoire à un public le plus large possible et la devise que l’on retrouve au bas des pages du site, «Building a Better Yesterday, Bit by Bit», résume bien la mission du CHNM. Que ce soit au niveau primaire, secondaire ou universitaire, pour les enseignants ou les étudiants, tout le monde qui a un intérêt pour l’histoire peut y trouver son compte. L’association du CHNM avec une université assure en quelque sorte la qualité de ce qui y est présenté ainsi que le l’évolution constante de son contenu. La langue peut être une barrière à première vue, mais la richesse de ce qu’on y trouve dans les différents sites vaut le détour comme on dit …

 

Sources :

Center for History and New Media, http://chnm.gmu.edu/, 12 décembre 2011.

CHOEN, Daniel J. et Roy Rosenzweig, Digital History : A Guide to Gathering, Preserving and Presentig th ePas on the Web, Philadelphie, University of Pensilvania Press, 2006.

Rosenzweig, Roy, «Sacricity or Abundance? Preserving the Past in a Digital Era», The Américan    Historical Review,vol. 108, no. 3, juin 2003. <http://www.historycooperative.org/journals/ahr/108.3/rosenzweig.html > (13 décembre 2011)


La recherche plein texte, le piège de la facilité !

Ma dernière entrée de blogue portait sur un texte de Donald Fyson : À la recherche de l’histoire dans les bibliothèques numériques : les leçons de notre mémoire en ligne, plus précisément sur la première partie du texte. Dans cette première partie, Fyson faisait quelques mises en garde quant à l’utilisation de ces archives numériques dans le cadre de recherche en histoire. C’est à croire que cet auteur m’a inspiré, car mon entrée portera sur la seconde partie de son article qui traite de l’utilisation de la recherche plein texte……en histoire !

Cet outil se révèle des plus précieux dans notre quête du temps. En effet, la recherche plein texte permet à l’historien d’effectuer une recherche par mot clef au niveau de millier de documents, et ce, en quelques secondes !

De façon traditionnelle, l’historien aurait dû se limiter à un corpus de sources raisonnables (échantillon) et éplucher ces dernières une par une à la recherche du mot clef ou d’un concept faisant l’objet de sa recherche. Beaucoup de temps et de patience résument ce genre de recherche, mais ces dernières peuvent être très enrichissantes dépendamment des sources consultées.

Mais attention chers amis, la facilité ne vient jamais sans contrainte et l’historien doit être conscient des limites de ces outils et des pièges qu’ils peuvent comporter dans les résultats obtenus. C’est ce que Donald Fyson nous présente dans la seconde partie de son article.

Les limites sont ici importantes et l’utilisation de la recherche plein texte dans le cadre d’une recherche ne doit pas se faire de façon innocente. L’historien doit en effet connaître les contraintes liées à l’utilisation de cet outil. Contrairement à une recherche méticuleuse au niveau d’un corpus de sources passé au peigne fin par le chercheur, les résultats d’une recherche plein texte effectuée par un moteur de recherche ne doivent pas être pris avec certitude et l’historien, selon Fyson, se doit d’admettre qu’ils sont possiblement erronés. Un résultat négatif ne doit donc pas être pris pour une absence de résultats.

Le moteur de recherche fait une analyse bête d’un texte, dénué de toute interprétation et de toute mise en contexte de la production du document dans son ensemble ou de l’utilisation d’un mot dans une phrase. Cette limite au niveau de l’analyse amène donc une possibilité d’erreur au niveau de la recherche même. L’historien devra donc faire preuve d’ingéniosité dans la formulation de ses requêtes afin de pallier le manque de subtilité du moteur de recherche ! Les requêtes devront être formulées de plusieurs façons afin de ne rien échapper. Fyson donne l’exemple du «s» qui au début du XIXe siècle revêt une forme allongée, «ƒ», que les moteurs de recherche confondent avec la lettre «f». La requête devra donc comporter les deux formes d’écriture, soit par exemple «secrétaire» et «fecrétaire» afin que la recherche soit complète. La langue évolue également au fil des siècles et certains termes utilisés à une époque ne le sont plus aujourd’hui. L’historien devra donc tenir compte de cette évolution dans le cadre de sa recherche.

Un des avantages de la recherche plein texte est qu’elle permet de traiter une quantité importante de source en peu de temps. Cependant, ce type de recherche se prête difficilement aux recherches de mots ou concepts trop généraux. Une telle recherche peut générer une quantité faramineuse d’occurrences qui seront difficilement traitables par les facultés limitées de l’être humain. Je ne veux pas dire ici que l’intelligence humaine est inférieure à celle de la machine, mais vous conviendrez avec moi que passer au travers de plus de 50 000 occurrences concernant le mot «parlement» est une tâche herculéenne. Cette abondance de résultats rendus possibles par la recherche plein texte influence donc la recherche des historiens vers des sujets de plus en plus précis aux résultats plus gérables. Ce type d’outils crée donc un curieux paradoxe. Il permet de traiter une quantité importante de sources, mais dirige les recherches vers des sujets qui génèreront moins de résultats.

L’historien, lorsqu’il utilise la recherche plein texte dans le cadre d’une recherche, doit être conscient que les résultats obtenus peuvent être erronés. En fait, il faut être conscient qu’avec la recherche plein texte, on sacrifie la qualité au profit de la quantité. Aucun programme, faisant une analyse unilatérale par présence ou absence d’un mot, ne pourra remplacer un chercheur avec tout son bagage de connaissances mis au profit de la compréhension d’un document. Mais la disponibilité accrue des sources (les sources ont toujours été abondantes, mais avec la numérisation et le WEB elles sont de plus en plus facilement disponibles) rend le virage informatique presque incontournable. Cependant, l’historien en tenant compte des limites de cet outil pourra éviter quelques pièges dans son interprétation des résultats.

Source :

FYSON, Donald, « À la recherche de l’histoire dans les bibliothèques numériques. Les leçons de Notre mémoire en ligne », Revue d’histoire de l’Amérique française, vol. 59, no 1-2, été-automne 2005, p. 95-113. <http://www.erudit.org/revue/haf/2005/v59/n1-2/012721ar.html> (24 novembre 2011).


Histoire de chiffres !

Lors du dernier cours, M. Yves Gingras nous a présenté une façon différente de faire de l’histoire par l’analyse de textes provenant d’un corpus de lettres d’une façon purement mathématique. D’entrée de jeu, on peut dire que cette méthode est quelque peu déstabilisante pour un historien ou un chercheur en sciences humaines qui ne fréquente pas nécessairement le domaine des chiffres et des graphiques dans le cadre de ses recherches.

Cette méthode fait abstraction du contenu des lettres (ou de toute autre forme d’écrit) pour se concentrer uniquement sur la fréquence de certains mots ou de leur association avec d’autres mots afin d’en tirer des tendances. De ces tendances on peut par la suite établir des liens conceptuels ou sociaux entre les acteurs impliqués dans ces documents ou établir tout simplement la force d’un concept pour une période donnée.

Cette méthode se rapproche plus des sciences appliquées que des sciences humaines puisqu’elle se base sur l’analyse de chiffres obtenus à l’aide d’une méthode d’extraction (manuelle ou informatique) et qui sont par la suite transposés en graphiques (réseaux). Ce genre d’analyse est fréquent dans différents domaines de recherche des sciences appliquées (par exemple dans le cas de résultats d’analyses d’échantillons effectués sur une période X que l’on reporte par la suite sur un graphique), mais demeure relativement nouveau en histoire.

Par son détachement par rapport à l’objet de recherche, cette méthode permet d’avoir une vue d’ensemble différente du sujet, soit de l’ordre de la macro comme le soulignait M. Gingras lors de sa présentation. Cette vue d’ensemble permet donc d’orienter où d’aborder un sujet de recherche d’une façon différente.

Ce type d’analyse des textes peut se faire de façon manuelle pour de petits corpus. Toutefois, lorsque ce dernier prend de l’ampleur, il devient difficile, presque impossible, d’en faire une analyse efficace et complète sans un outil informatique adapté qui pourra faire l’opération de recherche en un court laps de temps. L’outil informatique permet de ne plus imposer de limite à la recherche et ainsi obtenir un portait globale du champ d’études. C’est le volume important qui peut-être traité qui rend justement intéressant ce genre d’analyse. Plus ce dernier est important, plus sera représentative l’analyse que l’on en fera.

Le problème est justement la disponibilité de ces corpus qui n’est pas toujours évidente et qui rend donc l’utilisation de cette méthode limitée pour le moment. La numérisation des documents d’archives prend de plus en plus d’ampleur pour les raisons que l’on a vues depuis le début du cours. Ce phénomène permettra donc d’accroître le nombre de corpus disponibles pour ce genre de recherche, à la condition que le format utilisé pour la numérisation permettre ce type d’interrogation et que ces corpus soient accessibles à la communauté et non concentrés dans des fonds d’archives privés (voir le texte de Daniel J. Cohen et Roy Rosenzweig au sujet de l’accessibilité des sources numériques http://chnm.gmu.edu/digitalhistory/introduction/).

Dans un futur pas si lointain, les archives du web constitueront une pièce maîtresse de l’étude historique des décennies 80, 90 et 2000. Ces archives, qui seront déjà sous une forme numérique, formeront donc un corpus incroyable pour ce type de recherches statistiques. Avec l’informatique, il n’y aura plus de limite aux nombres de données et les possibilités d’association de mots seront presque illimitées. Les bases de données ainsi crées seront donc des plus complètes et permettront d’établir des tendances fiables et pertinentes. L’avenir est donc prometteur pour cette méthode de recherche.

Jean-Philippe

 

Sources :

COHEN, Daniel J. et Roy ROSEINGBERG, «Introduction : Promise s and Perils of Digital History» dans Digital History: A Guide to Gathering, Preserving, and Presenting the Past on the Web, Philadelphie, University of Pennsylvanie Press, 2006. <http://chnm.gmu.edu/digitalhistory/introduction/> (23 octobre 2011).

GINGRAS, Yves, «Mapping the structure of the intellectual field using citation and co-citation analysis of correspondences », History of European Ideas, vol. 36, no 3 (2010) pp. 330-339. <http://www.chss.uqam.ca/Portals/0/docs/articles/2010/Correspondence%20HEI%28Gingras%29.pdf> (23 octobre 2011).


Histoire de Montréal: corpus archivistique en ligne.

Bonjour tout le monde!

Le 24 octobre dernier, François Gervais publiait sur notre blog l’article  » Le Vieux-Montréal et son patrimoine » dans lequel il montrait toute la richesse du site web du Vieux-Montréal  (https://his7008.wordpress.com/2011/10/24/le-vieux-montreal-et-son-patrimoine/).

En effet, ce site est une mine de renseignements pour ceux qui s’intéressent à l’histoire du patrimoine et à la géographie urbaine. Comme François le souligne, la carte interactive y est particulièrement intéressante, je dois avouer que je m’y suis attardé un bon moment! Dans la même veine, je voulais référer d’autres ressources en ligne à ceux qui s’intéressent à la géographie urbaine et plus particulièrement ici, à l’histoire de Montréal.

Premièrement, les Atlas disponibles sur le site de la Bibliothèque et Archives nationales du Québec offrent la possibilité de situer géographiquement le secteur montréalais analysé et de définir le type de bâtiment (http://services.banq.qc.ca/sdx/cep/accueil.xsp?db=notice). Ils nous donnent un aspect visuel de la répartition de la population sur les rues et les types de constructions présents, plus particulièrement, quand ils sont mis en relation avec l’Annuaire Lovell et les Recensements du Canada. Ensemble, ces trois sites d’archives permettent d’analyser une multitude d’informations, et ce, dans divers quartiers ou districts montréalais (ou autres régions du Québec).

Comme Atlas disponible, voici l’un des nombreux plans d’incendie de la ville de Montréal, celui du prolifique Charles Goad de 1912-1914, (quartier St-louis, tout près de l’UQAM actuelle).  Les bâtiments de pierres ou de briques sont en rose et ceux de bois en jaune.

Source: Bibliothèque et Archives nationales du Québec.


Pour le même lieu, voici l’Annuaire Lovell en ligne qui contient le nom des principaux résidents par adresse et leur emploi du temps (quoique les métiers ne sont pas toujours indiqués). (Exemple de la rue Dorchester en 1910-1911).  110643_1910-1911_0207
La dernière source en ligne à présenter et non la moindre est celle des Recensements du Canada entre les années 1871 et 1911. Ils livrent une multitude d’informations sur le lieu de résidence, l’âge, le lieu de naissance, la situation familiale, la religion, la profession et les gains de la plupart des habitants montréalais. Voici l’une des pages des listes nominatives du Recensement de 1911. (Toujours sur la rue Dorchester, (District 182, sous-district 23). e002076584

Ces trois types de sources mis en ensemble et sur plusieurs années permettent de répondre à plusieurs questions en rapport avec les Montréalais de l’époque:  phénomène migratoire, situation civile, caractéristiques socio-économiques, logement, environnement urbain, ect. Les informations sont cependant inégales et des zones d’ombre persistent sur certains traits de la vie des habitants. Ainsi, il faut apprivoiser les problèmes que peuvent engendrer ces sources : erreur des recenseurs, problème de numérotations, manque d’information, etc. Ces outils en ligne nous permettent ainsi de se frotter aux erreurs et obstacles des sources que nous devons contourner par une analyse exhaustive des données disponibles. Il faut donc éviter les conclusions trop hâtives et relativiser les chiffres et les sources à notre portée.

Ces outils, issue du développement incroyable des humanités numériques, démontrent l’accessibilité grandissante des documents historiques en ligne.  J’espère que ces liens seront utiles pour quiconque s’intéresse à l’histoire de Montréal.

Guillaume

Bibliographie:

– Le plan d’assurance-incendie de Charles Goad de 1912-1914 sur Bibliothèque et Archives nationales du Québec:  http://services.banq.qc.ca/sdx/cep/document.xsp?id=0000174399&epage=4&eview=CARTES_PLANS/174399/174399_029.tif

– Annuaire Lovell sur Bibliothèque et Archives nationales du Québec:  http://bibnum2.bnquebec.ca/bna/lovell/

– Recensement du Canada de 1911:  http://data2.collectionscanada.gc.ca/1911/pdf/e002076584.pdf

http://www.collectionscanada.gc.ca/base-de-donnees/recensement-1911/001003-119.01-f.php?sisn_id_nbr=26700&interval=20&PHPSESSID=4diipl92vu14p34o9ups6g3727

http://www.collectionscanada.gc.ca/recensements/index-f.html


LA MÉMOIRE MUSICALE QUÉBÉCOISE EN LIGNE

Le Musée du Rock ‘n’ roll du Québec, une nouvelle institution dont la première exposition temporaire a eu lieu à l’été 2011, mais dont les projets ambitieux promettent de la faire accéder au statut de phare pour le patrimoine culturel du Québec, caresse le projet éminemment urgent de numériser et rendre accessible en ligne le patrimoine musical québécois. Comme son nom l’indique, l’équipe du musée souhaite circonscrire de façon large la musique rock et ses descendants, ce qui peut inclure, le punk, le métal, le rap, presque tout sauf la chanson proprement dite.

L’urgence du projet se pose devant la perte de mémoire combinée au désintéressement des pouvoirs publics pour la musique populaire. Le musée propose de contrer toutes les lacunes de l’éparpillement et de l’accessibilité de la mémoire musicale avec une base de données des plus exhaustives possibles. La priorité est donné à la musique numérisée à partir des disques parus depuis le tout début du rock ‘n’ roll au Québec. Les archives comprendront des fiches biographiques, des images, des vidéo-clips pour chaque artiste répertorié. Un des problèmes actuels de ce patrimoine est que la plus grande partie des initiatives en ligne de conservation de la mémoire et de recherche est faite par des particuliers avec un minimum de moyens. Ces sites ont souvent une présentation peu attrayante, sont mis à jour irrégulièrement, ou sont carrément effacés et leurs informations perdues. Patrice Caron, le conservateur du musée, donne l’exemple du site You are the scene, une mine d’or sur le «hardcore» montréalais de la fin des années 1990, qui après son abandon, a disparu. Résultat : une grande partie de la musique produite au Québec est ignorée des tous et la rareté de certains produits les rend inaccessibles. De plus, les organismes privés qui détiennent des droits et des archives physiques compliquent l’accès et la diffusion du patrimoine.

M. Caron veut valoriser les initiatives personnelles en proposant des liens vers les sites des particuliers et des fanatiques. Le principe du Wiki contribuera aussi à l’exhaustivité et l’accessibilité en permettant à quiconque possède des informations de les diffuser, mais aussi aux différents groupes émergents d’acquérir une visibilité. La consultation des archives en ligne proposera une découverte infinie d’artistes locaux en faisant les liaisons entre eux sous différents thèmes. La numérisation touchera également des études scientifiques et périodiques spécialisés de l’époque contribuant à la connaissance de ce patrimoine. Cette initiative sous-tend un espoir, le développement d’une conscience et d’une ouverture de la part du public québécois. Le projet donne les clés aux Québécois pour aller au-delà de ce qui est préférablement proposé par les radios et l’industrie du disque. Il veut aussi redonner ses lettres de noblesse aux Québécois en détruisant l’idée préconçue selon laquelle la création locale se veut à la remorque de ce qui s’est fait aux États-Unis, en France ou en Europe.

Le Musée se servira du programme de gestion de collection en ligne Mimsy (). Une collaboration avec Radio-Canada lui donne accès à l’équipement de numérisation nécessaire ainsi qu’à l’expertise d’archivistes professionnels. Faut-il préciser que le Musée ne souhaite pas détenir nécessairement les archives physiques, mais vise plutôt l’emprunt de collections. Une autre organisme important poursuit un projet complémentaire à celui du Musée du Rock’n’roll du Québec. C’est le GAMIQ () ainsi que l’association de la musique indépendante qui conserve absolument toute la production indépendante québécoise depuis 2006, ce qui correspond à environ 300 albums par année. Ultimement, Patrice Caron veut rendre les expositions du musée en ligne. Il croit aux possibilités du WEB, comparativement à l’exposition physique qui nécessite des moyens financiers plus importants. D’ailleurs le financement passera en partie par la mise sur pied d’une nouvelle fondation. Le site sera parallèle au site du musée et s’appellera Rockr. Le musée vise avril 2012 pour la mise en ligne de la première version du wiki et la première partie de la collection.

Alex Giroux

Source: Entrevue avec M. Patrice Caron, directeur et conservateur, Musée du Rock ‘n’ Roll du Québec.