30 mai 2007

Brève sur Zotero

Les messages s'enchaînent en ce moment sur la mailing-list des développeurs de Zotero.
J'avoue n'avoir pas le temps de tout lire (la période n'est pas très propice), mais je constate qu'ils semblent s'intéresser beaucoup en ce moment à l'interaction Zotero-Word, avec l'augmentation du nombre de formats bibliographiques disponibles, etc.
Je reviendrai (peut-être ?) sur ces mails trop vite survolés dans quelque temps.

Libellés : ,

Pleade : nouveau site

Pourquoi personne ne m'a-t-il dit (pourquoi n'ai-je vu ça nulle part ?) que Pleade avait un nouveau site : http://www.pleade.com, alors que l'ancien n'est plus à jour depuis 2005 (je crois) ?
La page A propos précise tout de même "ce site n'est pas le site officiel", "il s'agit plutôt d'un site géré par les sociétés Anaphore et AJLSM".
Sans doute. Mais celui-ci a une page d'actualité dont le dernier billet date du 10 mai 2007, il parle de la version 3.0 et de la feuille de route pour y parvenir, des nouveautés à attendre, etc.
Et il a un fil RSS pour chaque page ou presque, dont celui des actualités.
J'ai encore un gros regret : la page de documentation ne fait que renvoyer à celle de Pleade.org, avec cette promesse : "Prochainement, vous trouverez ici de la documentation complémentaire proposée par les sociétés AJLSM et Anaphore. "

Au moins, je découvre qu'on travaille encore à développer l'outil.
Parmi les promesses de la version 3.0 :
  • Une meilleure gestion des groupes d'instruments de recherche : rendre plus explicite les possibilités de recherche dans un groupe d'instruments de recherche, faciliter la navigation entre ces instruments de recherche, etc.
  • L'utilisation d'un cadre de classement pour organiser les instruments de recherche : ce cadre de classement pourra être utilisé pour consulter directement des instruments de recherche, mais il pourra également servir à une meilleure présentation des résultats de recherche.
  • L'utilisation autonome des feuilles de styles de conversion de l'EAD vers XHTML : ces feuilles de styles pourront donc être utilisées en-dehors de PLEADE afin de permettre de produire des instruments de recherche en format HTML statique, utilisables hors PLEADE.
  • Outil de gestion et de consultation de documents numériques : une puissante visionneuse de lots d'images sera intégrée à PLEADE, ainsi qu'un serveur d'images qui permettra d'offrir des fonctionnalités de consultation très intéressantes aux utilisateurs. Ces fonctions seront particulièrement utiles pour les archives numérisées. A noter que la consultation pourra se faire entièrement à l'aide du navigateur Web, sans l'utilisation de modules externes.

Libellés : , , ,

29 mai 2007

Sermons de Jacques de Voragine

Je découvre un site qui ne semble pas bien vieux (février 2007, apparemment) et qui a entrepris d'éditer des sermons médiévaux en TEI (langage XML d'édition de texte) : Sermones.net.
L'outil fonctionne sur un site SPIP, et un moteur de recherche en XML (implémenté à partir de la plate-forme SDX du Ministère de la Culture. Pleade est une implémentation SDX). L'indexation en TEI (plutôt qu'en PDF, par exemple), permet de préciser au sein du document la nature du texte encodé, ce qui permet de lancer une recherche sur les mots-clés, les distinctiones, les figures, les exempla, la matière liturgique. Cela implique sans nul doute un lourd travail en amont de saisie fine et laborieuse des textes.
Mais après tout, les éditeurs de textes médiévaux sont habitués à ce travail de fourmis (cf. les corpus d'incipit, etc.).
La recherche est simple ou avancée. Quand j'ai découvert qu'elle pouvait même se formuler directement en XQuery, j'ai immédiatement pensé que l'Ecole des Chartes et Got étaient derrière -- mais non : c'est le CNRS, l'Institut universitaire de France, et l'UMR Histoire et Archéologie des Mondes Chrétiens et Musulmans Médiévaux qui ont monté ça. L'ensemble est dirigé par Nicole Bériou, de Lyon 2

Elément utile à connaître : c'est du SDX, donc la troncature * permet de se passer des déclinaisons.
Une bonne idée a été mise en place : après une première recherche, on peut relancer une requête "dans ces résultats", ce qui permet de rajouter un filtre sur un autre.


Recherche "monet*"


Un regret toutefois : la liste des résultats fournit le titre du sermon (le jour de l'année liturgique), le thème et l'incipit. Le thème reprend souvent une phrase de l'Ecriture Sainte. Mais cette citation n'est pas toujours référencée au niveau de la liste des résultats (il l'est lorsqu'on consulte le document)

Vous remarquerez aussi dans cette copie d'écran que le format XML permet de proposer facilement plusieurs mises en page du même texte : plan "synthétique", "classique", "pas de plan".
La recherche utilise (comme tout développement SDX) le moteur Lucene, aussi utilisé par Europeana : donc lorsqu'on tape plusieurs mots, il cherche d'abord tous ces mots, puis quelques uns seulement, puis un seul. Donc plus on cherche de mots, plus il trouve de résultats (l'inverse de Google, en fait). Pourquoi pas ? Mais il vaut mieux être prévenu.

Petit bonus : la localisation géographique des membres du projet utilise Google Maps.

Tout cela me fait penser que je suis bien trop éloigné du monde des chercheurs, et qu'ils sont parfois beaucoup plus inventifs que je ne l'imagine (voire même audacieux : la requête en XQuery, c'est aller sans doute un peu loin, même si somme toute ça ne fait de tort à personne).

Libellés : , , ,

24 mai 2007

Comment bien utiliser les "tags"

Les "tags", cette possibilité pour les utilisateurs d'ajouter des mots-clés aux ressources trouvées dans les bases de données qu'ils consultent, font peur aux concepteurs de ces mêmes bases de données.
Surtout si ces derniers sont des professionnels de l'information, qui utilisent un vocabulaire cadré, structuré, limité : Rameau, le MeSH, etc.
Comment permettre aux internautes d'ajouter des mots-clés sans tomber dans la dérive d'un vocabulaire complètement anarchique, avec les variantes singulier-pluriel, les fautes de frappe, etc.

Je vois deux possibilités qui me paraissent largement suffire l'une comme l'autre :
  1. En utilisant la méthode de Delicious de suggestion de mots-clés. Quand on rentre un nouveau favori sur Delicious, il va chercher tous les utilisateurs ayant déjà rentré la même URL, et propose les tags utilisés. Parmi ces tags, il distingue ceux que l'internaute a déjà utilisé pour ses propres favoris déjà créés.
    Cela me paraît très incitatif.
  2. La seconde a été adoptée récemment sur Allociné : pour un film donné, on indique les tags déjà rentrés par les autres internautes, et le nombre de fois où ce tag a été utilisé pour ce film. L'internaute peut bien être rapide de ses dix doigts (ou de ses deux index), il a toujours plus vite fait de recliquer sur un mot déjà rentré que de le retaper avec des variantes ou des fautes (pour l'exemple ci-dessous, "18e siecle" existe, et il faut être obstiné pour vouloir ajouter "XVIIIe siècle)

J'ai lu naguère quelque part que les utilisateurs de FlickR se rendaient rapidement compte des tags les plus utilisés par les autres internautes, et se mettaient à les employer eux-mêmes. On favorise de cette manière la cohérence de la base, sans donner à l'internaute l'impression de le corseter. Et celui-ci enrichit ainsi l'indexation à peu de frais.

Je suis résolument pour la possible intervention des utilisateurs dans une base de données, institutionnelle. Une fois ce principe posé, il suffit de voir comment résoudre les craintes des gestionnaires de la base.

Libellés :

22 mai 2007

Un wiki un jour

C'est très pénible, mais je fourmille d'idées, et je ne travaille pas au Cabinet des Médailles.
Sans abandonner mes autres projets, et notamment Pleade qui me tient à coeur, j'ai très envie à présent de mettre en place un wiki sur la numismatique, pour avoir une base à jour, rendant compte des discussions autour des attributions et des datations.
En effet depuis Poey d'Avant on n'a plus que des monographies, mais aucun outil global sur la numismatique médiévale.
Une base de données "fermée" nécessiterait chez son ou ses concepteurs une connaissance encyclopédique devenue impossible aujourd'hui. Et elle entraînerait une série de critiques des spécialistes, surtout parce qu'elle ne pourrait pas rendre compte des différents avis pour une monnaie donnée.
C'est d'ailleurs bien pour éviter les critiques autant que possible que les RPC, pour leur dernier volume, l'ont mis en ligne d'abord en laissant la possibilité aux chercheurs de réagir et de demander des corrections (cf. ce que j'ai dit de l'interface de consultation).
Un wiki, si tout le monde se prend au jeu, devrait pallier ces défauts et permettre, avec sa forte réactivité, une mise à jour constante.

A cela je donne deux précisions :
  1. il faut une "masse critique" initiale, c'est-à-dire ne pas fournir une coquille complètement vide mais une coquille avec un peu de jaune, afin que les premiers lecteurs puissent progressivement devenir contributeurs avant de se promouvoir auteurs. Donc je pense que je mettrai toutes les monographies d'ateliers de ma thèse en ligne de cette manière.
  2. j'ai avant tout envie d'expérimenter ce nouveau type de site. J'ai essayé le blog, j'ai testé FlickR, Pleade, Spip (logiciel de création de site internet). J'aimerais bien voir à quoi ressemble la création d'un wiki. Mais si "ça ne marche pas", c'est-à-dire si personne ne vient enrichir les articles, je n'y perds rien : j'aurais toujours appris beaucoup en informatique à défaut d'apprendre en numismatique.
Je n'envisage aucun contrôle a priori : il n'y a aucun enjeu politique majeur, aucun risque de dérapage (il me semble). Si des personnes viennent rajouter des liens publicitaires, cela signifie qu'il devient intéressant d'être mentionné sur le site, donc qu'il y a des lecteurs, donc que ces lecteurs sont suffisamment nombreux pour enlever les liens qu'ils jugeraient non pertinents.
Je pense que je reprendrai les choix faits par le concepteur de Bibliopedia, avec le même logiciel (celui de Wikipedia), dont l'interface est familière à tous. En outre un espace d'hébergement de wiki est possible gratuitement -- à condition de laisser une colonne pour la pub : pour une fois je serais prêt à cette concession qui fondamentalement me désole... (je pense que je mettrai alors au point un script Greasemonkey1, si celui-ci n'existe pas déjà, pour masquer la pub).

Pour moi cela implique de convertir plus de 70 fichiers Word en wiki, donc avec tous les paramétrages ça va demander un certain temps. Mais c'est égal : comme ça me semble une bonne idée, j'en viendrai à bout. En outre, il me semble que, si ça marche, ça peut être beaucoup plus utile à la recherche qu'une thèse de doctorat (mais je vais essayer de faire les deux plutôt que de choisir).

Il existe déjà AncienCoinsWiki, anglophone, consacré aux monnaies antiques. J'ignore complètement la valeur scientifique de son contenu.
Il y a également NumisWiki, destiné aux collectionneurs (et j'ai déjà pu voir que les chercheurs n'avaient pas vraiment les mêmes centres d'intérêts). Le site n'a pas évolué depuis quatre mois. Et il est également en anglais.
Je précise que j'ai eu connaissance de ces wikis par WikiIndex (ou chaque créateur de wiki peut venir inscire le sien et faire ainsi connaître son existence).

NB : Figoblog m'apprend que les Archives nationales anglaises se sont enfin lancées dans un projet national de wiki pour les archives. Depuis le temps qu'il paraît évident que les AN françaises devraient faire de même !
Je suppose qu'on est en train d'admettre la possibilité pour un wiki d'avoir une valeur scientifique réelle.

_____________________
1. Greasemonkey est une extension Firefox qui permet d'associer à certains sites définis des petits scripts Javascript, pour par exemple modifier les couleurs d'une page, etc. Il faut à l'occasion de que recense les scripts Greasemonkey utiles à la recherche.

Libellés : ,

Génération 2.0

Mon enfant sera ce qu'il voudra, bien sûr : agriculteur, ingénieur, prof, voire même bibliothécaire.
Mais avant tout, il sera

Bébé 2.0

Libellés :

17 tonnes de monnaies du XVIIe siècle

13 mai 2007

Un sceau de Charles IV (1355-1378)

La première demande d'identification m'est arrivée via ce blog. Je doute de pouvoir suivre activement si celles-ci se multiplient, mais comme pour l'instant c'est exceptionnel, je ne vois aucune raison de ne pas m'y intéresser, puisque cela me permet toujours d'élargir mes connaissances.
En l'occurrence, n'ayant que ma maigre bibliothèque et les ressources disponibles sur Internet, j'ai été vite coincé et j'ai vite pu déplorer les limites de ces dernières.
La localisation et la datation de cet objet s'est faite sans trop de difficultés, car l'exemplaire est en excellent état.
Monnaie de Charles IV - Droit Monnaie de Charles IV - Revers
L'objet appartient à l'empereur Charles IV (1355-1378), et en voici la description complète :
+ ROMA CAPVT MVNDI REGIT ORBIS FRENA ROTVNDI
Porte de ville avec inscrit sur la porte : AVR-EA R - OMA

+ KAROLVS DEI GRA ROMANOR' REX SEMP AVGVSTVS
Personnage couronné en majesté, sur un trône, tenant le globe crucigère. Inscription dans le champ : ET REX BOEMIE

Recherches sur Internet

Je n'ai pas de bibliothèque numismatique à ma disposition, et cet objet dépasse mes compétences (centrées sur le royaume, et même sur les émissions épiscopales et abbatiales -- et un peu les royales). Donc je n'ai pas pu aller très loin et j'espère achever cette recherche lors de ma prochaine visite au Cabinet des Médailles. Mais en attendant...

D'après l'image, l'objet fait 6 cm de diamètre, ce qui est beaucoup trop gros pour être une monnaie au XIVe siècle. J'ai essayé de le retrouver sur Internet directement, à partir de l'intitulé de la légende (d'une portion de légende non abrégée : "KAROLVS DEI GRA" pourrait avoir été transcrit Carolus Dei gratia, par exemple), et suis tombé directement sur un sceau (bulle d'or) de l'empereur Charles IV, avec exactement le même type et la même légende (en plus stylé tout de même).

Les légendes et l'iconographie rattachent cet exemplaire aux bulles d'or des empereurs du Saint-Empire Romain Germanique. La première bulle d'or connue, de Frédéric Barberousse, datant de 1164, montre déjà l'empereur en majesté avec la même légende au droit, et la porte de la ville de Rome, avec également la même légende, au revers.
Ce revers, pour remonter encore plus loin, se retrouve sur un sceau de 1033-1038 de l'empereur Conrad II.
Pourquoi KAROLVS désigne Charles IV ? Parce que l'empereur Charles III (le Gros) règne au IXe siècle, et que la monnaie ne date certainement pas d'aussi loin. Et Charles V (Charles Quint) a régné au XVIe siècle, ce qui serait trop tardif.
La réponse définitive se trouve sans doute dans :
Posse Otto, Die Siegel der deutschen Kaiser und Könige von 751 bis 1806. Tome II : Die Siegel der deutschen Kaiser und Könige von Karl IV. bis Friedrich III. Mittelalterliche Fälschungen. Landfriedenssiegel, Dresde, 1910.
L'ouvrage est numérisé dans le Wikisource allemand, mais il faut feuilleter image par image. J'essaierai de l'y repérer.
En attendant, j'ai tout de même trouvé sur Google Book Search un ouvrage de 1851, Die Siegel der deutschen Kaiser, Könige und Gegenkönige, ou la p. 44 s'intéresse à Charles IV. Mais seule la bulle d'or est répertoriée avec double face : les autres sceaux (le matériau n'est pas spécifié, donc je suppose que c'est de la cire) n'ont qu'une face, et aucun sceau d'argent n'est décrit.
On y apprend également que les bulles d'or de ce souverain font environ 10 cm, et les sceaux 8 cm.

Libellés : ,

04 mai 2007

Quelques infos

Ainsi que m'en avait aimablement prévenu un commentaire, l'arrivée de mon enfant a ralenti l'activité de ce blog. Cela ne veut pas dire que je ne fais plus rien, mais que j'ai beaucoup moins de temps pour commenter ce que je fais.
Pour ceux que ça intéresse, je prépare pour être diffusés sur le portail de ma bibliothèque :
  1. un dossier sur Zotero (plus structuré que les billets épars de ce blog).
  2. une actualité régulière (j'envisage comme périodicité : toutes les deux semaines) sur un outil (ou un type d'outils) web 2 utile à la recherche (moteurs de recherche web 2, outils bibliographiques en ligne, etc.).
Le dossier sera aussi mentionné dans les actualités, si bien que vous pouvez vous abonner au fil RSS des actus si ça vous tente.

Parallèlement, si c'est validé (le marché est encore en cours), cette même bibliothèque pourrait bien utiliser Pleade comme outil de gestion d'une bibliothèque numérique. Une utilisation un peu dévoyée de Pleade, donc, comme ce que j'en fais moi-même, et qui apporte nombre d'insatisfactions mais également des découvertes. Et cela me permet de mieux connaître le logiciel. Donc d'en faire meilleur usage pour mes monnaies.
A ce jour, je n'ai converti en EAD qu'un seul inventaire, celui des monnaies de Malte, qui était en Word stylé.
Il faut que j'effectue à présent, pour enrichir ma base, la conversion d'un tableau Excel en EAD. Ce sera beaucoup plus simple, car la structure d'un tableau est par définition beaucoup plus clair qu'un fichier texte.
La grosse difficulté, c'est qu'un tableau Excel s'apparente beaucoup plus à une base de données relationnelle : pour chaque entrée l'information est répétée (pour chaque monnaie, on indique le nom de l'émetteur, le lieu de frappe, etc.) alors qu'en EAD l'information commune à un ensemble d'éléments n'est dit qu'une fois, en tête.
J'opérerai donc en deux fois :
  1. avec l'outil "Publipostage" de Word, je récupère l'information dans les cellules du tableau, que j'encadre de balises XML :
    <monnaie>
    <emetteur>Evêque de Cambrai</emetteur>
    <ref>IX.9.12</ref>
    <nom>Denier</nom>
    <description>
    <avers><
    <champ>Description du champ<champ>
    <legende>Contenu de la légende<legende>
    </avers>
    <revers>
    <champ>Description du champ<champ>
    <legende>Contenu de la légende<legende>
    </revers>
    </description>
    </monnaie>
    <monnaie>
    <emetteur>Evêque de Cambrai</emetteur>
    <ref>IX.9.13</ref>
    <nom>Gros</nom>
    <description>
    <avers><
    <champ>Description du champ<champ>
    <legende>Contenu de la légende<legende>
    </avers>
    <revers><
    <champ>Description du champ<champ>
    <legende>Contenu de la légende<legende>
    </revers>
    </description>
    </monnaie>

  2. j'utilise une feuille XSLT qui convertit cette information en EAD, en mettant en commun , au niveau supérieur, les éléments à ne pas répéter :
  3. <c>
    <unittitle>Evêque de Cambrai</unittitle>
    <unitid>IX.9</unitid>
    <c level="item">
    <unittitle>Denier</unittitle>
    <unitid>IX.9.12</unitid>
    <c level="otherlevel" otherlevel="avers">
    <scopecontent>
    <p>Description du champ</p>
    <p>Légende</p>
    </scopecontent>
    </c>
    <c level="otherlevel" otherlevel="revers">
    <scopecontent>
    <p>Description du champ</p>
    <p>Légende</p>
    </scopecontent>
    </c>
    </c>
    <c level="item">
    <unittitle>Gros</unittitle>
    <unitid>IX.9.13</unitid>
    etc.
    </c>
    </c>
Il y a bien évidemment d'autres informations dans mes monnaies : références bibliographiques, mots de description (sur la présence de certains types), métal, etc. Ceci n'est qu'un exemple rapide. Il est toujours très pénible d'encoder directement du XML : on perd un temps fou à saisir les balises, et c'est bien pourquoi je dis qu'il faut laisser à la machine le soin de les générer.

A terme, j'ai également l'intention de proposer dans ma base de données, pour chaque notice un export "bibliographique" : je suis sûr qu'en adaptant (très librement et arbitrairement) certains standards bibliographiques, on peut faire rentrer des monnaies dedans, et donc utiliser les outils qui vont avec.

Libellés : , , , ,

Mentions légales

MonnaieCe n'est pas un blog de collectionneur.
Je suis historien, un peu informaticien (j'adore les métadonnées !). D'où ce que vous pouvez lire ici.
Comme vous pouvez le constater, même si je le laisse en ligne, il n'est plus alimenté depuis longtemps.

Recherche sur le web numismate

Recherche dans les livres de numismatique de Google Book Search[...]

 

 

Généré par Blogger

Site Meter