### Découverte d’une base de données
*Le Projet des Registres de la Comédie Française*
- Jamie Folsom, Ed. M
- Vice Président pour le développement
- Performant Software Solutions, LLC
- Email: [jamie@performantsoftware.com](jamie@performantsoftware.com)
- Site web: [http://performantsoftware.com](http://performantsoftware.com)
- Twitter: [http://twitter.com/jamiefolsom](http://twitter.com/jamiefolsom)
- Github: [http://github.com/jamiefolsom](http://github.com/jamiefolsom)
- Ces Diapos: [http://slides.jamiefolsom.com/sorbonne/](http://slides.jamiefolsom.com/sorbonne/)
- DH Slack: [http://tinyurl.com/DHslackFrench](http://tinyurl.com/DHslackFrench) (en français!)
Note:
Merci à Pascal, à Benjamin, a tous les organisateurs, et à vous tous pour votre interet. Je suis ravi d'etre parmi vous cette semaine.
J'espère pouvoir vous offrir une perspective intéressante sur un projet réel et actuel.
Je vous invite à suivre ces diapos à votre propre rythme, et à noter que sur chaque diapo, il y a des liens a suivre.
Avant de commencer...
Félicitations d'avoir elu un adulte, d'avoir rejetté la racisme et la nationalisme.
Et pardonnez-nous d'avoir échoué sur ce sujet.
Vraiment.
Pardon.
Infiniment.
On compte sur vous, et vous pouvez compter sur nous, on va tour faire pour pas que ça se repètes.
### Agenda
> [http://cfregisters.org/fr/](http://cfregisters.org/fr/)
- Le Projet des Registres de la Comédie Française
- Un survol rapide
- Les résultats
- Les enjeux
Note:
On commence avec un survol du projet, pour vous fournir avec un peu de contexte pour notre discussion.
Ensuite, je vous invite à considerer les résultats qui ont été produit par ce projet, et à les parcourir vous-memes.
Finalement, je voudrais signaler des enjeux qu'on a abordé, et vous inviter à poser des questions, et à discuter.
Alors, on commence avec les objectifs du projet.
[Cliquer sur le lien, et parler du projet en générale: l'équipe, les objectifs, etc. 113 années, recettes]
### Le Projet des RCF
> Un survol rapide
- Les étapes
- [La numérisation des registres](http://cfregisters.org/fr/registres/registres-des-recettes)
- [La saisie des données](http://app.cfregisters.org/registers/40159/edit)
- [La vérification, nettoyage des données](http://cfrp-staging.herokuapp.com/admin/)
- [L'exploitation et la publication des données](http://app.cfregisters.org/registers)
Note:
Ce projet a traversé plusieurs étapes, ce qu'on pourrait attendre avec beaucoup de projets pareils.
Ces étapes se sont déroulé en série pour la plupart. Une question qu'on peut se poser est s'il serait possible qu'ils se déroulent en parallèle.
[Parcourir les trois étapes rapidement]
Comment numériser les registres
Comment saisir les données (categories, normalisation, saisie, vérification)
Phase actuel; comment se servir de ces données; conférences, articles, outils.
### Le Projet des RCF
> Les résultats: mini-hackathon: trois options
- Comment rendre les données dans une form utilisable, et accessible aux publiques?
- Pour decouvrir un peu les possibilités et les enjeux, je vous propose de construire quelque chose avec nos données.
- [Des vues des données (non-accessible au publique)](https://dataclips.heroku.com/clips)
Note:
Mettez-vous en groupe de deux ou trois, avec un ordinateur.
Nous allons télécharger des donneés, et les manipuler.
### Le Projet des RCF
> Les résultats: mini-hackathon: option 1
- Option 1: Créer une gallerie des auteurs
- Palladio [http://hdlab.stanford.edu/palladio/](http://hdlab.stanford.edu/palladio-app/#/upload)
- [Point de départ](/data/gallerie/successful-gallery.json)
- Fichiers CSV:
- [Auteurs](/data/gallerie/auteurs.csv)
- [Person-Depictions](/data/gallerie/person-depictions.csv)
Note:
### Le Projet des RCF
> Les résultats: mini-hackathon: option 2
- Option 2: Créer un visualisation temporelle des recettes par jour pour la saison 1750-1 (plus table si vous voulez)
- Palladio [http://hdlab.stanford.edu/palladio/](http://hdlab.stanford.edu/palladio-app/#/upload)
- [Point de Départ](/data/recettes-par-date/successful-timeline-with-table.json)
- [Fichier CSV: Recettes par date (livres uniquement)](/data/recettes-par-date/recettes-livres-1750-1751.csv)
Note:
### Le Projet des RCF
> Les résultats: mini-hackathon: option 3
- Option 3: Créer autre chose!
- Palladio [http://hdlab.stanford.edu/palladio/](http://hdlab.stanford.edu/palladio-app/#/upload)
- Point de départ: [pieces jouées en 1750-1751](/data/autre/1750-pieces.json)
- Fichiers CSV:
- [Correspondances entre Registres et Pièces](/data/autre/register_plays.csv)
- [Pieces](/data/autre/pieces.csv)
- [Auteurs](/data/autre/auteurs.csv)
- [Acteurs](/data/autre/acteurs.csv)
- [Participations](/data/autre/participations.csv)
Note:
### Le Projet des RCF
> Les enjeux
Note:
On se pose non seulement la question de pourquoi les bases de données dans l'etude de l'histoire, mais aussi: comment reussir?
- Les publiques
- La culture du travail
- L'interoperabilité
- La durabilité
### Le Projet des RCF
> Les enjeux: les publiques
- Les Chercheurs
- Les Profs/Les Étudiants
- Les Développeurs
- Tout le monde
### Le Projet des RCF
> Les enjeux: les cultures du travail
- Le travail en équipe
- Les différentes compétences
- Les perspectives divergentes
Note:
Les HN, c'est du travail en équipe, et plutôt collaboratif
Traduire entre les différentes connaissances dans l'équipe, c'est du travail aussi
Les perspectives et les motivations des membres de l'équipe peuvent diverger, à travers des axes inattendues
### Le Projet des RCF
> Les enjeux: l'intéropérabilité
- Identifier "la voisinage"
- Trouver des priorités en commun
- Achever "la pollinisation croisée"
Note:
Il y a des efforts qui ciblent l'intéropérabilité des systèmes, BnF entre autres.
A quel point doit-on insister?
Parfois les financements le demandent, mais souvent les utilisateurs s'en fichent.
Il vaut la peine, sans doute, mais si le travail d'un projet demande de la collaboration, l'intéropérabilité le demande dix fois plus.
Ne pas pouvoir dire: "nous avons tout fait nous-mêmes", c'est difficile!
Des colloques comme celui-ci (et d'autres) peuvent offir une réponse.
### Le Projet des RCF
> Les enjeux: la durabilité
- Les produits, peuvent-t-ils etre partagés?
- Sont-elles independantes des systèmes?
- A qui appartiennent-elles?
Note:
Les données, les images, les site et les outils, peuvent-t-elle etre facilement partagées?
Sont-elles techniquement independantes des systemes dans laquelle elles ont étés saisies, et sur lesquelles elles sont stockées?
A qui appartiennent-elles?
Pour notre projet, ce n'a pas pour la plupart été une question politique, mais plutôt logistique.
### Ressources
- Des outils
- Ceux que nous avons utilisés:
- Ruby, Rails, PostgreSQL, Heroku, Javascript
- D'autres
- [neatline](http://neatline.org/) & [omeka](http://omeka.org/)
- [palladio](http://hdlab.stanford.edu/palladio-app/#/upload)
- [hydra](https://projecthydra.org/), blacklight, spotlight, arclight, fedora
- [d3](https://d3js.org/)
- Les sources d'information
- twitter, slack, github, blogs
- Les Conférences
- [DH 2017](https://dh2017.adho.org/), le 8-11 aout 2017, à Montréal
- [DHSI](http://dhsi.org)
### Merci!
*N'hesitez-pas de vous mettre en contacte*
- Jamie Folsom, Ed. M
- Vice Président pour le développement
- Performant Software Solutions, LLC
- Email: [jamie@performantsoftware.com](jamie@performantsoftware.com)
- Site web: [http://performantsoftware.com](http://performantsoftware.com)
- Twitter: [http://twitter.com/jamiefolsom](http://twitter.com/jamiefolsom)
- Github: [http://github.com/jamiefolsom](http://github.com/jamiefolsom)
- Ces Diapos: [http://slides.jamiefolsom.com/sorbonne/](http://slides.jamiefolsom.com/sorbonne/)
- DH Slack: [http://tinyurl.com/DHslackFrench](http://tinyurl.com/DHslackFrench)