Verslag Masterclass 17 juni 2014

Op 17 juni 2014 organiseerde PACKED vzw bij FARO een Masterclass onder de naam ‘Prepare your metadata’. De focus van deze masterclass lag op het creëren van schone, gestandaardiseerde data als onderdeel van het dagelijkse werkproces. Als demonstratie van de mogelijkheden werden enkele eenvoudige ingrepen in de lokale catalogus of collectiebeheerssysteem gepresenteerd. Deze zorgen ervoor dat metadata later als gestandaardiseerde, schone (linked) open dataset kan worden beschikbaar gesteld en verrijkt. Ontwikkelaars kunnen er dan ook sneller mee aan de slag om de data te verrijken en te bewerken.

Het ‘waarom’ van deze masterclass werd meteen duidelijk in de presentatie van Henk Vanstappen (PACKED vzw): reality is namelijk messy.  Met enkele eenvoudige voorbeelden werd aangetoond hoe een schijnbaar zelfde aanduiding toch naar een verschillend ding kan verwijzen. Een kleed kan in de Nederlandse taal even goed op vloerbedekking duiden, als op een jurk.

Prepare your metadata – intro from PACKED vzw

 

     

 

Zo kwamen we al snel op het domein van de authorities, identifiers en persistente URLs. De kwaliteitseisen en de syntax voor goede persistente URIs werd belicht, waarna Alina Saenko (PACKED vzw) een overzicht gaf van welke externe autority-bronnen je dan kan raadplegen om bv. een element persistent te identificeren. O.a. VIAF, GeoNames en de Arts & Architecture Thesaurus (AAT) passeerden de revue.

 

Prepare your metadata – creëer PIDs from PACKED vzw

Prepare your metadata – externe bronnen from PACKED vzw

 

 

Na dit eerder theoretische gedeelte: tijd voor een oefening (zie ook lesmaterialen hieronder). De deelnemers gingen in groepjes aan de slag om enkele objecten, die op bestaande webpagina’s beschreven werden, van persistente informatie te voorzien.

 

     

 

Dit bleek echter minder makkelijk dan gedacht; Bart Magnus (VTi) en Tobias Hendrickx (MoMu) presenteerden de resultaten van hun werkgroepje – maar verder dan twee regels PID-informatie kwamen we niet. De discussie was echter wel op gang gebracht; kies je bij een monument voor de domeinnaam van het orgaan dat het monument bezit, of de website van de eigenlijke monument-site? Kan je in GeoNames onderliggende geografische aanduidingen (bv. Brussels gewest) toevoegen (ja, zo bleek)?

 

      

 

Na een pauze werden er enkele praktische demonstraties gegeven over het werken met tools om PIDs (makkelijker) te kunnen toekennen; bv. door het grootschalig opschonen van je metadata (met Open Refine), en/of het toevoegen van een veld aan je collectiebeheerssysteem waarin je de PID-informatie kan opnemen (in Adlib of Collective Access).

Tot slot liet Bert Lemmens zien wat deze aanpak oplevert wanneer je data gaat publiceren: aan de hand van met PID verrijkte data is het vrij eenvoudig gegevens van verschillende collecties samen te voegen, doorzoekbaar te maken en verder te verrijken met gegevens uit externe bronnen, zoals Wikipedia.

 

Prepare your metadata – Markdown demo from PACKED vzw

 

 

Presentaties

Introductie door Henk Vanstappen (PACKED vzw)

Externe bronnen door Alina Saenko (PACKED vzw)

Persistente URI’s door Alina Saenko (PACKED vzw)

Verrijkte online catalogus door Bert Lemmens (PACKED vzw)

 

Oefening

Tijdens de oefening gingen de deelnemers in groepjes tien objecten normaliseren en verrijken. Het lege Excelbestand dat daarvoor gebruikt werd, vind je via deze link.

Stappen:

  1. Download Excelbestand via http://bit.do/pyd
  2. Beschrijf werken in Excelbestand
  3. Selecteer relevante domeinen en voeg waar mogelijk PURLs toe voor namen, concepten, locaties en agents
  4. Creëer een PID voor de werken
  5. Creëer een PID voor de beschrijvingen (data)

Een ingevulde sheet (correctiesleutel) vind je hier terug. Let op: dit is niet de enig mogelijke oplossing; de PIDs die je in dit bestand terugvindt, zijn slechts ‘een’ oplossing.

 

Tools & demos

Open Refine

Tijdens de masterclass gaf Alina Saenko een korte demo van de mogelijkheden met Open Refine en de koppeling van externe databronnen. Een csv-bestand met data verrijkt op basis van Open Refine, vind je via deze link. Meer informatie vind je op de website van Open Refine.

Zoals tijdens de demo al werd aangegeven, vraagt het werken met Open Refine een meer gedetailleerde introductie. Schrijf je daarom in voor de tweede Masterclass op 18 september 2014, die specifiek over het gebruik van deze tool zal gaan. Meer informatie volgt.

 

Collective Access

Joris Janssens (PACKED vzw) toonde via een live demo aan hoe je een bijkomend veld in het open source collectiebeheersysteem Collective Access kon laten genereren.

Meer informatie vind je op de website van Collective Access of via joris@packed.be.

 

Adlib

Jeroen De Meester (Stedelijke Musea Antwerpen) toont hoe je in tien stappen een veld kan toevoegen aan Adlib (collectiebeheersysteem) met behulp van Adlib Designer. Dit nieuwe veld kan je bijvoorbeeld gebruiken voor het toevoegen van PID-informatie aan een record.

Klik hier om de presentatie rond Adlib te downloaden.

 

Verrijkte online catalogus

Bert Lemmens (PACKED vzw) gaf een demo over hoe verrijkte data wordt omgezet naar HTML met de tool Markdown. Wie zelf met de templates aan de slag wil, kan ze hier downloaden.

 

← Terug