Library Blog

Blog

Ewoud Sanders maakt een eigen digitale bibliotheek in 7 stappen

Op 1 september organiseerde de opleiding Nederlands van de Universiteit Leiden een lezing door Ewoud Sanders getiteld: De reïncarnatie van het boek, in zeven stappen een eigen bibliotheek. Roos Goverde, Cora Pieffers en Simone Kortekaas waren er bij en maakten het volgende verslag.

Ewoud Sanders (bekend van vooral zijn column in het NRC over etymologie en aanverwante zaken) betoogt dat het voor taal- en letterkundigen en historici grote voordelen heeft om een eigen digitale bibliotheek te hebben, en dat het helemaal niet zo moeilijk is om zo’n digitale bibliotheek op je eigen pc aan te bouwen. Met relatief kleine investeringen zouden onderzoekers de kwaliteit van hun onderzoek enorm kunnen verbeteren. Hoe? Ewoud Sanders legt het, gelardeerd met veel voorbeelden van de voordelen, uit in zeven stappen:

Stap 1
Koop twee softwareprogramma’s, namelijk een professioneel indexeringsprogramma en een programma waarmee je pdf’s kunt maken en OCR-en .
Stap 2
Ga oogsten. Op internet (Digitale Bibliotheek Nederlandse Letterkunde, Google Books, Bibliografie van de Nederlandse Taal- en Literatuurwetenschap, Picarta, webpagina’s, etc), kijk wat op CD of DVD verschenen is, vraag pdf’s op bij uitgevers of andere bronnen.
Stap 3
Hernoem de documenten zodat je ze goed kunt sorteren.
Stap 4
Maak thematische mappen.
Stap 5
Maak indexen aan, op het moederbestand of op (wisselende) deelselecties.
Stap 6
Voeg zo nodig handmatig metadata toe, die bruikbaar is voor je (toekomstig) onderzoek.
Stap 7
Ga zelf scannen. Koop een professionele scanner, snijdt de rug van je boeken en scan wat je aan handboekerij in de kast had staan.

De digitale bibliotheek die je op deze wijze opbouwt bevat al snel veel meer tekst en woorden dan je op andere wijze bij elkaar kunt vergaren. Groot voordeel is dat je je bronnen kunt afperken en dat je voor je onderzoek flexibel deelsets van bronnen kunt maken, nieuwe bronnen toevoegen, beperken op een bepaalde periode etc. Je bepaalt zelf welke indexen je voor je onderzoek nodig hebt en indexeren van je bestand kost steeds maar een paar minuten.

Bij de lezing verscheen een mooi boekje waarin alles nog eens uitgelegd wordt, met veel voorbeelden, plaatjes en een CD met daarop een handleiding plus een deel van de taalkundige digitale bibliotheek die Ewoud Sanders zelf heeft opgebouwd (51 miljoen woorden). Dit boekje is aardig voor onze Utrechtse historici en taal- en letterkundigen en zal daarom worden afgeleverd bij de collega’s van de UBB voor mogelijke opname in de collectie van Geesteswetenschappen.

Wat wij hier van leren als bibliotheekmedewerkers? Het is goed om te weten dat onderzoekers hun bronnenmateriaal graag ook zelf verzamelen en wat zij er dan zoal mee doen. En om die onderzoekers te faciliteren moeten we vooral doorgaan met het digitaal aanleveren van materiaal en ons nationaal en internationaal hard maken voor open access van alles wat digitaal beschikbaar is.

3 reacties to “Ewoud Sanders maakt een eigen digitale bibliotheek in 7 stappen”

  1. Bianca

    ‘Snijdt de rug van je boeken’ ??? Hmmm…

    Maar even serieus: het eerste wat bij mij opkomt is dat dat een hele hoop werk is om alleen voor jezelf te doen. Maar toen keek ik naar mijn eigen boekenkast en inderdaad, het idee dat allemaal digitaal beschikbaar te hebben is wel aantrekkelijk…

    Ik ben het dus helemaal eens met de laatste alinea: meer digitaal aanleveren en open access promoten. Ook Google Books kan hiervoor veelbelovend zijn, ondanks alle haken en ogen die daaraan zitten.

    Heeft Ewoud het ook gehad over de kwaliteit die hij bereikt met zijn OCR? Ik weet van Project Gutenberg, dat boeken uit het publieke domein digitaal beschikbaar maakt, dat er voor elk boek minstens 2 rondes ‘proofreading’ overheen gaan (allemaal vrijwilligerswerk overigens, iedereen kan dat doen!).

    Beantwoorden
  2. Jan de Boer

    Ewoud Sanders had in zijn lezing, zo begreep ik van Simone, kritiek op de DBNL. Zij zijn traag en duur, kort samengevat.
    Wat Ewoud Sanders niet vermeld, volgens mijn vrienden bij de DNBL, is dat de scanner bij hem thuis ongeveer 10.000 euro heeft gekost en dat zijn twee kinderen helpen bij het werk. Dat is weer eens iets anders dan de auto wassen.

    De OCR-resultaten, in ieder geval voor oudere werken, zijn slecht. Dat is de reden waarom bij de DBNL de werken worden overgetypt door goedkope krachten op de Filipijnen.

    Volgens mij moeten wij bibliotheken haast maken met de digitalisering. Maar daar wordt aan gewerkt: http://www.dutchprintsonline.nl/

    Beantwoorden
  3. Huib Verhoeff

    Ewoud Sanders vertelt dit verhaal al tijden. Heeft blijkbaar niks nieuws meer te melden nu al zijn kasten leeg zijn.
    Het is volkomen idioot om de inhoud van je eigen boekenkast kapot te snijden.
    We moeten zorgen dat van alle boeken een digitaal exemplaar beschikbaar is tegen een redelijke prijs. Internet verkopers zoals bol.com zijn daar al mee begonnen.
    De bibliotheken moeten zelf digitaliseren in afgeronde mooie projecten en massaal meedoen met Google Books.
    Het is natuurlijk een gotspe (om een bekende Nederlander te citeren) dat Ewoud zijn handleiding in boekvorm uitgeeft.
    Zou hij die thuis al gedigitaliseerd hebben? Of hadden zijn kinderen het te druk?

    Je moet alles willen.

    Een mooi boek naast een retesnelle computer.

    Beantwoorden

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *