De tekst van de uitgave van 1656 Varianten

Bruno's Hooghe-Liedt:

Deze editie

Inhoudsopgave van dit hoofdstuk

Doelstelling

Mijn doelstelling in het maken van deze uitgave was meerledig:

Dit is niet de plaats om de technische begrippen die in bovenstaande beschrijving zijn gebruikt uitgebreid te beschrijven. Ik volsta hier met de volgende uiterst beknopte toelichtingen:

De lezer die zich niet intereseert voor de technische aspecten van deze uitgave kan de volgende paragrafen over slaan en verder lezen in Inhoudelijke verantwoording

Waarom XML, waarom TEI, waarom XSLT?

Waarom XML?

XML is een dialect van de SGML-familie van markup-talen, en de argumenten voor het gebruik van XML zijn de doelstellingen die met SGML altijd beoogd171 zijn:

De redenen om voor XML te kiezen in plaats van voor SGML zijn van praktische aard: XML is populair in de wereld van het World Wide Web. Software-leveranciers spannen zich in om hulpmiddelen te bouwen die het mogelijk maken XML-documenten te ontsluiten op het web. Ook hulpmiddelen voor het aanmaken en bewerken van XML-documneten verschijnen in een hoog tempo. Dankzij XML worden de beloften van SGML werkelijkheid172.

Waarom TEI?

Dankzij de inspanningen van het Text Encoding Initiative bestaat een apparaat dat gedetailleerde beschrijving en analyse van teksten mogelijk maakt. Alle wetenschappelijke elektronische tekstarchieven zien het belang van TEI in173. Het heeft geen zin om voor literair-wetenschappelijke doeleinden een andere DTD174 te gebruiken.

Waarom XSLT?

Bij het vervaardigen van een electronische editie is het maken van een XML-document alleen een eerste stap. Een XML-document zelf is door de aanwezigheid van de markup niet goed leesbaar. Één of andere vorm van transformatie moet daarom plaats hebben voor het document aan lezers kan worden aangeboden. Er moet daarvoor een aantal keuzes worden gemaakt:

Ik heb voor deze editie gekozen voor statische (eenmalige) transformatie naar HTML met behulp van XSLT. De redenen daarvoor zijn:

Technische invulling

Invulling van alternatieven bij codering volgens de TEI-normen

Bij het gebruik van de TEI Guidelines moeten keuzes gemaakt worden, omdat er vaak verschillende manieren zijn om een zelfde verschijnsel te coderen. Bovendien moet gekozen worden wát precies wordt gecodeerd. In deze paragraaf verantwoord ik welke keuzes ik heb gemaakt.

De gebruikte DTD

De Document Type Definition die ik heb gebruikt heb ik aangemaakt met behulp van de Pizza-chef. De 'Pizza-chef' is een website die DTD's genereert aan de hand van een aantal door de gebruiker gemaakte keuzes (wat voor soort werk wil ik uitgeven, wat voor soort editie wil ik maken, wil ik XML of SGML gebruiken).

Structuur van het document

De TEI Guidelines lijken bij de transcriptie van bestaand werk er van uit te gaan dat commentaar wordt toegevoegd in de noten en misschien in de 'header' van het document. Van de editie die ik vervaardig wordt het hart gevormd door de tekst van Bruno's Hooglied-uitgave van 1656, maar een in omvang zeker zo groot deel wordt gevormd door verschillende vormen van toelichting: over Bruno's leven, over de tekst van zijn berijming, en over het gebruik van de TEI normen (dit hoofdstuk). Ik heb mij afgevraagd waar ik de verschillende delen van de toelichtende tekst moest onderbrengen: horen ze in hetzelfde document thuis? Is het beter alleen de eigenlijke tekst in het XML-document te coderen en de toelichtingen in afzonderlijke (html-?)documenten onder te brengen? Als gekozen wordt voor een enkele, doorlopende XML-tekst, hoe moet dan de toelichting worden onderscheiden van de orginele tekst? En hoe moet worden omgegaan met de (secundaire) tekstfragmenten die worden opgenomen in de toelichtingen (bijvoorbeeld de brieven)?
Ik heb uiteindelijk de volgende keuzen gemaakt: de tekst van de uitgave van 1656 wordt ondergebracht in het 'body'-element van het primaire 'text'-element. Alle toelichtingen (met uitzondering van noten) maken deel uit van de 'front'- of 'back'-elementen van deze primaire 'text'. Andere originele tekstfragmenten worden gecodeerd als 'text'-elementen binnen 'quote'-elementen die in de 'front matter' of 'back matter' zijn opgenomen.

In zowel de 'front'- en 'back'-elementen als in de 'text' 'body' wordt gebruik gemaakt van ongenummerde (en geneste) 'div'-elementen om de inhoud van de tekst te structureren.

De 'div'-elementen op het hoogste niveau zijn voorzien van 'argument'-elementen die de korte inhoud weergeven. Ze worden gebruikt om de HTML 'description' meta-tag te vullen.

Een aantal onderdelen van de tekst (bijvoorbeeld de noten, het variantenapparaat) wordt met behulp van stylesheets gegenereerd uit andere onderdelen van de tekst. In de tekst zijn daarvoor 'divGen'-elementen opgenomen ('gegenereerde divisies'). Wat ik hier genereer is HTML; van deze tekstdelen bestaat dus geen XML-equivalent.

Namen

Ik heb gebruik gemaakt van 'name'-elementen en niet van de gespecialiseerde elementen voor het coderen van verschillende soorten van persoons- en geografische namen. Namen heb ik onderscheiden in de typen 'person', 'geog' en 'org'. Voor alle namen is een geregulariseerde spelling gecodeerd met behulp van het 'reg'-attribuut. Voor elke naam heb ik steeds dezelfde regularisatie gebruikt, maar ik heb geen vaste regels gebruikt (omdat zulke regels mij niet bekend zijn) om de regularisatie te bepalen.

Voorzien van <name>-tags zijn de namen die voorkomen binnen de 'text' van het XML-document, (dus niet de namen in de TEI-header), m.u.v. de namen die voorkomen in headers en verwijzingen. Waar een naam herhaaldelijk voorkomt heb ik er soms vanaf gezien hem te markeren.

Annotaties

Noten heb ik steeds ingevoegd op de plaats waar ze betrekking op hebben. Ik heb niet geprobeerd om door middel van 'target'- en 'targetEnd'-attributen te markeren welk fragment van de tekst ze becommentariëren. Op sommige plaatsen waar ik noten wilde toevoegen, werd dat door de dtd niet toegestaan. Op die plaatsen (bijvoorbeeld in 'byline'- of 'date'-elementen) heb ik een 'seg'-element ingevoegd om de noot in op te nemen (samen met het becommentarieerde element.

Literatuur, bibliografische verwijzingen

De literatuurlijst is gecodeerd met behulp van 'biblStruct'-elementen. Ze leken me het juiste midden tussen de ongestuctureerde 'bibl'- en de uitputtend gestructureerde 'biblFull'-elementen. Waar van toepassing heb ik gebruik gemaakt van 'analytic'-elementen voor het coderen van artikelgegevens en van 'series'-elementen voor seriegegevens. Voor het 'type'-attribuut van de 'title'-elementen heb ik gebruik gemaakt van de waarden 'main' en 'sub' (voor de hoofd- en ondertitel) en de waarde 'short' voor gebruik in aanhalingen.

Voor verwijzingen naar titels in de literatuurlijst heb ik 'bibl'-elementen gebruikt met als enige subelementen een 'ptr' (pointer) naar de betreffende titel en eventueel een 'biblScope'-element om het bereik van de verwijzing vast te leggen.

Het werd mij uit de Guidelines niet duidelijk hoe een bibliografische verwijzing voor brieven er uit hoort te zien. Ik heb een 'note'-element opgenomen binnen het 'bibl'-element in het omvattende 'cit'-element.

De vertalingen van de brieven heb ik opgenomen in 'cit'-elementen. De naam van de vertaler is opgenomen in het bijbehorende 'bibl'-element.

Citaten

Citaten heb ik steeds opgenomen in 'quote'- of 'cit'-elementen. Waar een bronvermelding wenselijk was, is die steeds opgenomen als een 'bibl'-element direct aansluitend op het 'quote'-element. Beide elementen maken dan deel uit van een overkoepelend 'cit'-element.

Bij citaten uit teksten die deel uitmaken van deze uitgave, is geprobeerd te voorkomen dat de letterlijke tekst nog eens werd herhaald. In citaten van een 'natuurlijke' eenheid (bijvoorbeeld een 'linegroup', 'lg') is dat betrekkelijk eenvoudig. Met het 'copyOf'-attribuut op de aanhalende linegroup wordt verwezen naar het aangehaalde element. Bij het aanhalen van een willekeurig deel van een tekst werkt deze eenvoudige oplossing niet. Het coderen van 'seg'-elementen om de aangehaalde passage te markeren is niet altijd mogelijk, omdat elementgrenzen kunnen worden overschreden. Het verwijzen naar de begin- en de eind-positie van een aangehaalde passage is wel eenvoudig aan te brengen, maar lijkt erg lastig voor de uiteindelijke presentatie. Ik heb hiervoor nog geen goede oplossing.

Varianten

De TEI geeft verschillende mogelijkheden voor het coderen van varianten en het linken van deze varianten met de eigenlijke tekst. Gezien de betrekkelijke schaarsheid van het beschikbare materiaal (drie drukken die weinig verschillen) en de eenvoudige aard van de verschillen tussen de drukken (vrijwel alleen spellings- en interpunctieverschillen) heb ik gekozen voor een eenvoudige inline-weergave van de varianten. De gebruikte methode is de zgn. 'parallel-segmentation'.
Het aangeven van varianten gebeurt hier (bijvoorbeeld) als volgt:

Wiens <app><rdg wit="A1 B1">Voorbeelt</rdg><rdg wit="B1 B2 B3">Voor-beeldt</rdg></app> dat hy was door...

In de lopende tekst worden varianten dus aangegeven door een 'app'-element (voor 'apparatus'), en daarbinnen de afzonderlijke lezingen door 'rdg'-elementen ('readings'). Het 'wit'-attribuut is het sigle. Het verwijst naar een zgn. 'witList', een lijst met 'witnesses', waarin de bronnen worden beschreven. De witList wordt opgenomen in de 'front matter' van het TEI document (zie hier Drukken van het Hooghe-Liedt).

Het gebruik van 'link'-elementen

De tekst van de Statenvertaling heb ik opgenomen in een afzonderlijke 'division' in de 'back matter'. In deze editie heeft die tekst een ondergeschikt doel: de tekst moet getoond kunnen worden aan de lezer die geïnteresseerd is in een vergelijking tussen de tekst van Bruno en die van zijn bron. Het zou betrekkelijk eenvoudig zijn om op basis van de toegekende 'id'-attributen in het stylesheet een link te leggen tussen berijming en bron (de verzen van de Statenvertaling hebben als id bijvoorbeeld 'sv4:5' en het overeenkomstige vers uit Bruno's vertaling heeft als 'id' 'H4:5'). Ik heb dat niet op die manier gedaan omdat dan een essentieel deel van de structuur van de XML-tekst niet in de tekst zelf zou worden verantwoord.
Er zijn verschillende manieren om links tussen tekstdelen te documenteren. Een mogelijkheid is om gebruik te maken van het universele attribuut 'corresp', waarmee een in principe tweezijdige correspondentie tussen parallelle teksten kan worden gedocumenteerd. Het nadeel daarvan is dat de aard van de relatie niet wordt vastgelegd. Dat nadeel gaat nog zwaarder wegen wanneer meerdere parallel-teksten zouden worden opgenomen. In deze editie zou het belangrijk kunnen worden als ik besloot nog andere vertalingen of berijmingen van het Hooglied ter vergelijking op te nemen.
Ik heb uiteindelijk besloten de relatie tussen bron en berijming vast te leggen in 'link'-elementen. Anders dan de HTML-verwijzingen die we gewoonlijk 'links' noemen, zijn TEI-links onafhankelijk van een bepaalde positie in de tekst (ze kunnen op een willekeurige plaats in het document worden vastgelegd). Ze zijn bovendien voorzien van verschillende attributen die de betekenis documenteren: het 'type'-attribuut (legt de betekenis van de link vast; ik heb als de waarde 'source' gebruikt), het 'targFunc'-attribuut (geeft de functie aan van de gelinkte elementen in de link; in dit geval: 'berijming bron'), het 'targType'-attribuut (geeft het type elementen aan dat kan worden gelinkt, in dit geval 'lg l') en tenslotte het 'targOrder'-attribuut (geeft aan of de volgorde van de gelinkte elementen van belang is; in dit geval heeft het de waarde 'Y').
In het document is dus een verzameling 'link'-elementen opgenomen waarin de link tussen de verzen van de berijming en de bron wordt gedocumenteerd. De zojuist genoemde attributen heb ik gecodeerd op het hogere niveau van het 'linkGrp'-element, bedoeld om (soortgelijke) links te groeperen.

Een soortgelijke constructie heb ik gebruikt om de brieven van Bruno te koppelen aan de vertaling van de brieven.

Het gebruik van het 'rend'-attribuut

Het 'rend'-attribuut heb ik gebruikt voor twee doeleinden: in elementen van de oorspronkelijke tekst wordt het gebruikt op de opmaak weer te geven van de oorspronkelijke editie. In elementen van de commentaartekst wordt het soms gebruikt op een opmaak te suggereren voor het stylesheet of de applicatie die de weergave van de tekst bepaalt. De waarden die ik heb gebruikt zijn: 'indent1', 'indent2', 'ital', 'display', 'quoted', 'bold', 'code', 'plain', 'right' en 'sup'.

Talen, writing systems, bijzondere tekens

De TEI-richtlijnen verlangen dat beschreven wordt in welke taal een document of een deel daarvan geschreven is. Op alle elementen is daarvoor het 'lang'-attribuut beschikbaar. De norm ISO639175 beschrijft de te gebruiken taalcodes. De waarden die in het 'lang'-attribuut worden gebruikt verwijzen bovendien naar 'language'-elementen uit de 'file header' die de taal nader beschrijven door een verwijzing naar een 'writing system declaration' voor de betreffende taal176.

Bijzondere lettertekens worden in het XML-document weergegeven als character references in bijvoorbeeld de vorm &eacute; of &kappa;. In de DTD worden deze character references vertaald naar decimale unicode weergaves die er bijvoorbeeld zo uitzien: &#233; of &#954;177.

Ontbrekende passages, toevoegingen

In de brieven zijn door de vertaler een aantal verhelderende woorden toegevoegd. Deze worden zijn gemarkeerd als 'supplied'. De gebruikte 'reason' is 'clarification'. Één passage is niet vertaald, wat gecodeerd is als 'gap' met 'reason' 'irrelevant'. Onleesbare passages in de brieven zijn 'gap's met 'reason' 'illegible'.

Ook in de citaten uit de kanttekeningen heb ik regelmatig het 'gap'-element gebruikt om irrelevant materiaal te kunnen weglaten.

Vergelijking met de brontekst

De plaatsen waar Bruno's tekst afwijkt van de Statenvertaling heb ik gemarkeerd met 'seg'-elementen. Deze 'segmenten' verwijzen met hun 'ana'-attribuut naar 'interp'-elementen. 'interp' staat voor interpretation, en in dit geval leg ik er in vast om wat voor soort afwijking (toevoeging, verwijdering of wijziging) het gaat. De afwijking kan worden verklaard (bijvoorbeeld door een verwijzing naar de Kanttekeningen) in een 'note'-element dat van het genoemde segment deel uitmaakt. Er bestaat echter geen harde koppeling tussen de verklaring in de 'note' en het segment: in het segment kunnen ook noten staan die niets met de afwijking van de Statenvertaling te maken hebben, maar nu eenmaal toevallig bij dat tekstdeel thuishoren.
De overeenkomstige coderingen zijn aangebracht in de tekst van de Statenvertaling zodat zichtbaar kon worden gemaakt (zie Visuele weergave van de verschillen Bruno-Statenvertaling) waar de teksten verschillen. Ik heb niet geprobeerd de coderingen in de tekst van Bruno te 'linken' aan de coderingen in de Statenvertaling.
Een volgende stap zou kunnen zij om van al deze segmenten nog aan te geven (ook in het 'ana'-attribuut) in hoeverre de afwijking betekenisvol is, of misschien zelfs wat de betekenis van de afwijking is. Ik ben niet zo ver gegaan omdat me de tijd daarvoor ontbrak.

De TEI Header

Niet van alle velden in de TEI header was mij duidelijk hoe ze gevuld behoren te worden. Veel gegevens lijken op een aantal plekken te moeten worden ingevoerd. Ik heb mij zoveel mogelijk aan de Guidelines gehouden en waar mogelijk verwezen naar delen van de eigenlijke tekst waar de betreffende informatie al was opgenomen.

Keuzes voor de stylesheets

Een enkel stylesheet of een verzameling stylesheets zal nooit in staat zijn alle mogelijke coderingen van TEI-XML-gecodeerde teksten correct af te handelen. Daarvoor zijn meerdere redenen, wo.: (1) de omvang van de volledige TEI-dtd's, (2) de 'open einden' van de dtd's (bijvoorbeeld de waarden van de 'rend'- ('rendering') en 'type'-attributen die door de codeerders moeten worden gekozen), en (3) de verschillende soorten teksten die kunnen worden gecodeerd.

De stylesheets die ik heb gebruikt zijn gebaseerd op de stylesheets van Sebastian Rahtz178. Ik heb ze echter vérgaand aangepast. Sommige van die aanpassingen zijn uitbreidingen: ik heb voorzieningen aangebracht voor taggings waar Rahtz geen rekening mee heeft gehouden (<app>'s, <link>'s, <biblStruct>'s, etc). Andere aanpassingen zijn eerder beperkingen: voor mijn situatie was bijvoorbeeld het splitsen van de 'body' van de tekst in meerdere bestanden overbodig en complicerend. Ter wille van de begrijpelijkheid heb ik alle onderdelen waar ik geen behoefte aan had verwijderd.

Het is ondoenlijk om alle beperkingen van de stylesheets zoals ik ze heb gebruikt op te sommen. Ik laat het bij de volgende opmerkingen:

Zoals hierboven vermeld en toegelicht heb ik gekozen voor het genereren van HTML. Alle HTML op deze pagina's (met uitzondering van de menu's) is gegenereerd met behulp van de stylesheets.

De feitelijke generatie van de HTML heb ik uitgevoerd met behulp van Saxon. Saxon is één van de beschikbare hulpmiddelen voor het toepassen van XSLT-stylesheets op XML-bestanden179. Saxon ondersteunt een aantal extensies180. De enige extensie die ik heb gebruikt is de extensie die het mogelijk maakt in één procesgang meerdere uitvoerbestanden aan te maken181.

Ik heb geprobeerd de stylesheets te formuleren in algemene termen. Een betrekkelijk groot deel van de codering zou bruikbaar moeten zijn voor alle TEI/XML-documenten. Op veel plaatsen was het echter onvermijdelijk om gebruik te maken van specifieke eigenschappen van dit bestand.

Een evaluatie van de gekozen technieken

De ten behoeve van deze editie gebruikte technieken zijn gedeeltelijk nog betrekkelijk nieuw. Aan de richtlijnen van het TEI wordt gewerkt sinds 1988, maar de gebruikte XML recommendation dateert van 1998 en de XSLT recommendation van 1999. Het is daarom zinvol om kort in te gaan hun bruikbaarheid voor een editie als deze.

Met betrekking tot de mogelijkheid van automatische verwerking:

Voor wat betreft de bruikbaarheid in breder opzicht geldt:

Samenvattend meen ik dat de gebruikte technieken (TEI, XML, XSLT) goed bruikbaar zijn gebleken voor een editie als deze.

Inhoudelijke verantwoording

Voor deze editie heb ik gekozen voor een weergave van de eerste druk van Bruno's Hoogliedberijming, inclusief de opdracht en de lofdichten maar zonder de in hetzelfde boek opgenomen Klaagliederen. De tekst is na transcriptie door twee personen onafhankelijk gecontroleerd. De tekst zoals die wordt gepresenteerd is een tekst met een klein aantal verbeteringen. In de weergave van de uitgave zijn ze gemarkeerd met een rood sterretje dat linkt naar de verantwoording van de verbeteringen. Het zou overigens mogelijk zijn uit het XML bronbestand een tekst te genereren zonder deze verbeteringen.

Alle mij bekende exemplaren heb ik onderzocht op afwijkingen van de druk van 1656. Hierbij heb ik alleen aandacht besteed aan de tekst van de Hoogliedberijming zelf en niet aan de lofdichten, de opdracht of de koppen182.

De typografische bijzonderheden worden in deze weergave grotendeels genegeerd:

Voor wat betreft de annotering van de tekst ben ik er van uitgegaan dat dit geen Hooglieduitgave is maar een uitgave van een Hoogliedberijming. Onduidelijkheden in de tekst die niet voortkomen uit het 17e eeuws taalgebruik maar uit wat nu eenmaal de inhoud van het Hooglied is heb ik vaak gelaten voor wat ze zijn. Bij de annotaties die wel zijn aangebracht ligt de nadruk op toelichting van het 17e eeuws taalgebruik en verklaring van de herkomst van elementen die niet in de tekst van van de Statenvertaling voorkomen. In de toelichtingen heb ik zo veel mogelijk geciteerd uit de kanttekeningen bij de Statenvertaling, omdat de kanttekeningen weergeven hoe het Hooglied in Bruno's tijd gelezen werd. Ik heb in het algemeen afgezien van een toelichting wanneer de gebruikte tekst van de Statenvertaling duidelijk maakt wat de bedoelde betekenis van een passage is.

De tekst van de uitgave van 1656 Varianten

Laatst gewijzigd op: 21-02-2001.