Nieuwe Acrobat voor digitale duurzaamheid
Een digitaal archief is waardeloos als je over tien jaar de pdf’s niet meer kunt lezen. Adobe, uitvinder van het bestandsformaat pdf, neemt het voortouw in de technische ontwikkelingen.
Rotterdam, 17 sept. Terugkijkend was het een buitengewoon slimme zet van Charles Geschke en John Warnock. De oprichters van softwarebedrijf Adobe stelden in 1993 de Adobe Reader – toen nog Acrobat Reader geheten – gratis beschikbaar. De stap was ook noodzakelijk. Geschke en Warnock hadden een nieuw formaat ‘digitaal papier’ op de markt gebracht: het nu alom bekende pdf. Maar aanvankelijk was de belangstelling voor dit portable document format gering en waren er verschillende concurrenten op de markt.
De eerste Readers, die 50 euro per stuk kostten, liepen niet, maar toen Geschke en Warnock ze gratis gingen verspreiden ging het snel. Inmiddels is Adobe een multinational – met tachtig producten en wereldwijd 7.300 werknemers – en is pdf een standaard. Sinds 1 juli 2008 is dit formaat door het internationaal normalisatie-instituut ISO uitgeroepen tot een officiële standaard (ISO 32000-1). Dit is van belang, want pdf is nu officieel een zogenoemde Open Standaard. Het bestandsformaat blijft beschikbaar, onafhankelijk van de grillen van de producent. Omdat Adobe de software heeft vrijgegeven, zijn er veel pdf-readers en -makers op de markt beschikbaar. De bekendste pdf-lezer blijft Adobe Reader, waarvan onlangs versie 9 is verschenen. Van alle computers die wereldwijd op internet zijn aangesloten gebruikt 89 procent Adobe Reader, zegt Roel-Jan Mouw van Adobe Benelux. Een aangepaste versie van de Reader zit op steeds meer mobiele apparaten.
Op internet zijn allerlei sites die gratis tekstbestanden omzetten in pdf’s. Het uitgebreidste (en duurste) programma hiervoor is echter Adobe Acrobat.
Traditioneel behoren banken en verzekeringsmaatschappijen tot de grootste afnemers van deze pdf-software, vertelt Roel-Jan Mouw, mede omdat Acrobat is uitgerust met uitgebreide beveiligingsmogelijkheden. Maar de laatste jaren is de belangstelling sterk toegenomen uit een tamelijk onverwachte hoek: die van archivarissen en bibliothecarissen.
Zoals bekend wordt er sinds kort door allerlei instellingen en archieven op grote schaal gescand. Zo worden momenteel alleen in Nederland al ruim honderd digitaliseringsprojecten voor historische kranten uitgevoerd. Vrijwel alle archieven en instellingen die hierbij betrokken zijn, hebben gekozen om hun gedigitaliseerde bronnen als pdf op te slaan of toegankelijk te maken voor het publiek. Hiermee komt een belangrijke vraag in beeld: hoe zorg je dat die pdf’s straks, over tien, vijftig of honderd jaar, nog te lezen zijn? Anders gezegd: hoe zorg je voor digitale duurzaamheid?
„Daarvoor is pdf/a ontwikkeld”, zegt Colin van Oosterhout van Adobe. „Met pdf/a, waarbij de A staat voor ‘archiving’, zijn we teruggaan naar de kern van pdf. Dit formaat is gebaseerd op een oudere versie van Acrobat. De belangstelling uit de wetenschappelijke wereld neemt duidelijk toe. Op een speciale conferentie die deze zomer in Amsterdam werd gehouden, kwamen maar liefst 250 mensen af, vooral archivarissen en bibliothecarissen.”
Ook bij de Koninklijke Bibliotheek (KB) in Den Haag houdt men zich intensief bezig met digitale duurzaamheid. Een van de onderzoekers op dit terrein is Wouter Kool. Hij werkt bij de KB onder meer aan software waarmee allerlei tekstformaten (Word, WordPerfect) kunnen worden omgezet, onder meer in pdf/a. „Dat is een heel goed formaat voor digitale archivering. Als je zomaar een pdf krijgt, dan weet je eigenlijk niet wat je in huis haalt. Bij pdf/a ligt vast wat de structuur van het document is en ook de informatie over lettertypes is aanwezig. Dat zijn twee cruciale aspecten voor digitale duurzaamheid.”
