Ein normales PDF sieht in zehn Jahren vielleicht noch genauso aus, vielleicht aber auch nicht, weil eine Schriftart fehlt oder ein Plug-in verschwunden ist. PDF/A schließt genau diese Lücke: ein Format, das garantiert, dass ein Dokument auch in Jahrzehnten noch exakt so aussieht wie heute. Wofür es gedacht ist, wie sich die Versionen unterscheiden und warum es in Deutschland gerade wieder hochaktuell ist.
Das Problem: PDFs sind nicht von Natur aus archivtauglich
Ein gewöhnliches PDF darf sich auf seine Umgebung verlassen. Es kann auf Schriften zeigen, die auf dem System des Erstellers installiert waren, aber nicht eingebettet sind. Es kann proprietäre Farbräume nutzen, externe Inhalte referenzieren oder per JavaScript erst beim Öffnen korrekt aufgebaut werden.
Solange die passende Software und alle Ressourcen vorhanden sind, geht das gut. Für ein Archiv, das auf Jahrzehnte angelegt ist, sind genau diese Abhängigkeiten aber das Risiko: Was, wenn die Schrift fehlt, der Reader die Funktion nicht mehr kennt, der externe Inhalt offline ist?
Die Lösung: PDF/A als selbstgenügsames Subset
PDF/A (standardisiert in der ISO-Normenreihe 19005) ist eine bewusst eingeschränkte Variante von PDF. Die Grundidee: Ein PDF/A-Dokument muss alles enthalten, was es zur originalgetreuen Darstellung braucht, ohne sich auf irgendetwas außerhalb der Datei zu verlassen.
Daraus folgen die zentralen Regeln:
- Alle Schriften müssen eingebettet sein, also kein Verlass auf System-Fonts.
- Geräteunabhängige Farben (ICC-Profile) für konsistente Farbwiedergabe.
- Pflicht zu XMP-Metadaten für die wesentlichen Dokumenteigenschaften.
- Verschlüsselung verboten, denn das Dokument muss langfristig zugänglich bleiben.
- Kein JavaScript, keine externen Verweise, also nichts, was später ins Leere laufen kann.
Die Versionen: A-1 bis A-4
PDF/A ist über die Jahre in mehreren Teilen gewachsen, die jeweils auf eine neuere PDF-Basis aufsetzen:
| Version | Jahr | PDF-Basis | Wichtigste Neuerung |
|---|---|---|---|
| PDF/A-1 | 2005 | PDF 1.4 | strengstes Subset, keine Transparenz |
| PDF/A-2 | 2011 | PDF 1.7 | Transparenz, Ebenen, JPEG 2000, digitale Signaturen (PAdES) |
| PDF/A-3 | 2012 | PDF 1.7 | erlaubt beliebige eingebettete Dateien |
| PDF/A-4 | 2020 | PDF 2.0 | moderner Stand, Variante 4e für 3D/Engineering |
PDF/A-1 ist das restriktivste und genau deshalb am breitesten kompatibel; Behörden mit Altsystemen schreiben oft PDF/A-1b vor. PDF/A-2 lockert sinnvolle Einschränkungen (Transparenz, Ebenen). Der entscheidende Sprung bei PDF/A-3 ist die Möglichkeit, beliebige Dateien einzubetten. Dazu gleich mehr.
Die Konformitätsstufen: a, b, u
Innerhalb einer Version gibt es Stufen, die beschreiben, wie viel garantiert wird:
- Level B (basic) garantiert die zuverlässige Reproduktion des Aussehens. Es ist die Mindeststufe und die am häufigsten genutzte.
- Level A (accessible) baut auf B auf und ergänzt eine getaggte logische Struktur (Tagged PDF), Unicode-Zuordnungen für allen Text und die Sprachangabe. Damit sind Textextraktion, Vorlese-Werkzeuge und Barrierefreiheit möglich, das aber deutlich aufwendiger korrekt zu erzeugen.
- Level U (Unicode) gibt es ab PDF/A-2: wie Level B, aber mit Unicode-Zuordnung für allen Text, also durchsuchbar, ohne den vollen Aufwand von Level A.
Technisch hält die Datei das in zwei XMP-Eigenschaften fest: pdfaid:part (die Version 1–4) und pdfaid:conformance (die Stufe A/B/U).
Der Deutschland-Bezug: E-Rechnung und revisionssichere Archivierung
Zwei Gründe machen PDF/A hierzulande besonders relevant.
Erstens die revisionssichere Archivierung. Wer Geschäftsunterlagen nach den GoBD aufbewahren muss, braucht ein Format, das die unveränderte, originalgetreue Wiedergabe über die gesamte Aufbewahrungsfrist sicherstellt, also genau das, wofür PDF/A entworfen wurde.
Zweitens die E-Rechnung. Das hybride Format ZUGFeRD (und sein französisches Pendant Factur-X) bettet eine maschinenlesbare XML-Rechnung direkt in ein PDF/A-3 ein. Menschen sehen die gewohnte PDF-Rechnung, Buchhaltungssysteme lesen die eingebettete XML automatisch aus, beides in einer einzigen, archivtauglichen Datei. Genau diese Einbettungsfähigkeit ist der Grund, warum PDF/A-3 hier zur Grundlage wurde. Für jeden, der Bestell- oder Rechnungssysteme baut, ist das kein Randthema mehr.
Entscheidungshilfe
- Behörde / Altsysteme → PDF/A-1b
- Durchsuchbares Archiv → PDF/A-2u
- Barrierefreiheit gefordert → Level A (1a/2a)
- Hybride E-Rechnung (ZUGFeRD/Factur-X) → PDF/A-3
- Neueste Basis, Engineering/3D → PDF/A-4 (bzw. 4e)
Worauf du beim Erzeugen achten musst
Ein PDF wird nicht „aus Versehen" zu einem PDF/A. Beim Export muss das Konformitätsprofil aktiv gewählt werden, und das Werkzeug muss die Regeln durchsetzen: Schriften einbetten, Farbprofil setzen, verbotene Elemente entfernen. Ob eine Datei wirklich konform ist, prüfst du am besten mit einem Validator (z. B. dem quelloffenen veraPDF), bevor sie ins Archiv wandert. Denn „sieht aus wie ein PDF" und „erfüllt ISO 19005" sind zwei verschiedene Dinge.
Dokumente konvertieren mit wandlio
Rund um PDFs und Dokumente bei wandlio:
- Word → PDF: Dokumente ins PDF-Format bringen
- PDF → JPG: PDF-Seiten als Bild exportieren
- EPUB → PDF: E-Books umwandeln
Dokumentkonvertierungen laufen serverseitig, und deine Datei wird danach immer gelöscht.