Freie Tools tun sich schwer mit dem PDF-Format. Da empfiehlt es sich, für jede Aufgabe auf einen Spezialisten zu vertrauen, wie zum Beispiel PDFMod.
Zunächst die schlechte Nachricht: Das Portable Document Format eignet sich nur bedingt zum Nachbearbeiten. Dennoch tummeln sich im unüberschaubaren Pool der freien Software zahlreiche Werkzeuge und Plugins, die sich genau diesem Ziel verschrieben haben. Die Freigabe des PDF-Formats (siehe Kasten “Historie”) eröffnete neue Möglichkeiten zum Entwickeln freier Anzeigeprogramme, und für den Import von PDF-Dateien ergaben sich völlig neue Möglichkeiten.
Heute gehört ein PDF-Viewer zum Standard jeder integrierten Arbeitsumgebung. Mittlerweile gibt es – zumindest im Heimbereich – kaum noch Anlass, den Adobe Reader zu nutzen. Mit dem KDE-Werkzeug Okular beispielsweise speichern Sie sogar PDF-Formulare mit ausgefüllten Feldern korrekt ab, ohne dass dabei die Daten verloren gehen.
Historie
Als Adobe Systems Inc. im Jahr 1992 die erste Version von PDF einführte, war das papierlose Büro noch weitestgehend eine Illusion, aber das neue Format, für das das Unternehmen in Form des Acrobat Reader ein entsprechendes Anzeigeprogramm für alle namhaften Betriebssysteme bereit stellte, ließ diesen Traum in greifbare Nähe rücken.
Obwohl Adobes kommerzielle Software zum Erzeugen des Formats noch heute mit hohen Lizenzgebühren zu Buche schlägt, war die Fähigkeit zum Lesen zunächst für 50 US-Dollar zu haben und wenig später sogar kostenlos. Das sorgte für eine schnelle Verbreitung, zumal ein PDF-Dokument tatsächlich auf Anzeigegeräten aller Art und beim Ausdrucken immer gleich aussieht.
Im Laufe der Jahre erweiterte Adobe PDF kontinuierlich um diverse Funktionen, wie die Anzeige von Farben außerhalb des RGB-Farbraums, eingebettete Multimedia-Objekte, ausfüllbare Formulare und vieles mehr. Die Feature-Vielfalt ist heutzutage kaum noch zu überschauen und manches nur noch vom Adobe Reader selbst zu bewältigen.
Später gab das Unternehmen die Spezifikation frei, und 2008 erlangten mehrere PDF-Varianten sogar den Rang eines offiziellen ISO-Standards [1]. Gerade im Linux-Bereich war dies von fundamentaler Bedeutung, denn die Adobe-eigenen Werkzeuge zum Erstellen existieren bis heute nicht als native Linux-Versionen.
Einrichten
Obwohl die Programme zum Import von PDFs und dem Speichern in andere Formate erhebliche Fortschritte gemacht haben, erweisen sich die Dateien doch oft als störrisch. Das liegt vornehmlich daran, dass die Struktur eher der Druckersprache Postscript ähnelt als einem der üblichen Office-Formate, wie beispielsweise dem Open Document Format.
Als hochspezialisiertes Werkzeug zum Modifizieren von PDF-Dokumenten präsentiert sich PDFMod [2] aus dem Gnome-Softwarepool. Es ist wahrlich kein Feature-Riese, doch seine Aufgaben erledigt es zuverlässig. Die Installation gestaltet sich in den meisten Fällen einfach, da viele Distributionen die aktuelle Version 0.9.1 vom März 2011 bereits als Paket liefern.
Sollten Sie PDFMod im Paketmanager nicht finden, genügt der Download der Quellen und anschließend der bekannte Dreischritt configure && make && make install, um die Installation in Gang zu bringen. Das Programm setzt die GTK-Bibliotheken der Version 2, die Poppler-Bibliothek sowie einige Pakete aus der Mono-Entwicklungsumgebung voraus. Nähere Auskünfte hierzu erteilt die Datei README aus dem Tarball.
Im Menü finden Sie PDFMod nach der Installation im Bereich Zubehör, alternativ rufen Sie es im Terminal oder in einem Schnellstartfenster mit dem Befehl pdfmod auf. Weitere Möglichkeiten fehlen derzeit (siehe Kasten “Stapelverarbeitung”).
Stapelverarbeitung
Viele Programme mit grafischer Oberfläche haben ein gerüttelt Maß an Optionen für die Befehlszeile an Bord. PDFMod geht einen anderen Weg: Bis auf die Möglichkeit, dem Programm beim Start eine Datei mit auf den Weg zu geben, herrscht gähnende Leere. Praktisch wäre beispielsweise eine einfache Routine, um mehrere Dateien zu öffnen, diese zusammenzufügen und in einer neuen Datei zu speichern. Im Zeitalter der papierlosen Rechnungslegung böte dies die Möglichkeit, heruntergeladene Rechnungen einfach zusammenzufassen. Freilich vermag PDFMod das auch, aber für eine größere Anzahl von Dokumenten nur wenig praxistauglich. Für diese Aufgabe greifen Sie besser auf echte Befehlszeilenwerkzeuge wie Pdftk [7] zurück.
Umformen
Nach dem Öffnen einer PDF-Datei im Dateimanager oder über das Menü Datei | Öffnen präsentiert die Applikation die einzelnen Seiten als Übersicht in Form von Vorschaubildern (Abbildung 1). Falls diese zu klein ausfallen, passen Sie die Größe über [Strg]+[+] oder mit dem Schieberegler am unteren Fensterrand an.

Abbildung 1: Bei Bedarf stellen Sie die Größe der Vorschaubilder über einen Schieberegler im Hauptfenster ein.
Zunächst müssen Sie eine oder mehrere Seiten markieren, um etwas mit diesen anfangen zu können. Über die entsprechenden Einträge im Menü Bearbeiten wählen Sie alle geraden beziehungsweise ungeraden Seiten aus oder kehren die Auswahl um.
Außerdem existiert eine Suchfunktion, gut versteckt hinter dem etwas unglücklich benannten Menüpunkt Bearbeiten | Passende auswählen. Es öffnet sich ein Texteingabefeld, in das Sie Wörter eingeben, nach denen das Tool im Text des Dokuments sucht. Bei Übereinstimmungen markiert es die entsprechenden Seiten.
Entweder über das Kontextmenü oder das Menü Bearbeiten haben Sie nun die Möglichkeit, Seiten zu verschieben, neu anzuordnen, zu entfernen oder zu drehen sowie Seiten aus anderen PDF-Dokumenten einzufügen. Letztere Aktion fügt das komplette Dokument ein, aber über die integrierten Sortier- und Löschfunktionen filtern Sie Unerwünschtes elegant heraus.
Export
Weiterhin können Sie Seiten “herauslösen”, womit PDFMod den Export in ein neues Dokument meint. Zum Begutachten des Ergebnisses öffnet sich ein neues Programmfenster. Dieses bietet die Möglichkeit, die Seiten in eine Datei zu speichern.
Die genannten Features zielen vorwiegend auf das Aufbereiten eines Dokuments für die Druckausgabe ab, aber PDFMod hat noch mehr zu bieten. Eine interessante Funktion ist der Export von Bildern (Abbildung 2). Falls Sie gelegentlich Mail-Anhänge mit Fotos in Form einer Präsentation erhalten, haben Sie hiermit die Gelegenheit, die enthaltenen Bilder zu archivieren.
Soweit die Theorie. In der Praxis arbeitet der Export nämlich in vielen Fällen nicht korrekt und erzeugt unbrauchbare Bildfragmente. Das liegt allerdings nicht unbedingt an PDFMod alleine, sondern vielmehr an der Art, wie ein PDF-Dokument Grafiken einbindet. Hier stellt die entfernte Verwandtschaft zu Postscript eine noch schwer überwindbare Hürde dar.
Ordentliche Ergebnisse erzielen Sie in der Regel mit eingebetteten JPEG-Dateien. Allerdings lohnt in verzwickten Fällen der Versuch, für die Datei ein anderes Tool wie Pdfimages zu nutzen, um die gewünschten Bilder zu exportieren.
PDFMod versteht sich auf Lesezeichen. Beim Anklicken des entsprechenden Symbols in der Werkzeugleiste oder über den Menüeintrag Lesezeichen | Lesezeichen bearbeiten öffnet sich eine Seitenleiste, in der Sie Bookmarks nach Bedarf hinzufügen oder bearbeiten. Ihre Änderungen sichert das Programm beim Speichern der Datei mit auf die Festplatte.
Beim Archivieren hilft es manchmal, das Dokument umzubenennen, und zwar nicht nur dessen Dateinamen, sondern zusätzlich auch den internen Dokumentnamen. Diese Funktion erreichen Sie über das Menü Datei | Eigenschaften. Neben dem Ändern des Dokumentnamens fügen Sie hier außerdem Schlüsselwörter hinzu, was das Katalogisieren in Bibliographieprogrammen wie beispielsweise Pybliographer [3] vereinfacht. Insbesondere beim Veröffentlichen von Dokumenten in Datenbanken im Internet erleichtern solche Schlüsselwörter das Einordnen in die richtigen Kategorien.
Über den Tellerrand
PDFMod ist im Grunde ein recht simples Programm mit wenigen Funktionen. In den unendlichen Weiten der freien Software gibt es natürlich Programme, die darüber hinaus zum Beispiel einen Import oder Export beherrschen oder es zumindest versuchen. Grafikprogramme wie Gimp (Abbildung 3) oder Inkscape verfügen dazu über rudimentäre Ansätze.
Gimp vermag das PDF-Format zwar zu lesen, wandelt es aber lediglich in eine Rastergrafik um, wodurch sämtliche Formatierungen verloren gehen und am Ende nur eine Art Schnappschuss einer Seite übrig bleibt. Ebenso das Vektorzeichenprogramm Inkscape: Das Ergebnis ist lediglich eine der Originalseite entsprechende Vektorgrafik, aber eben kein echtes Office-Dokument.
Den besten Job erledigt derzeit LibreOffice [4]. Es liest mehrseitige Dokumente als solche ein und erlaubt es (zumindest theoretisch) diese wie jedes andere Dokument zu bearbeiten – und das in jeder LibreOffice-Komponente. Beim näheren Hinsehen fallen jedoch selbst bei simpel gestrickten Dokumenten diverse Formatierungsfehler ins Auge, wobei sich der Effekt bei komplizierten Layouts mit verknüpften Textrahmen oder eingebetteten Grafiken und Tabellen noch verstärkt.
Nacharbeit ist in fast allen Fällen angesagt. Das artet bei großen Dokumenten teils in so viel Arbeit aus, dass ein echter Import mit vertretbarem Aufwand kaum noch funktioniert. Aber tatsächlich sind Gimp und Inkscape hinsichtlich der verfügbaren Möglichkeiten und der Praxistauglichkeit meilenweit von LibreOffice entfernt.
Fazit
PDFMod erweist sich als solider Arbeiter. Das Aufbereiten eines Dokuments für die Druckausgabe gehört ebenso zur Liste der Funktionen wie eine Suchfunktion und das Hinzufügen von Schlüsselwörtern. Ein echtes Bearbeiten der Inhalte ermöglicht die Applikation jedoch nicht. Je nach gewünschtem Ergebnis gilt es auf andere Programme auszuweichen. Das, was PDFMod anbietet, erledigt es recht gut, abgesehen vom etwas holprigen Herauslösen der Grafiken.
Seit dem Release der letzten stabilen Version scheint die Arbeit an dem Programm bis auf eine aktuelle Version der Übersetzungen zu stagnieren, wie ein Blick ins Git-Repository verrät [5]. Das Portieren auf Gnome 3 scheint noch nicht einmal als Idee zu existieren. Wenn Sie also in Zukunft etwas mehr von PDFMod erwarten wollen, zögern Sie nicht, eine Anfrage nach neuen Funktionen einzureichen oder über gefundene Fehler zu berichten [6].
Infos
[1] ISO 32 000 (PDF): http://www.adobe.com/devnet/pdf/pdf_reference.html
[2] PDFMod-Webseite: http://live.gnome.org/PdfMod
[3] Pybliographer: http://sourceforge.net/projects/pybliographer/
[4] PDF-Import in LibreOffice: http://www.libreoffice.org/features/extensions/
[5] Git-Repository: http://git.gnome.org/browse/pdfmod/
[6] Bugzilla-Fehlerdatenbank: https://bugzilla.gnome.org/enter_bug.cgi?product=pdfmod
[7] Pdftk-Webseite: http://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/








Also die Lösung sich für jedes Vorgehen ein kostenloses Tool zusammen suchen zu müssen ist doch schon ziemlich umständlich und erschwert einem die Arbeit nur ungemein. Wir sind zum Teil dazu übergegangen zu schauen welche Tools am meisten vereinen und diese mit kosten günstigen alternativen “aufzubocken” so z.B. kommt man mit der PDF Software von Foxit ganz gut klar. Diese erstellten PDFs werden sogar von unserem Dokumentenmangement System von http://www.iqdoq.de akzeptiert und haben bis jetzt auch keine Anfälligkeiten gezeigt die uns je wieder dazu bringen würden großes Geld aus dem Fenster zu schmeißen. Kleiner Tipp: Der Foxit PDF Reader ist… Mehr »
PDFmod ist ein Tool, das Teile aus einem bestehenden ‘pdf’ extrahiert, was sehr nützlich sein kann (z.B. einzelne zu einem bestimmten Thema relevante Kapitel aus einem Script holen). Es ist nicht als Ersatz für Destiller & Co gedacht, auch nicht, um ‘pdf’ zu erstellen (das kann Openoffice / Libreoffice z.B. recht gut).