Online-Weiterbildung
Präsenz-Weiterbildung
Produkte
Themen
Dashöfer

PDFs: universelles Format mit Tücken in der Bearbeitung

14.11.2013  — Lars Kaupisch.  Quelle: Verlag Dashöfer GmbH.

Hilfsmittel, die Ihnen den Umgang mit PDFs erleichtern – Teil 1.

Sie sind unglaublich praktisch, wenn Sie Dokumente verschicken wollen, bei denen es darauf ankommt, ein bestimmtes Format zu erhalten: PDFs. Wo Microsoft Word und andere Textverarbeitungsprogramme aus jedem "offenen" Text-Dokument mitunter Kraut und Rüben machen, weil bestimmte Formatierungen nicht übernommen werden, könnte das PDF Drei-Wetter-Taft benutzt haben. Alles sitzt.

Problematischer ist es, wenn Sie den Inhalt eines PDFs weiter verarbeiten wollen. Nicht bloß die Nachbearbeitung eines PDFs ist hier gemeint, wie es beispielsweise die Bezahlversion des Adobe Acrobat Readers ermöglicht. Sondern die tatsächliche Nutzung des Textes. Einfaches Herauskopieren reicht häufig nicht, da der Text sich dabei in eine Ansammlung unleserlicher Sonderzeichen verwandeln kann. Es böte sich also die Umwandlung des PDFs in ein simples Textdokument an, damit Sie wieder ganz einfach Word o.Ä. nutzen können. Auch das leistet die Bezahlversion des Readers, die aber natürlich eine Stange Geld kostet.

Glücklicherweise ist das Internet ziemlich groß und bietet für viele Anforderungen das richtige, kostenlose Tool. Vorausgesetzt, Sie wollen wirklich nur an den Text eines PDFs herankommen, nicht auch an Bilder, legen wir Ihnen pdf2text ans Herz. Dahinter verbirgt sich lediglich eine Internetseite; Sie müssen nicht einmal Software herunterladen und installieren. Alles, was Sie tun müssen, ist auf einer einzigen Seite vier kleine Schritte durchzuführen:

  1. Wählen Sie die fragliche PDF-Datei aus, die Sie von Ihrem Computer hochladen wollen (auch wenn Sie ein PDF online finden, müssen Sie es zuerst auf Ihrem Rechner abspeichern).
  2. Wählen Sie das Format aus, in das die PDF-Datei umgewandelt werden soll:
    • .txt: Das einfachste aller Formate; auch Tabelleninhalte werden übernommen, wenngleich ohne den zugehörigen Rahmen.
    • Excel: Enthält das PDF viele Tabellen und Zahlen, bietet sich die Konvertierung in eine Excel-Datei an, das Tabellenzellen passend in Excel-Zellen einfügt.
    • Word: Ähnlich wie die .txt-Umwandlung, lediglich gleich fertig für Microsoft Word.
    • .html: Auch als .html-Datei könnten Sie sich das Dokument ausgeben lassen, wenn Sie es denn wollten.
  3. Sicherheitscode bestätigen – wie bei den meisten Online-Aktivitäten gibt es auch hier eine Sicherheitsabfrage (bestehend aus wenigen Ziffern), um sicherzugehen, dass Sie tatsächlich menschlich sind.
  4. Starten Sie die Konvertierung! Anschließend gelangen Sie auf die Ausgabe-Seite, von der aus Sie per Mausklick die umgewandelte Datei auf Ihrem Computer speichern können.

Haben Sie das Dokument erst einmal gespeichert, können Sie es nach Herzenslust weiter bearbeiten. Aufpassen sollten Sie bei diesem Tool natürlich trotzdem: So viel Arbeit es Ihnen abnehmen kann (stellen Sie sich vor, Sie müssten ein PDF, dessen Text sich nicht einfach kopieren lässt, vielleicht abschreiben), ein bisschen Nachbearbeitung kann trotzdem notwendig sein, denn pdf2text hat auch Schwächen: Weder übernimmt es komplexe Formatierungen, noch kommt es mit allen Sonderzeichen problemlos zurecht. Beispielsweise Anführungs- und Aufzählungszeichen würden Sie per Hand nachtragen müssen. Doch das ist, je nach Umfang des Dokuments, vergleichsweise wenig Aufwand.

Forsetzung folgt!
In der nächsten Ausgabe stellen wir Ihnen ein kostenloses Tool vor, mit dem Sie umfangreiche PDFs in einzelne Seiten zerlegen oder die Seiten neu arrangieren bzw. einzelne PDFs zu einem umfangreichen zusammenfügen können.

nach oben