Links aus PDF extrahieren

Damit die schöne E-Mail Anfrage nicht verloren geht. Hier meine Frage und die Antwort des PDFlib Supportes. Bitte bei Fragen an den Support immer daran denken, dass die Kundennummer benötigt wird. Ich hatte sie nicht angegeben, aber die Kollegen da sind sehr kulant.

Frage:

Guten Tag,

wir besitzen Lizenzen von PDFlib und TET und hätten eine Frage zu einem
Anwendungfalls. Ist es möglich vorhandene Links (nach extern, http) in einem PDF
zu übertragen oder zu extrahieren?

Generell ist es so, das wir über PDFlib nur bestimmte Seiten aus dem Original PDF
(z.B. Seite 1 – 10) ziehen und diese neue Datei weiter verwenden. Existiert nun
ein Link auf eine dieser Seiten, soll dieser nicht verloren gehen, was aber bei
dem herkömmlichen Prozess der Fall ist.

Wie wäre hier der korrekte Verarbeitungsvorgang und ist das überhaupt möglich.

Antwort:

Wenn ich Sie richtig verstehe, dann entnehmen Sie aus einem existierenden PDF Seiten mittels PDFlib+PDI und importieren diese in einen neues PDF-Dokument. Dabei gehen erwartungsgemäß Links und andere interaktive PDF-Elemente verloren. Dies ist eine dokumentierte Einschränkung von PDFlib+PDI.

Um die Links im Ziel-Dokument zu rekonstruieren, können Sie diese mittels der pCOS-Schnittstelle im Eingabedokument abfragen. Mit Hilfe dieser Informationen können Sie die Links mit Aufrufen der Funktion PDF_create_action(…, „URI“, …) im Ausgabedokument wieder erzeugen.

Folgende Cookbook-Beispiele sollten hilfreich sein:

1) Abfragen der Links im Eingabedokument:

http://www.pdflib.com/pcos-cookbook/interactive-elements/link-destinations/

2) Erzeugen von Links im Ausgabedokument

http://www.pdflib.com/pdflib-cookbook/interactive-elements/link-annotations/

Leave A Comment?

You must be logged in to post a comment.