Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?
Forum>Software>PDF-Konverter gesucht, der Textformatierungen berücksichtigt

PDF-Konverter gesucht, der Textformatierungen berücksichtigt

humbert
humbert22.03.1210:19
Liebe Leute,

ich suche einen PDF-Konverter, der mir ein RTF, XML oder auch HTML-Dokument ausgibt, und die Formatierung des Textes berücksichtigt, d.h. Schriftgröße, Farbe, Fett- und Kursivdruck. (Schriftart, Spalten, Grafiken etc. brauche ich nicht.)

Ich habe geschätzt 20 Konverter durchprobiert, entweder lassen sie die Merkmale völlig unberücksichtigt, oder sie arbeiten mit OCR und liefern fehlerhafte und inkonsistente Ergebnisse.

Ich denke, daß es prinzipiell sogar einfach über die Zwischenablage gehen sollte, wenn ich das vom Adobe Reader aus mache, sind an einigen Stellen die Formatierungen erhalten, größtenteils aber nicht. (Adobe Reader pro bringt merkwürdigerweise noch schlechtere Ergebnisse)

Hat jemand einen Tipp? Plattform ist egal.
„He saved Rock 'n' Roll left-handed“
0

Kommentare

uplift
uplift22.03.1210:31
Also wenn ich in Acrobat X Pro eine PDF als Word-Datei speichere, bleibt die Formatierung des Textes erhalten.
„Computer erleichtern uns ungemein die Arbeit an Problemen, die wir ohne sie nicht hätten. Ich habe keine Lösung, aber ich bewundere das Problem.“
0
Hot Mac
Hot Mac22.03.1210:39
uplift
Also wenn ich in Acrobat X Pro eine PDF als Word-Datei speichere, bleibt die Formatierung des Textes erhalten.

In der Regel ist das auch so.
Es gibt aber auch Ausnahmen und bei XML, RTF und HTML schaut's schon ganz anders aus.

Ich frage mich, ob es überhaupt einen Konverter gibt, der einwandfrei in letztere Formate konvertieren kann.
Direkt scheint es wohl nicht zu funktionieren.
0
Bernd Eichhorn22.03.1210:45
Das hängt ja wohl auch von den pdfs ab. Wenn das nur Bilder von Texten sind, dann braucht das auf jeden Fall ein OCR-Programm. Da wird das Abspeichern im gleichen Layout auch nur selten klappen. Nur den Text aus Text-pdfs ziehen, kann man auch schon mit der Vorschau (markieren und kopieren). Und was meiner Erfahrung nach nicht funktioniert, sind das Erkennen von Fußnoten und Seitenzahlen am Ende einer Seite. Viele Programme habe ich aber jetzt auch nicht ausprobiert.
0
Hot Mac
Hot Mac22.03.1211:00
Es gibt ja auch gute Gründe dafür, dass das nicht einwandfrei funktioniert.
Wenn jeder – mal so auf die Schnelle – PDFs umwandeln könnte, dann wäre dieses Format überflüssig.
0
macpeter
macpeter22.03.1211:11
Hot Mac

wie wahr...wie wahr!
„"No matter, try again, fail again, fail better!" Samuel Beckett“
0
humbert
humbert22.03.1211:36
Hm, liegt's dann vielleicht an meinem Dokument? Als Codierungs-Software ist "Creo-Normalizer JTP" angegeben, Version 1.3.; scheint v.a. im Druckerei-Bereich verwendet zu werden (mein Dokument ist ein Buch).

Seitenzahlen und Fußnoten sind vorhanden, Vorschau bekommt das nicht hin, Adobe-Reader recht gut. Reader Pro war die größte Enttäuschung, beim Export kam nur Müll raus, allerdings unter Windows.
„He saved Rock 'n' Roll left-handed“
0
Arne 222.03.1211:37
Das man es schlecht zurück convertieren kann, ist zwar oft eine nette Beigabe, aber doch nun wirklich keine elementare Funktion von PDF. Viel interessanter ist es doch, das man damit ein Format an der Hand hat, das fast zu 100% identisch aussieht - egal auf welcher Plattform man es öffnet. Wer häufiger Dokumente auf einem Rechner erstellt und auf einem anderen drucken will, der gewöhnt sich Word-Dokumente als Transortcontainer schnell ab
0
BlackSeb
BlackSeb22.03.1212:24
humbert
Hm, liegt's dann vielleicht an meinem Dokument? Als Codierungs-Software ist "Creo-Normalizer JTP" angegeben, Version 1.3.; scheint v.a. im Druckerei-Bereich verwendet zu werden (mein Dokument ist ein Buch).

Seitenzahlen und Fußnoten sind vorhanden, Vorschau bekommt das nicht hin, Adobe-Reader recht gut. Reader Pro war die größte Enttäuschung, beim Export kam nur Müll raus, allerdings unter Windows.

Könnte sin das das schon gerippte Formproofs sind. Da kann man noch mal kontrollieren ob alles richtig auf der Druckplatte landet – ist aber nicht farbverbindlich! Außerdem sind es dann meist eingebettete Bilder.
„MacBook Pro M3 Max (14C/36GB) / iPhone 13 Pro (256GB) / iPad 7. Generation (32GB) / Apple TV 4K (2. Generation)“
0
humbert
humbert22.03.1217:30
Eigentlich bin ich ganz anspruchslos – Farbverbindlichkeit brauche ich nicht, Bilder auch nicht, ich will nur die verschiedenen Textmerkmale irgendwie unterscheiden können, wenn ich das ganze in Filemaker importiere.
„He saved Rock 'n' Roll left-handed“
0
Bernd Eichhorn23.03.1212:04
Wenn du das in FileMaker einbinden möchtest, warum nicht das pdf als pdf und den exzerptierten Text eines OCRs als reinen Text in einem Extrafeld? So hast du das Aussehen des Dokuments und kannst es außerdem durchsuchen.
0
humbert
humbert23.03.1218:24
Prinzipiell eine gut Idee, aber für mich sind die Hierarchieebenen der Texte entscheidend, und die kann ich eben nur über die Formatierung identifizieren. Ich habe mir die Abbyy-OCR noch mal näher angeschaut, das Ergebnis ist zumindest zu 99% korrekt, ich hoffe, ich krieg die Fehler nachträglich raus.
„He saved Rock 'n' Roll left-handed“
0

Kommentieren

Diese Diskussion ist bereits mehr als 3 Monate alt und kann daher nicht mehr kommentiert werden.