Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?
Forum>Software>Konvertierung von Text-pdf in Word

Konvertierung von Text-pdf in Word

BlumHW26.02.1015:54
Wer kennt ein Programm, das mit adobe-reader erstellte pdf in Word-Dateien konvertiert, die dann bearbeitet werden können. Ich nutze 10.6.2 und ein MacBook 17".
Danke
0

Kommentare

uplift
uplift26.02.1016:12
Der Reader erstellt PDFs? Und was willst Du in der Word Datei haben? Das komplette Layout oder nur den Text aus der PDF?
„Computer erleichtern uns ungemein die Arbeit an Problemen, die wir ohne sie nicht hätten. Ich habe keine Lösung, aber ich bewundere das Problem.“
0
breaker
breaker26.02.1016:18
Hast du Acrobat Pro? Da einfach als Word Datei speichern. Je nach Layout-Komplexität sieht es dann aber auch aus
0
sierkb26.02.1016:19
Vielleicht so herum:

PDF mit OpenOffice einlesen/importieren und dann als Dokument im MS Word-Format wieder abspeichern.

Extension dazu für OpenOffice:
Sun PDF Import Extension

Oder auf gleiche Weise mit dem OpenOffice-Abkömmling Go-OO , welcher von Haus aus dieselbe PDF Import Extension bereits mitbringt: .
0
MoreliaV
MoreliaV26.02.1016:43
Text im pdf markieren und mit copy-paste in Word einsetzen...
„95% aller Computerprobleme befinden sich zwischen Stuhl und Tastatur.“
0
Bruni
Bruni26.02.1017:11
Ich öffne die pdf-Datei mit Readiris und mache dann OCR (optische Texterkennung). Den resultierenden Text speichere ich als rtf-Datei für spätere Bearbeitung mit einer Textverarbeitung.
0
MacSteve Pro26.02.1017:17
Bruni
Ich öffne die pdf-Datei mit Readiris und mache dann OCR (optische Texterkennung). Den resultierenden Text speichere ich als rtf-Datei für spätere Bearbeitung mit einer Textverarbeitung.

Wäre auch mein Tipp gewesen
0
BlumHW26.02.1017:19
Also:

1. Die pdf erstellt mein Canon-Scanner, 2 Jahre alt.
2. Ich kann die mitgelieferte Version von Omnipage SE nicht nutzen, da sie unter Snow Leo nicht läuft
3. Es geht nur um die Konvertierung von Texten, die ich bearbeiten will
4. Ich habe kein Acrobat Pro, weil es für meine gelegentlichen Anwendungen zu teuer ist
5. >MoreliaV: Das geht nun leider nicht. Word übernimmt das pdf, es kann aber nicht bearbeitet werden.
Sorry
0
bernddasbrot
bernddasbrot26.02.1017:31
Bruni
Ich öffne die pdf-Datei mit Readiris und mache dann OCR (optische Texterkennung). Den resultierenden Text speichere ich als rtf-Datei für spätere Bearbeitung mit einer Textverarbeitung.

Ist doch ein Umweg, oder? Wenn der Text schon als "Text" vorhanden ist, muss man doch nicht erst durch OCR Fehler da reinmachen, oder?
0
dirac26.02.1017:55
bernddasbrot
Ist doch ein Umweg, oder? Wenn der Text schon als "Text" vorhanden ist, muss man doch nicht erst durch OCR Fehler da reinmachen, oder?

Das PDF ist ja aber nur ein Bild - zumindest verstehe ich das hier so:
BlumHW
Also:

1. Die pdf erstellt mein Canon-Scanner, 2 Jahre alt.
2. Ich kann die mitgelieferte Version von Omnipage SE nicht nutzen, da sie unter Snow Leo nicht läuft
3. Es geht nur um die Konvertierung von Texten, die ich bearbeiten will
4. Ich habe kein Acrobat Pro, weil es für meine gelegentlichen Anwendungen zu teuer ist
5. >MoreliaV: Das geht nun leider nicht. Word übernimmt das pdf, es kann aber nicht bearbeitet werden.
Sorry

Da geht außer OCR garnichts anderes.




0
X-Jo26.02.1017:57
bernddasbrot:
BlumHW
1. Die pdf erstellt mein Canon-Scanner, 2 Jahre alt.
2. Ich kann die mitgelieferte Version von Omnipage SE nicht nutzen, da sie unter Snow Leo nicht läuft

Die PDFs enthalten nur die Bilder vom Scanner. Ohne Konvertierung mit einer OCR-Software, wie Bruni und MacSteve Pro das schon gesagt haben, gibt's keinen Text.

BlumHW:
BlumHW
5. >MoreliaV: Das geht nun leider nicht. Word übernimmt das pdf, es kann aber nicht bearbeitet werden.
Ja klar, weil es sich um ein Bild (vom Scanner) eingebettet in ein PDF-Dokument und nicht um Text handelt.

OCR-Software für den Mac gibt's leider nicht sehr preiswert.

Edit:
dirac: ich muss zukünftig einfach schneller schreiben!

0
dirac26.02.1018:01
Letztens war hier in den News das OCRKit. Vielleicht reicht das als OCR-SW schon aus.
0
X-Jo26.02.1018:09
Ein Vergleich von Readiris und Finereader auf Macnews.de:
0
Quarkbrötchen26.02.1018:49
Mein Canon-Scanner ist schon 8 Jahre alt, aber der macht eine Texterkennung bereits beim scannen. Falsch gescannt würde ich sagen.
0
TITAN26.02.1020:00
Den (acht Jahre alten) Scanner mit implementierter Texterkennung möchte ich sehen.
Ich kann die mitgelieferte Version von Omnipage SE nicht nutzen, da sie unter Snow Leo nicht läuft
Falsch gelesen würde ich sagen.
0
Krypton26.02.1020:08
DevonThink Pro Office hat auch eine Texterkennung eingebaut und kann die gescannten Dokumente gleich noch verwalten. Das Programm ist mit 120 Euro aber auch nicht wirklich billig. Da würde ein neuer Scanner mit halbwegs aktueller Texterkennung vielleicht sogar günstiger sein.
0
X-Jo26.02.1020:37
Quarkbrötchen
Mein Canon-Scanner ist schon 8 Jahre alt, aber der macht eine Texterkennung bereits beim scannen.
Unter OS 9!

Bei meinem alten Canon-Scanner (9900F) lag OCR-Software bei, die nur unter OS 9 lief.
0
Quarkbrötchen26.02.1022:40
TITAN

Der Scanner-Software machts … ist ein N670U und die Software von läuft sogar noch unter Leopard. Könnte besser sein, aber man kann direkt ein OCR-PDF erzeugen …
0
BlumHW26.02.1022:52
Vielen Dank für die Kommentare, aber jetzt bin ich völlig verwirrt!

Ich habe stundenlang mit der Canon-Hotline telefoniert und die haben mir gesagt, dass das Problem bei omnipage se liegt und an 10.6. Sie haben mit empfohlen, über das Programm "Digitale Bilder" zu scannen (und nicht über die Canon-Toolbox) und reine Texte dann nur als pdf zu scannen. Wahrscheinlich dachten sie, ich nutze acrobat-pro. Jedenfalls ist ein pdf ein Bild und ich kann es nicht in Word konvertieren. Zwischenzeitlich hat mir jemand ein Programm namens pdf2word empfohlen. Habe ich aber noch nicht probiert.
0
lasergans26.02.1022:56
Du könntest eine 30-Tage-Testversion von acrobat-pro ziehen, wenn pdf2word nicht funzt.
0
X-Jo26.02.1023:21
BlumHW
Zwischenzeitlich hat mir jemand ein Programm namens pdf2word empfohlen
pdf2word
Die Shareware extrahiert Text, Grafiken und sonstige Inhalte aus beliebigen PDF-Dokumenten und übernimmt Formatierungen und Schriftgrade.

Extrahiert Text: d.h. die Texte müssen im PDF als solche vorhanden sein. Das PDF vom Scanner ist aber nur ein Bild. Deshalb wirst du dann in Word wieder nur ein Bild haben und keinen Text!

Zum ~ 5. Mal: ohne OCR-Software wird das nix. Hast Du Dir das OCRKit schon angeschaut, das Dir dirac empfohlen hat?
0
TITAN27.02.1012:18
Quarkbrötchen
TITAN

Der Scanner-Software machts … ist ein N670U und die Software von läuft sogar noch unter Leopard. Könnte besser sein, aber man kann direkt ein OCR-PDF erzeugen …
Mit der Software die sogar (nur) unter Leopard funktioniert. Die OCR-Pdf wird von der OCR Software generiert, nicht vom Scanner.

0
BlumHW27.02.1018:37
Ich danke allen, die mir Ratschläge erteilt haben. Ich werde jetzt das eine oder andere probieren. Bei Erfolg melde ich mich wieder.

HWB
0
Digitalo
Digitalo04.03.1005:05
Krypton
DevonThink Pro Office hat auch eine Texterkennung eingebaut und kann die gescannten Dokumente gleich noch verwalten.

Stimmt, importierte PDF's werden indexiert und in die Textsuche einbezogen. PDF-Text kann danach auch per Drag & Drop in ein Textprogramm übernommen werden.

Das ganze Layout und die Formatierung sind dann jedoch zerschossen. Grafiken, Bilder usw. kommen nicht mit. Rein formatierter Text.

Wie schaut das in OCRKit aus?
Gibt es einen Weg, ein PDF durchzuziehen, auf dem das Layout erhalten bleibt und beispielsweise Bilder noch an ihrem Ort, respektiver überhaupt noch vorhanden sind?

Ein OCRKit Dokument kann ich hier mit keiner Textverarbeitungssoftware öffnen.

Die Dateigrösse nimmt auch hier um den Faktor zehn zu.

OCRKit könnte eine tolle Sache sein, so es denn möglich ist, dass Layouts erhalten bleiben.
0
dirac04.03.1007:42
Nach meinen Erfahrungen mit OCRKit legt das Tool einfach einen zweiten Layer mit dem erkannten Text hinter das Bild im PDF. Wenn man dann per Copy & Paste Text in ein anderes Programm übernimmt, bleibt das Layout auf der Strecke.

OCRKit dient nur dazu PDF-Dateien durchsuchbar zu machen, nicht den Inhalt layoutgetreu in z.B. eine Textverarbeitung zu exportieren.

Warum bei manchen die Größe des PDFs so ansteigt, verstehe ich nicht. Bei mir werden die Dateien nur geringfügig größer.

Gruß
dirac
0
Digitalo
Digitalo05.03.1008:23
dirac

Dann macht das Programm das, was Skim und DevonThink zusammen können.

Nun habe ich meinen neun Jahre alten Scanner ersetzt, der mochte nicht mehr. Ein OCR-Programm ist mit dabei, mal sehen, was dieses kann.

Die Geschichte mit der Dateigrösse ist eigenartig.
0
sierkb05.03.1010:20
Die Dateigrösse nimmt auch hier um den Faktor zehn zu.
Warum bei manchen die Größe des PDFs so ansteigt, verstehe ich nicht. Bei mir werden die Dateien nur geringfügig größer.
Die Geschichte mit der Dateigrösse ist eigenartig.

Vielleicht ist das, was hier zu lesen ist, ja eine Erklärung bzw. folgendes Tool von Panic eine entgegenkommende (Ab-)hilfe: ShrinkIt , Review unter .

Abgesehen davon könnte evtl. auch PDF OCR X interessant sein für den Fragesteller.
0
Digitalo
Digitalo05.03.1010:48
sierbk
Bei Sun scheint sich viel getan zu haben in letzter Zeit, oder habe ich das früher nicht so wahrgenommen?

Danke für die Links, ich habe sie gespeichert.

Ich würde gerne mal einen Blick in deine Bookmarkverwaltung werfen.
Ich stell mir die gut organisiert vor.
0
sierkb05.03.1011:10
Digitalo
Bei Sun scheint sich viel getan zu haben in letzter Zeit, oder habe ich das früher nicht so wahrgenommen?

Beides trifft wohl zu.
0

Kommentieren

Diese Diskussion ist bereits mehr als 3 Monate alt und kann daher nicht mehr kommentiert werden.