Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?
Forum>Software>Mailadressen aus PDF extrahieren

Mailadressen aus PDF extrahieren

camaso
camaso06.11.0821:29
'nAbend zusammen,

weiss jemand eine Möglichkeit, aus einer 138 Seiten langen PDF-Datei mit ca. 1200 Adressen bloss die eMail-Adressen zu extrahieren? Oder auch alles und danach die eMail-Adressen?

Hoffend grüsst
camaso
0

Kommentare

uniX
uniX06.11.0821:57
Normalerweise solltest Du mit -C alles kopieren können und mit -V in einem Textbearbeitungsprogramm wieder einfügen können.
0
_mäuschen
_mäuschen06.11.0822:33

In Vorschau

- A

drag & drop auf den Schreibtisch

Doppelklicken

- C

Wechseln zu TextEdit

- V
SHIFT - - T

Speichern unter ~/pdf.txt (als Plain Text)

Im Terminal diesen Einzeiler absetzen

perl -wne'while(/[\w\.\-]+@[\w\.\-]+\w+/g){print "$&\n"}' ~/pdf.txt | sort -u > output.txt


0
ein.Leguan
ein.Leguan17.01.1019:04
Leider liefert mir die Eingabe des beschriebenen Terminal-Befehls nur diese Antwort:
"Search pattern not terminated at -e line 1."

Die Ursprungs-.pdf-Datei habe ich in TextEdit kopiert, mit "~/pdf.txt" benannt und ist in reinem Text (Westeuropäisch, Mac OS Lateinisch) auf dem Schreibtisch gespeichert.
0
_mäuschen
_mäuschen17.01.1019:57
"/pdf.txt" benannt

da sollte der slash / aber nicht sein nur "pdf.txt"


Im Befehl selbst wäre dann angebracht:

perl -wne'while(/[\w\.\-]+@[\w\.\-]+\w+/g){print "$&\n"}' ~/Desktop/pdf.txt | sort -u > ~/Desktop/output.txt

0
ein.Leguan
ein.Leguan17.01.1020:48
Das war's....nun passt alles.
Vielen Dank!
0

Kommentieren

Diese Diskussion ist bereits mehr als 3 Monate alt und kann daher nicht mehr kommentiert werden.