ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern

P

Perl-Anfänger

Hallo Leute,

heute brauche ich mal einen dringenden Rat von Euch.

Ich habe hier etwas mehr als 1200 PDF-Dateien (Text), die jeweils ein Anschreiben mit verschiedenen Adressen und Kundennummern bzw. Vertragsnummern beinhaltet.
Leider müssen wir unser System wechseln und dazu muss ich nun die Adressen, die im Empfängerfeld stehen, auslesen und vorzugsweise für Excel aufbereiten.

Da ich so gut wie keine Erfahrung in Perol oder sonstwas habe, aber weiss, dass es damit geht, wende ich mich an Euch.

Nun zur aktuellen IST-Situation:

Habe in einem Verzeichnis unter Windows etwa 1200 PDF-Files, benannt nach diesem Muster: <Name, Vorname.pdf>, alles ausgedruckte Kundenstammdaten aus unserem CMS-System in je eine PDF.
Mit ein wenig Tüfteln ist es mir gelungen, per Batch-Datei (in einem Sicherungskopie-Ordner) alle Files mit Hilfe von pdftotxt.exe so umzubenennen, dass die Adressen alle in zweiter Zeile stehen.
Genau diese gilt es nun, auszulesen und vorzugsweise in eine Semikolon-separierte CSV-Datei zu schreiben, damit ich sie für einen Serienbrief in eine Excel-Datei bekomme.

Weiter habe ich ergoogelt, dass ich mit z.B.:

Code:
#!/usr/bin/env perl
use CGI::Carp "fatalsToBrowser";
use strict;

print "Content-type: text/html\n\n";
print "<HTML><HEAD><TITLE>Test</TITLE></HEAD><BODY>\n";
print "<h1>Hello!</h1>\n";

# Read a text file #
open (TXTFILE, "01.txt") or die "Err $!\n";;
while (<TXTFILE>){
if ($. == 2) {
print "Zeile 2: $_\n<br>";
last;
}
}
print "</BODY></HTML>\n";

genau meine gewünschte Zeile auslesen kann und zumindest auf dem Bildschirm richtig ausgeben kann.
Ich möchte sie aber in einer importierbaren csv-Datei haben.

Wie schriebe ich die Datei und wie sorge ich dafür, dass das Scribt alle Dateien ausliest und jeweils immer die zweite Zeile hinzufügt?

Vielen Dank für Eure Hilfe!!!

(oder gehts noch ganz anders, ohne viel Heckmeck???)

Lg

Christian
 
Direkt aus der DB des CMS auslesen?
Er hat ja schon die entspr. Zeilen. Er hat nur noch Probleme dateiweise alle seine extrahierten PDFs auszulesen und in eine csv zu schreiben, das ist ja dann nur noch trivial.
Wollte nur fragen ob er es schon selber hinbekommen hat, wenn nicht soll er mal eine Testdatei mit dem jeweiligen Datensatz posten, dann kann man einen vernünftige Antwort geben, bei ihm fehlt es ja an minimalen Perlkenntnissen, da helfen Tipps nicht viel sondern nur die komplette Lösung die ich ihm kurz zusammenschreibe.
 
Zuletzt bearbeitet:

Ähnliche Themen

CentOS 5.8 –SQL Abfrage– HTML wird generiert und daraus müssen mehrere Mails versendet werden

Dateien auslesen und Daten systematisch angeordnet in Datei ausgeben

perl script, das Dateien aus einer Liste löscht

Sehr große Datei in Teilschritten auslesen.

Last mit etc/passwd anzeigen lassen

Zurück
Oben