P
Perl-Anfänger
Hallo Leute,
heute brauche ich mal einen dringenden Rat von Euch.
Ich habe hier etwas mehr als 1200 PDF-Dateien (Text), die jeweils ein Anschreiben mit verschiedenen Adressen und Kundennummern bzw. Vertragsnummern beinhaltet.
Leider müssen wir unser System wechseln und dazu muss ich nun die Adressen, die im Empfängerfeld stehen, auslesen und vorzugsweise für Excel aufbereiten.
Da ich so gut wie keine Erfahrung in Perol oder sonstwas habe, aber weiss, dass es damit geht, wende ich mich an Euch.
Nun zur aktuellen IST-Situation:
Habe in einem Verzeichnis unter Windows etwa 1200 PDF-Files, benannt nach diesem Muster: <Name, Vorname.pdf>, alles ausgedruckte Kundenstammdaten aus unserem CMS-System in je eine PDF.
Mit ein wenig Tüfteln ist es mir gelungen, per Batch-Datei (in einem Sicherungskopie-Ordner) alle Files mit Hilfe von pdftotxt.exe so umzubenennen, dass die Adressen alle in zweiter Zeile stehen.
Genau diese gilt es nun, auszulesen und vorzugsweise in eine Semikolon-separierte CSV-Datei zu schreiben, damit ich sie für einen Serienbrief in eine Excel-Datei bekomme.
Weiter habe ich ergoogelt, dass ich mit z.B.:
genau meine gewünschte Zeile auslesen kann und zumindest auf dem Bildschirm richtig ausgeben kann.
Ich möchte sie aber in einer importierbaren csv-Datei haben.
Wie schriebe ich die Datei und wie sorge ich dafür, dass das Scribt alle Dateien ausliest und jeweils immer die zweite Zeile hinzufügt?
Vielen Dank für Eure Hilfe!!!
(oder gehts noch ganz anders, ohne viel Heckmeck???)
Lg
Christian
heute brauche ich mal einen dringenden Rat von Euch.
Ich habe hier etwas mehr als 1200 PDF-Dateien (Text), die jeweils ein Anschreiben mit verschiedenen Adressen und Kundennummern bzw. Vertragsnummern beinhaltet.
Leider müssen wir unser System wechseln und dazu muss ich nun die Adressen, die im Empfängerfeld stehen, auslesen und vorzugsweise für Excel aufbereiten.
Da ich so gut wie keine Erfahrung in Perol oder sonstwas habe, aber weiss, dass es damit geht, wende ich mich an Euch.
Nun zur aktuellen IST-Situation:
Habe in einem Verzeichnis unter Windows etwa 1200 PDF-Files, benannt nach diesem Muster: <Name, Vorname.pdf>, alles ausgedruckte Kundenstammdaten aus unserem CMS-System in je eine PDF.
Mit ein wenig Tüfteln ist es mir gelungen, per Batch-Datei (in einem Sicherungskopie-Ordner) alle Files mit Hilfe von pdftotxt.exe so umzubenennen, dass die Adressen alle in zweiter Zeile stehen.
Genau diese gilt es nun, auszulesen und vorzugsweise in eine Semikolon-separierte CSV-Datei zu schreiben, damit ich sie für einen Serienbrief in eine Excel-Datei bekomme.
Weiter habe ich ergoogelt, dass ich mit z.B.:
Code:
#!/usr/bin/env perl
use CGI::Carp "fatalsToBrowser";
use strict;
print "Content-type: text/html\n\n";
print "<HTML><HEAD><TITLE>Test</TITLE></HEAD><BODY>\n";
print "<h1>Hello!</h1>\n";
# Read a text file #
open (TXTFILE, "01.txt") or die "Err $!\n";;
while (<TXTFILE>){
if ($. == 2) {
print "Zeile 2: $_\n<br>";
last;
}
}
print "</BODY></HTML>\n";
genau meine gewünschte Zeile auslesen kann und zumindest auf dem Bildschirm richtig ausgeben kann.
Ich möchte sie aber in einer importierbaren csv-Datei haben.
Wie schriebe ich die Datei und wie sorge ich dafür, dass das Scribt alle Dateien ausliest und jeweils immer die zweite Zeile hinzufügt?
Vielen Dank für Eure Hilfe!!!
(oder gehts noch ganz anders, ohne viel Heckmeck???)
Lg
Christian