noreaga
Eroberer
Tach beisammen!
Den Thread hier erstelle ich, um mir ein paar Vorschläge bzw. Anregungen zu holen, für ein Projekt, welches ich demnächst angehen will.
Es geht um folgendes:
Ich plane (wenns überhaupt umsetzbar ist) eine Bilderkennunssoftware zu schreiben, welche folgendes Leisten soll:
Die Software soll hochauflösende JPEG Grafiken einlesen können und auf dem Bild maximal 4 stellige Zahlen erkennen können. Der Bereich auf dem die Zahlen stehen ist meistens weiß (mit einer gewissen toleranz, je nach Lichtverhältnissen) hinterlegt und annährend rechteckig, bzw. perspektivisch verzerrt (je nach Winkel der Fotografie). Das Programm soll also eine Art "Schrifterkennung" darstellen.
Ich hätte mir jetzt mal folgende Lösung dafür vorgestellt:
- Bild in ein 2-dimensionales Array pixelweise einlesen und mithilfe geeigneter Funktionen den weißen rechteckigen Bereich erkennen (wobei natürlich mit einer gewissen toleranz gearbeitet werden muss ... farbtechnisch sowie geometrisch)
- den zu erkennenden Bereich in ein Raster aufteilen und mit zuhilfenahme des winkels ausdem das foto entstanden ist (müsste sich aufgrund der perpektivischen Verzerrung berechnen lassen) irgendwie die Zahlen erkennen.
Bei den ominösen Rechtecken handelt es sich um Startnummern auf Fahrzeugen/Kleidungsstücken von diversen Sportveranstaltungen. Das Projekt wird natürlich etwas längerfristig angelegt. Das man damit warscheinlich keine 100% abdeckung hinbekommt ist mir klar, jedoch wär mir schon geholfen, wenn zumindest 50% erkannt werden. Große Probleme sehe ich was das erkennen der Rechtecke angeht, da die Bilder oft einen mehrfarbigen Hintergrund haben.
Meine Fragen an die Community hier wären nun folgende:
- denkt ihr das das überhaupt möglich ist ?
- hat jemand vorschläge für geeignete Libraries die man dafür verwenden könnte, bzw. kennt jemand software (opensource) die in der lage ist sowas zu meistern?
Für weitere konstruktive Vorschläge und Gedankengänge aller Art wär ich sehr dankbar!
Den Thread hier erstelle ich, um mir ein paar Vorschläge bzw. Anregungen zu holen, für ein Projekt, welches ich demnächst angehen will.
Es geht um folgendes:
Ich plane (wenns überhaupt umsetzbar ist) eine Bilderkennunssoftware zu schreiben, welche folgendes Leisten soll:
Die Software soll hochauflösende JPEG Grafiken einlesen können und auf dem Bild maximal 4 stellige Zahlen erkennen können. Der Bereich auf dem die Zahlen stehen ist meistens weiß (mit einer gewissen toleranz, je nach Lichtverhältnissen) hinterlegt und annährend rechteckig, bzw. perspektivisch verzerrt (je nach Winkel der Fotografie). Das Programm soll also eine Art "Schrifterkennung" darstellen.
Ich hätte mir jetzt mal folgende Lösung dafür vorgestellt:
- Bild in ein 2-dimensionales Array pixelweise einlesen und mithilfe geeigneter Funktionen den weißen rechteckigen Bereich erkennen (wobei natürlich mit einer gewissen toleranz gearbeitet werden muss ... farbtechnisch sowie geometrisch)
- den zu erkennenden Bereich in ein Raster aufteilen und mit zuhilfenahme des winkels ausdem das foto entstanden ist (müsste sich aufgrund der perpektivischen Verzerrung berechnen lassen) irgendwie die Zahlen erkennen.
Bei den ominösen Rechtecken handelt es sich um Startnummern auf Fahrzeugen/Kleidungsstücken von diversen Sportveranstaltungen. Das Projekt wird natürlich etwas längerfristig angelegt. Das man damit warscheinlich keine 100% abdeckung hinbekommt ist mir klar, jedoch wär mir schon geholfen, wenn zumindest 50% erkannt werden. Große Probleme sehe ich was das erkennen der Rechtecke angeht, da die Bilder oft einen mehrfarbigen Hintergrund haben.
Meine Fragen an die Community hier wären nun folgende:
- denkt ihr das das überhaupt möglich ist ?
- hat jemand vorschläge für geeignete Libraries die man dafür verwenden könnte, bzw. kennt jemand software (opensource) die in der lage ist sowas zu meistern?
Für weitere konstruktive Vorschläge und Gedankengänge aller Art wär ich sehr dankbar!