Texterkennung

Übersicht BlitzBasic Allgemein

Neue Antwort erstellen

Smily

Betreff: Texterkennung

BeitragMi, Mai 09, 2007 22:05
Antworten mit Zitat
Benutzer-Profile anzeigen
Hallo,
Da ich derzeit mal wieder nix zu tun habe, hab ich mir mal gedacht ich versuche mich an einem Texterkennungsprogramm.

Als "Herrausforderung" habe ich mir solche Bilder gesucht:
user posted image

In meinen augen wäre der Erste schritt, das Bild klarer abzugrenzen. also hab ich per Algo folgendes Schwartz-Weis bild darraus erstellt:
user posted image

Der nächste Schritt wäre, die einzelnen Zeichen herauszufischen und diese dann mit gegebenen Zahlen zu vergleichen. Die Zahl, wo es die meisten übereinstimmungen gibt, ist es dann.

Aber das Herausfischen bereitet mir allerdings kopfzerbrechen.
Ich hatte schon ein paar Ansätze, allerdings ist das alles irgendwie Fehlgeschlagen.
Deswegen hoffe ich auf ein paar ansätze eurer Seits. Geplant ist, dass ein Algorhytmus alle 9 Zahlen aus dem 2. Bild als kleines und genau abgegrenztes bild raus greift.

mfg, Smily0412
Lesestoff:
gegen Softwarepatente | Netzzensur | brain.exe | Unabhängigkeitserklärung des Internets

"Wir müssen die Rechte der Andersdenkenden selbst dann beachten, wenn sie Idioten oder schädlich sind. Wir müssen aufpassen. Wachsamkeit ist der Preis der Freiheit --- Keine Zensur!"
stummi.org

BladeRunner

Moderator

BeitragMi, Mai 09, 2007 22:15
Antworten mit Zitat
Benutzer-Profile anzeigen
Unreife Idee:
Teste spaltenweise Wieviele weisse pixel du hast. Jede Ziffer ist vollkommen zusammenhängend, wenn Du also eine komplett leere Spalte hast ist mit Sicherheit eine Ziffer zuende.

Somit sind schon grobe Grenzen festzulegen.

Wenn Du mehrere Blocks identifizieren kannst ist es möglich eine Durchschnittsbreite zu bestimmen, die ein Zeichen einnimmt. Entlang dieser Breite kannst du die Zeichen zerschneiden.
Analog bestimme die durchschnittliche Höhe in einem Block, so lassen sich auch Grenzen für die Zeichen in der Höhe(Differenz höchstes Pixel - tiefstes Pixel) bestimmen.

Die blocks die so entstehen kannst du dann auf Ziffern testen- selbst wenn mal ein oder 2 Pixel falsch zugeordnet sind sollte der Grundcharakter des Zeichens erhalten bleiben.
Zu Diensten, Bürger.
Intel T2300, 2.5GB DDR 533, Mobility Radeon X1600 Win XP Home SP3
Intel T8400, 4GB DDR3, Nvidia GF9700M GTS Win 7/64
B3D BMax MaxGUI

Stolzer Gewinner des BAC#48, #52 & #92
 

Problemchen

BeitragDo, Mai 10, 2007 11:00
Antworten mit Zitat
Benutzer-Profile anzeigen
Hi, hab' selbst vor kurzen sowas gebaut, allerdings in PHP. Dieser Link war mir eine große Hilfe:
http://www.cs.sfu.ca/~mori/research/gimpy/
Im Besonderen das veröffentlichte PDF dazu:
http://www.cs.sfu.ca/~mori/res...cvpr03.pdf

Mein Ansatz beruhte auf einer ähnlichen Methode wie BladeRunner vorgeschlagen hat zur Extraktion. Danach vereinfache ich jeden Buchstaben etwas und vergleiche mit 8k Einträgen (Buchstaben in verschiedenen Schriftarten) in der DB welcher Buchstabe es ist und setze das Wort zusammen.
Problemchen

Neue Antwort erstellen


Übersicht BlitzBasic Allgemein

Gehe zu:

Powered by phpBB © 2001 - 2006, phpBB Group