Texterkennung
Übersicht

![]() |
SmilyBetreff: Texterkennung |
![]() Antworten mit Zitat ![]() |
---|---|---|
Hallo,
Da ich derzeit mal wieder nix zu tun habe, hab ich mir mal gedacht ich versuche mich an einem Texterkennungsprogramm. Als "Herrausforderung" habe ich mir solche Bilder gesucht: ![]() In meinen augen wäre der Erste schritt, das Bild klarer abzugrenzen. also hab ich per Algo folgendes Schwartz-Weis bild darraus erstellt: ![]() Der nächste Schritt wäre, die einzelnen Zeichen herauszufischen und diese dann mit gegebenen Zahlen zu vergleichen. Die Zahl, wo es die meisten übereinstimmungen gibt, ist es dann. Aber das Herausfischen bereitet mir allerdings kopfzerbrechen. Ich hatte schon ein paar Ansätze, allerdings ist das alles irgendwie Fehlgeschlagen. Deswegen hoffe ich auf ein paar ansätze eurer Seits. Geplant ist, dass ein Algorhytmus alle 9 Zahlen aus dem 2. Bild als kleines und genau abgegrenztes bild raus greift. mfg, Smily0412 |
||
Lesestoff:
gegen Softwarepatente | Netzzensur | brain.exe | Unabhängigkeitserklärung des Internets "Wir müssen die Rechte der Andersdenkenden selbst dann beachten, wenn sie Idioten oder schädlich sind. Wir müssen aufpassen. Wachsamkeit ist der Preis der Freiheit --- Keine Zensur!" stummi.org |
![]() |
BladeRunnerModerator |
![]() Antworten mit Zitat ![]() |
---|---|---|
Unreife Idee:
Teste spaltenweise Wieviele weisse pixel du hast. Jede Ziffer ist vollkommen zusammenhängend, wenn Du also eine komplett leere Spalte hast ist mit Sicherheit eine Ziffer zuende. Somit sind schon grobe Grenzen festzulegen. Wenn Du mehrere Blocks identifizieren kannst ist es möglich eine Durchschnittsbreite zu bestimmen, die ein Zeichen einnimmt. Entlang dieser Breite kannst du die Zeichen zerschneiden. Analog bestimme die durchschnittliche Höhe in einem Block, so lassen sich auch Grenzen für die Zeichen in der Höhe(Differenz höchstes Pixel - tiefstes Pixel) bestimmen. Die blocks die so entstehen kannst du dann auf Ziffern testen- selbst wenn mal ein oder 2 Pixel falsch zugeordnet sind sollte der Grundcharakter des Zeichens erhalten bleiben. |
||
Zu Diensten, Bürger.
Intel T2300, 2.5GB DDR 533, Mobility Radeon X1600 Win XP Home SP3 Intel T8400, 4GB DDR3, Nvidia GF9700M GTS Win 7/64 B3D BMax MaxGUI Stolzer Gewinner des BAC#48, #52 & #92 |
Problemchen |
![]() Antworten mit Zitat ![]() |
|
---|---|---|
Hi, hab' selbst vor kurzen sowas gebaut, allerdings in PHP. Dieser Link war mir eine große Hilfe:
http://www.cs.sfu.ca/~mori/research/gimpy/ Im Besonderen das veröffentlichte PDF dazu: http://www.cs.sfu.ca/~mori/res...cvpr03.pdf Mein Ansatz beruhte auf einer ähnlichen Methode wie BladeRunner vorgeschlagen hat zur Extraktion. Danach vereinfache ich jeden Buchstaben etwas und vergleiche mit 8k Einträgen (Buchstaben in verschiedenen Schriftarten) in der DB welcher Buchstabe es ist und setze das Wort zusammen. Problemchen |
||
Übersicht


Powered by phpBB © 2001 - 2006, phpBB Group