摘要 | 第4-6页 |
Abstract | 第6-8页 |
List of Figures | 第12-14页 |
List of Tables | 第14-15页 |
1 Introduction | 第15-27页 |
1.1 Optical Character Recognition | 第15-16页 |
1.2 Arabic Optical Character Recognition | 第16-21页 |
1.3 Arabic Optical Font Recognition | 第21-22页 |
1.4 Related Work | 第22-25页 |
1.4.1 OFR Related Work | 第22-24页 |
1.4.2 OCR Related Work | 第24-25页 |
1.5 Thesis Organization | 第25-27页 |
2 Arabic Writing System | 第27-39页 |
2.1 Ligatures | 第30-31页 |
2.2 Arabic Diacritics | 第31-35页 |
2.3 Arabic Text in Computer Systems | 第35-39页 |
3 Hidden Markov Models,Decision Tree and HTK | 第39-63页 |
3.1 Hidden Markov Models | 第39-53页 |
3.1.1 Model Topologies | 第41-45页 |
3.1.2 Model Parameters Estimation | 第45-51页 |
3.1.3 Model Decoding | 第51-53页 |
3.2 Decision Tree | 第53-54页 |
3.3 HTK | 第54-63页 |
3.3.1 Data Format Conversion | 第55-58页 |
3.3.2 Model Topology Definition | 第58-60页 |
3.3.3 Training | 第60页 |
3.3.4 HMM Recognition | 第60-63页 |
4 Arabic Font Recognition | 第63-73页 |
4.1 Preprocessing | 第63-69页 |
4.1.1 Flood Fill-based Diacritic Segmentation | 第63-66页 |
4.1.2 Clustering-based Diacritics Segmentation | 第66-69页 |
4.1.3 Diacritics Validation | 第69页 |
4.2 Features Extraction and Classification | 第69-73页 |
5 Arabic Optical Character Recognition | 第73-85页 |
5.1 System Overview | 第73页 |
5.2 Diacritic and Noise Removal | 第73-76页 |
5.3 Features Extraction | 第76-78页 |
5.4 HMM Recognition | 第78-81页 |
5.5 Diacritic Recognition | 第81-82页 |
5.6 PAW Recognition | 第82-85页 |
6 Experiments and Results | 第85-107页 |
6.1 OFR Experimental Results | 第85-96页 |
6.1.1 The Database | 第85-86页 |
6.1.2 Page Level Font Recognition | 第86-88页 |
6.1.3 Line Level Font Recognition | 第88页 |
6.1.4 Number of Diacritics Influence | 第88-90页 |
6.1.5 Diacritic Class Influence | 第90-92页 |
6.1.6 Font Style Recognition | 第92页 |
6.1.7 Multi-language Document | 第92页 |
6.1.8 Text Orientation | 第92-94页 |
6.1.9 Real Data Evaluation | 第94-96页 |
6.2 OCR Experimental Results | 第96-104页 |
6.2.1 Arabic Printed Text Image(APTI)Database | 第97-100页 |
6.2.2 PAW segmentation result | 第100页 |
6.2.3 APTI protocols recognition result | 第100-102页 |
6.2.4 PAW recognition result | 第102页 |
6.2.5 Diacritics recognition result | 第102-103页 |
6.2.6 Network influence | 第103-104页 |
6.3 Multi-font text recognition | 第104-105页 |
6.4 Comparison with previous methods | 第105-107页 |
7 Conclusion and Future Directions | 第107-110页 |
7.1 Discussion and Conclusion | 第107-108页 |
7.2 Future directions | 第108-110页 |
Acknowledgment | 第110-111页 |
Bibliography | 第111-118页 |
Appendix 1 Publications | 第118页 |