首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

蒙古文网页抓取及编码识别转换研究

摘要第1-5页
ABSTRACT第5-9页
引言第9-11页
第一章 网络蜘蛛SPIDER的工作原理第11-27页
   ·搜索引擎概述第11-12页
   ·网络蜘蛛基本原理第12-13页
   ·网络蜘蛛搜索策略第13-16页
     ·宽度优先搜索策略第14页
     ·深度优先搜索策略第14-15页
     ·垂直搜索策略第15-16页
   ·网络蜘蛛组成部分第16-27页
     ·URL解析第16-20页
     ·获取远程Web服务器的页面第20-22页
     ·网页分析算法第22-24页
     ·去除网页中的标签第24-27页
第二章 蒙古文编码的多样性第27-29页
   ·蒙古文编码多样性第27-28页
   ·蒙古文编码多样实例化说明第28-29页
第三章 不同蒙古文网页编码识别第29-39页
   ·不同蒙古文编码的范围第29-30页
   ·蒙古文编码识别原则第30页
   ·蒙古文网页识别算法第30-37页
     ·基于蒙古文编码非重叠区域的编码识别方法第31-32页
     ·基于蒙古文助词与标点特征字符识别第32-33页
     ·基于字频分布的编码识别第33-36页
     ·基于贝叶斯分类的编码识别第36-37页
   ·几种编码识别方法比较第37-39页
第四章 蒙古文网页编码转换第39-43页
   ·蒙古文编码转换由来第39页
   ·蒙古文转换的原则第39-41页
   ·蒙古文编码转换第41-43页
第五章 总结和展望第43-46页
参考文献第46-49页
致谢第49页

论文共49页,点击 下载论文
上一篇:无人水下自主航行器(AUV)避碰研究
下一篇:IS-IS路由协议一致性测试的研究