首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文网站抓取及编码转换研究

摘要第1-4页
Abstract第4-5页
目录第5-6页
第1章 概述第6-13页
   ·研究的目的和意义第6-7页
   ·国内外研究现状第7-11页
   ·研究目标与内容第11-12页
   ·论文结构第12-13页
第2章 网络爬虫的工作原理第13-17页
   ·网络爬虫基本原理第13页
   ·网络爬虫搜索策略第13-15页
   ·网络爬虫组成部分第15-16页
   ·本章小结第16-17页
第3章 中文网页汉字内码识别第17-38页
   ·汉字编码多样性第17页
   ·汉字编码识别算法第17-22页
   ·特征加权算法第22-24页
   ·特征集提取第24-29页
   ·汉字编码识别实验及结果分析第29-38页
第4章 中文网页编码转换第38-42页
   ·编码转换方法第38-41页
   ·中文网页编码转换第41-42页
第5章 总结与展望第42-43页
   ·结论第42页
   ·展望第42-43页
参考文献第43-47页
致谢第47-48页
作者简历第48页

论文共48页,点击 下载论文
上一篇:新疆农业大学研究生发表论文制度探析
下一篇:中文分词在农业垂直搜索引擎中的应用研究