中文网站抓取及编码转换研究

摘要	第1-4页
Abstract	第4-5页
目录	第5-6页
第1章概述	第6-13页
·研究的目的和意义	第6-7页
·国内外研究现状	第7-11页
·研究目标与内容	第11-12页
·论文结构	第12-13页
第2章网络爬虫的工作原理	第13-17页
·网络爬虫基本原理	第13页
·网络爬虫搜索策略	第13-15页
·网络爬虫组成部分	第15-16页
·本章小结	第16-17页
第3章中文网页汉字内码识别	第17-38页
·汉字编码多样性	第17页
·汉字编码识别算法	第17-22页
·特征加权算法	第22-24页
·特征集提取	第24-29页
·汉字编码识别实验及结果分析	第29-38页
第4章中文网页编码转换	第38-42页
·编码转换方法	第38-41页
·中文网页编码转换	第41-42页
第5章总结与展望	第42-43页
·结论	第42页
·展望	第42-43页
参考文献	第43-47页
致谢	第47-48页
作者简历	第48页