科研文献核心文本的自然语言处理

摘要	第1-8页
Abstract	第8-10页
第一章绪论	第10-16页
·研究背景	第10页
·课题的研究意义及发展现状	第10-13页
·主要研究内容	第13-14页
·论文的篇章结构	第14页
·本章小结	第14-16页
第二章科研文献的结构分析	第16-18页
·科研文献的概念及特点	第16页
·科研文献的基本概念	第16页
·科研文献的主要特点	第16页
·科研文献的结构	第16-17页
·科研文献的信息分布	第17页
·本章小结	第17-18页
第三章相关技术介绍	第18-32页
·Web 爬取	第18-19页
·Web 爬取分类与策略	第18页
·Web 爬取的原理与技术	第18-19页
·Web 信息抽取技术	第19-24页
·HTML 页面解析	第19-21页
·Web 信息抽取技术	第21-24页
·Web 信息抽取评价方法	第24页
·聚类过程	第24-30页
·特征选择与加权	第25-27页
·相似度计算	第27-28页
·聚类算法分析	第28-30页
·本章小结	第30-32页
第四章科研文献网页的采集模块技术实现	第32-40页
·任务提交端设计	第33-34页
·服务器端设计	第34-35页
·客户端设计	第35-36页
·爬取后的数据保存	第36-38页
·本章小结	第38-40页
第五章科研文献网页关键信息提取模块技术实现	第40-48页
·Web 信息抽取流程	第40-41页
·Web 信息抽取模型	第41-46页
·文献核心数据提取	第42-44页
·文献信息提取界面设计	第44-46页
·信息抽取结果	第46-47页
·本章小结	第47-48页
第六章科研文献统计分析模块设计	第48-58页
·文本信息处理	第48页
·特征选择与加权	第48-52页
·相似度计算	第52-54页
·聚类算法与结果	第54-56页
·本章小结	第56-58页
第七章总结与展望	第58-60页
·全文总结	第58-59页
·下一步工作计划	第59页
·心得体会	第59-60页
参考文献	第60-64页
致谢	第64-66页
附录	第66页