科研文献核心文本的自然语言处理
摘要 | 第1-8页 |
Abstract | 第8-10页 |
第一章 绪论 | 第10-16页 |
·研究背景 | 第10页 |
·课题的研究意义及发展现状 | 第10-13页 |
·主要研究内容 | 第13-14页 |
·论文的篇章结构 | 第14页 |
·本章小结 | 第14-16页 |
第二章 科研文献的结构分析 | 第16-18页 |
·科研文献的概念及特点 | 第16页 |
·科研文献的基本概念 | 第16页 |
·科研文献的主要特点 | 第16页 |
·科研文献的结构 | 第16-17页 |
·科研文献的信息分布 | 第17页 |
·本章小结 | 第17-18页 |
第三章 相关技术介绍 | 第18-32页 |
·Web 爬取 | 第18-19页 |
·Web 爬取分类与策略 | 第18页 |
·Web 爬取的原理与技术 | 第18-19页 |
·Web 信息抽取技术 | 第19-24页 |
·HTML 页面解析 | 第19-21页 |
·Web 信息抽取技术 | 第21-24页 |
·Web 信息抽取评价方法 | 第24页 |
·聚类过程 | 第24-30页 |
·特征选择与加权 | 第25-27页 |
·相似度计算 | 第27-28页 |
·聚类算法分析 | 第28-30页 |
·本章小结 | 第30-32页 |
第四章 科研文献网页的采集模块技术实现 | 第32-40页 |
·任务提交端设计 | 第33-34页 |
·服务器端设计 | 第34-35页 |
·客户端设计 | 第35-36页 |
·爬取后的数据保存 | 第36-38页 |
·本章小结 | 第38-40页 |
第五章 科研文献网页关键信息提取模块技术实现 | 第40-48页 |
·Web 信息抽取流程 | 第40-41页 |
·Web 信息抽取模型 | 第41-46页 |
·文献核心数据提取 | 第42-44页 |
·文献信息提取界面设计 | 第44-46页 |
·信息抽取结果 | 第46-47页 |
·本章小结 | 第47-48页 |
第六章 科研文献统计分析模块设计 | 第48-58页 |
·文本信息处理 | 第48页 |
·特征选择与加权 | 第48-52页 |
·相似度计算 | 第52-54页 |
·聚类算法与结果 | 第54-56页 |
·本章小结 | 第56-58页 |
第七章 总结与展望 | 第58-60页 |
·全文总结 | 第58-59页 |
·下一步工作计划 | 第59页 |
·心得体会 | 第59-60页 |
参考文献 | 第60-64页 |
致谢 | 第64-66页 |
附录 | 第66页 |