首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于TF算法的英文科技文献关键词提取方法研究

摘要第1-8页
Abstract第8-10页
1 绪论第10-19页
   ·研究背景与意义第10-11页
     ·研究背景第10页
     ·研究意义第10-11页
   ·国内外研究现状第11-15页
     ·国内研究现状第11-14页
     ·国外研究现状第14-15页
   ·主要研究内容第15-16页
   ·研究技术路线图与创新点第16-19页
     ·研究技术路线图第16-17页
     ·研究创新点第17-19页
2 关键词提取的相关技术理论与方法第19-24页
   ·关键词概述及相关技术第19-20页
     ·关键词含义的界定第19页
     ·关键词提取的相关技术第19-20页
   ·常用的提取算法介绍第20-23页
     ·基于统计的方法第20页
     ·基于机器学习的方法第20-22页
     ·基于语义分析的方法第22-23页
   ·本章小结第23-24页
3 英文科技文献的相关描述第24-29页
   ·英文科技文献的界定第24-26页
     ·英文文献的界定第24页
     ·英文科技文献的特点第24-26页
   ·基于英文科技文献的关键词提取技术优势与不足之处第26-28页
     ·基于英文科技文献的关键词提取技术优势第26-27页
     ·基于英文科技文献的关键词提取技术不足之处第27-28页
   ·本章小结第28-29页
4 结合统计分析的关键词提取法第29-35页
   ·TF-IDF算法第29-31页
     ·TF-IDF算法描述第29-30页
     ·算法步骤与计算方式第30-31页
   ·基于TF-IDF算法的语料库的种类与选择第31页
     ·英文科技文献语料库的种类第31页
     ·英文科技文献语料库的区分选择第31页
   ·过滤词库的建立第31-33页
     ·过滤词库的含义及作用第31-32页
     ·过滤词库的建立第32-33页
     ·基于过滤词库的关键词筛选第33页
   ·本章小结第33-35页
5 基于候选关键词在文中位置不同的P-TF-IDF算法的提出第35-41页
   ·候选关键词在文中的位置第35-36页
     ·候选关键词在文章标题中第35页
     ·候选关键词在文中的章节标题中第35-36页
     ·候选关键词在文中普通段落中第36页
   ·候选关键词在文中的集中程度第36页
     ·散落在全文中对候选关键词的影响第36页
     ·集中出现在某些段落中对候选关键词的影响第36页
   ·P-TF-IDF算法特征选取与权重计算第36-40页
     ·P-TF-IDF算法及其特征第36-37页
     ·tf-idf和位置特征权重的计算第37-40页
   ·本章小结第40-41页
6 实验及结果分析第41-55页
   ·实验数据构建第41-42页
     ·实验文本的选择第41页
     ·实验语料库的选定第41-42页
   ·分词系统与文本预处理第42-43页
     ·分词系统第42页
     ·文本的预处理第42-43页
   ·实验数据及分析评价第43-54页
     ·基于P-TF-IDF的关键词提取算法的实验步骤第44-46页
     ·对P-TD-IDF算法的验证第46-49页
     ·数据评价第49-54页
   ·本章小结第54-55页
7 总结与展望第55-57页
   ·总结第55-56页
   ·展望第56-57页
参考文献第57-60页
攻读硕士期间论文发表情况第60-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:新媒体背景下的大学生政治观教育探究
下一篇:中国南方典型石漠化区地下水土流失防治技术初步研究与示范--以喀斯特高原山地、喀斯特高原峡谷、喀斯特高原盆地为例