首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于统计与协同过滤的关键词提取研究

摘要第5-6页
ABSTRACT第6-7页
符号对照表第10-11页
缩略词对照表第11-14页
第一章 绪论第14-18页
    1.1 本文研究的背景及意义第14页
    1.2 国内外研究现状介绍第14-15页
    1.3 本文主要工作介绍第15-16页
    1.4 论文的章节安排第16-18页
第二章 理论知识和技术介绍第18-32页
    2.1 关键词提取技术分类第18-19页
    2.2 ICTCLAS中科院分词系统介绍第19-21页
    2.3 倒排索引第21-24页
        2.3.1 单词——文档矩阵第21-22页
        2.3.2 倒排索引结构第22-23页
        2.3.3 倒排索引建立第23-24页
    2.4 TF-IDF算法第24-25页
    2.5 协同过滤算法第25-30页
        2.5.1 推荐系统简介第25-27页
        2.5.2 基于用户的协同过滤算法第27-28页
        2.5.3 基于物品的协同过滤算法第28-30页
    2.6 本章小节第30-32页
第三章 基于统计和协同过滤的关键词提取算法第32-46页
    3.1 算法简介第32页
    3.2 改进的中文分词算法第32-36页
    3.3 基于多特征的关键词提取第36-40页
        3.3.1 评分公式第36页
        3.3.2 特征介绍第36-38页
        3.3.3 基于多特征的关键词提取算法第38-40页
    3.4 基于协同过滤的关键词提取第40-44页
        3.4.1 算法简介第40页
        3.4.2 离线训练第40-41页
        3.4.3 在线提取第41-44页
    3.5 基于统计和协同过滤算法的融合第44-45页
    3.6 本章小节第45-46页
第四章 实验及结果分析第46-68页
    4.1 实验数据第46页
    4.2 评估方法第46-47页
    4.3 参数取值及分析第47-60页
        4.3.1 词性特征第48-50页
        4.3.2 词位置特征第50-52页
        4.3.3 词长度特征第52-54页
        4.3.4 多特征的评分阈值第54-55页
        4.3.5 候选文章相同词语数的阈值第55-56页
        4.3.6 候选文章数量第56-57页
        4.3.7 候选关键词的评分阈值第57-58页
        4.3.8 关键词个数的阈值范围第58-60页
    4.4 算法性能比较及分析第60页
    4.5 算法验证工具第60-67页
        4.5.1 算法验证工具框架及实现介绍第61-62页
        4.5.2 算法验证工具功能介绍第62-67页
    4.6 本章小节第67-68页
第五章 总结和展望第68-70页
    5.1 研究内容总结第68-69页
    5.2 未来工作展望第69-70页
参考文献第70-74页
致谢第74-76页
作者简介第76-77页

论文共77页,点击 下载论文
上一篇:基于函数监控的恶意程序行为捕获研究与实现
下一篇:高性能超分辨率重建算法研究