首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

TF-IDF与规则结合的中文关键词自动抽取研究

摘要第4-5页
Abstract第5页
1 绪论第8-14页
    1.1 目的与意义第8-9页
    1.2 研究现状第9-12页
        1.2.1 国外现状第10-12页
        1.2.2 国内现状第12页
    1.3 本文工作第12-14页
2 中文关键词抽取第14-22页
    2.1 关键词的定义第14页
    2.2 存在的问题第14-15页
    2.3 关键词抽取第15-21页
    2.4 评价标准第21-22页
3 未登录词识别第22-40页
    3.1 相关工作及概念第22-23页
    3.2 识别方法第23-35页
        3.2.1 分词第24-25页
        3.2.2 单词未登录词识别第25-31页
        3.2.3 多词表达式识别第31-35页
    3.3 实验第35-40页
        3.3.1 单词未登录词识别实验第35-38页
        3.3.2 多词表达式识别实验第38-40页
4 关键词抽取第40-52页
    4.1 候选词选取第40-41页
        4.1.1 预处理第40-41页
        4.1.2 候选词过滤第41页
    4.2 关键词抽取第41-44页
    4.3 实验与评估第44-52页
        4.3.1 实验数据第44-46页
        4.3.2 未登录词对关键词的影响实验第46-48页
        4.3.3 新闻领域关键词抽取实验第48-50页
        4.3.4 特定领域关键词抽取实验第50-52页
结论第52-54页
参考文献第54-58页
攻读硕士学位期间发表学术论文情况第58-59页
致谢第59-60页

论文共60页,点击 下载论文
上一篇:掺杂YbMnO3的结构和电学性质研究
下一篇:氧化铝基织构陶瓷的模板定向生长及力学性能研究