首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

新词识别和热词排名方法研究

摘要第3-4页
ABSTRACT第4页
1 绪论第8-12页
    1.1 课题研究背景第8页
    1.2 课题研究意义第8-9页
    1.3 国内外研究现状第9-10页
    1.4 本文难点第10-11页
    1.5 本文研究内容第11页
    1.6 本文的组织结构第11-12页
2 新词检测的理论基础第12-22页
    2.1 自然语言处理概述第12-15页
        2.1.1 自然语言处理的研究与发展第12页
        2.1.2 自然语言处理的关键技术第12-13页
        2.1.3 自然语言处理研究的内容与难点第13-15页
    2.2 新词的定义与模式分析第15-18页
        2.2.1 新词的定义第15-16页
        2.2.2 新词的特征第16-17页
        2.2.3 新词的模式第17-18页
    2.3 新词检测方法概述第18-21页
        2.3.1 以规则为主的新词检测第18-19页
        2.3.2 以统计为主的新词检测第19-20页
        2.3.3 统计方法与规则方法融合第20-21页
    2.4 本章小结第21-22页
3 新词检测方法研究第22-30页
    3.1 目前新词检测方法的不足第22页
    3.2 本文方法的理论介绍第22-25页
        3.2.1 互信息第23-24页
        3.2.2 左右信息熵第24-25页
    3.3 候选新词获取方法第25-26页
    3.4 词语边界确定第26-27页
    3.5 垃圾串的过滤方法第27页
    3.6 本文新词检测方法步骤第27-29页
    3.7 本章小结第29-30页
4 新词检测实验与性能评估第30-43页
    4.1 实验设计第30-32页
        4.1.1 实验环境第30页
        4.1.2 数据集选择第30页
        4.1.3 实验评价指标第30-31页
        4.1.4 实验目标第31页
        4.1.5 实验步骤第31-32页
    4.2 文本预处理第32页
    4.3 重复串统计第32-34页
    4.4 阈值的选择第34-36页
    4.5 垃圾词典的训练与提取第36-37页
    4.6 新词识别实验结果及分析第37-41页
        4.6.1 平均互信息性能第37-38页
        4.6.2 左右信息熵性能第38页
        4.6.3 平均互信息与信息熵结合性能图第38-39页
        4.6.4 Score 评价函数性能图第39-40页
        4.6.5 F 值对比图第40页
        4.6.6 垃圾过滤前后 F 值对比第40-41页
    4.7 与前人工作比较第41-42页
    4.8 本章小结第42-43页
5 热词排名算法及实验分析第43-58页
    5.1 引言第43-44页
        5.1.1 热词定义第43页
        5.1.2 热词研究意义第43页
        5.1.3 热词的特点第43-44页
        5.1.4 目前热词排名方法分析第44页
    5.2 本文热词排名方法第44-46页
        5.2.1 贝叶斯平均法第45页
        5.2.2 牛顿冷却定律第45-46页
    5.3 实验设计第46-57页
        5.3.1 数据集选取第46-47页
        5.3.2 热词评价标准第47页
        5.3.3 实验目标第47-48页
        5.3.4 热词排名方法步骤第48页
        5.3.5 贝叶斯平均实验第48-52页
        5.3.6 牛顿冷却定律实验第52-54页
        5.3.7 改进热词评价值第54-55页
        5.3.8 实验结果分析第55-57页
    5.4 本章小结第57-58页
6 总结与展望第58-60页
    6.1 本文工作总结第58页
    6.2 未来工作展望第58-60页
致谢第60-61页
参考文献第61-64页
附录第64页
    A. 作者在攻读硕士学位期间发表的论文目录第64页

论文共64页,点击 下载论文
上一篇:基于社交用户标签的混合个性化推荐研究
下一篇:高校交换生学分认定的教学管理研究--以浙江师范大学为例