首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于最大熵酒店评论分类系统的设计与实现

摘要第4-5页
ABSTRACT第5页
第一章 引言第8-11页
    1.1 课题背景第8-9页
    1.2 课题任务第9-10页
        1.2.1 课题内容第9页
        1.2.2 本人承担任务第9-10页
    1.3 论文结构第10-11页
第二章 文本分类相关技术背景介绍第11-22页
    2.1 搜索引擎技术介绍第11-13页
    2.2 文本分类相关概念及技术介绍第13-15页
        2.2.1 短文本及酒店评论介绍第13页
        2.2.2 文本分类相关流程介绍第13-14页
        2.2.3 文本分类相关技术介绍第14-15页
    2.3 网络爬虫技术介绍第15-19页
        2.3.1 垂直网络爬虫介绍第16-17页
        2.3.2 分布式网络爬虫介绍第17-19页
        2.3.3 深度网络爬虫第19页
    2.4 最大熵的数学模型介绍第19-21页
        2.4.1 熵(Entropy)第19页
        2.4.2 最大熵的数学模型第19-20页
        2.4.3 最大熵的应用第20-21页
    2.5 本章小结第21-22页
第三章 系统需求分析第22-27页
    3.1 功能性需求分析第22-26页
        3.1.1 爬虫子系统功能性需求分析第22-25页
        3.1.2 分类子系统功能性需求分析第25-26页
    3.2 本章小结第26-27页
第四章 系统中爬虫模块的设计与实现第27-38页
    4.1 分类系统完整结构及流程介绍第27-28页
    4.2 爬虫模块的设计与实现第28-37页
        4.2.1 代理模块第28页
        4.2.2 抓取模块的设计与实现第28-36页
        4.2.3 解析模块的设计与实现第36-37页
    4.3 本章小结第37-38页
第五章 系统分类模块的设计与实现第38-53页
    5.1 文本分类模块的结构及流程图第38-39页
    5.2 文本的表示及观点识别第39-40页
        5.2.1 文本的表示方法第39页
        5.2.2 文本的倾向性识别第39-40页
    5.3 文本分词处理第40-44页
        5.3.1 中文分词第40-42页
        5.3.2 停用词过滤第42-43页
        5.3.3 结巴分词介绍第43-44页
    5.4 文本特征选择方法第44-46页
        5.4.1 基于DF的特征提取方法第44页
        5.4.2 信息增益方法第44-45页
        5.4.3 卡方(CHI)统计量第45-46页
    5.5 文本特征权重计算第46-47页
    5.6 分类器设计第47-50页
        5.6.1 分类器介绍第47页
        5.6.2 最大熵分类器设计第47-49页
        5.6.3 分类器性能指标第49-50页
    5.7 分类器设计与实现第50-52页
        5.7.1 语料选择第50页
        5.7.2 系统相关模块介绍第50-51页
        5.7.3 测试流程及结果分析第51-52页
    5.8 本章小结第52-53页
第六章 结束语第53-54页
    6.1 论文工作总结第53页
    6.2 问题和展望第53-54页
参考文献第54-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:基于WEB的网上装修服务系统的设计与实现
下一篇:燃料信息管理系统的设计与实现