首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

医疗贴吧中广告的提取系统

摘要第4-6页
ABSTRACT第6-7页
1 绪论第10-14页
    1.1 本文研究意义第10-11页
    1.2 文本分类的背景及现状第11-12页
    1.3 本文主要研究内容第12-13页
    1.4 论文组织结构第13-14页
2 系统模型的相关理论知识及技术第14-18页
    2.1 机器学习第14页
    2.2 PYTHON第14-15页
    2.3 网络爬虫第15-17页
    2.4 本章小结第17-18页
3 文本分类模型第18-36页
    3.1 文本分类简介第18-19页
    3.2 实验数据的抓取与文本特征分析第19-24页
        3.2.1 实验数据的抓取第19-23页
        3.2.2 文本特征分析第23-24页
    3.3 文本预处理第24-27页
        3.3.1 去停用词第24-25页
        3.3.2 文本分词第25-26页
        3.3.3 特征选择第26-27页
    3.4 文本表示第27-30页
        3.4.1 布尔模型第27页
        3.4.2 概率模型第27-28页
        3.4.3 向量空间模型第28-30页
    3.5 分类算法第30-31页
    3.6 经典的统计学习分类方法第31-34页
        3.6.1 朴素贝叶斯算法第31-32页
        3.6.2 决策树分类算法第32-34页
    3.7 性能评价体系第34页
    3.8 本章小结第34-36页
4 广告提取系统模型的设计与实现第36-44页
    4.1 广告提取系统的模型第36页
    4.2 预处理模块的设计与实现第36-37页
    4.3 文本表示模块的设计与实现第37-39页
    4.4 分类模块的设计与实现第39-40页
    4.5 信息增益与基于LOGISTIC回归的RFE算法相结合第40-43页
    4.6 本章小结第43-44页
5 总结与展望第44-46页
    5.1.本文工作总结第44页
    5.2 后续工作的展望第44-46页
参考文献第46-50页
致谢第50-51页

论文共51页,点击 下载论文
上一篇:基于格结构文件系统的强化学习推荐模型研究及应用
下一篇:基于FPGA的双路视频预处理系统设计与实现