首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

海量文本信息的Web采集与自动分类研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-17页
    1.1 研究背景第9-11页
        1.1.1 Web采集相关背景第9-10页
        1.1.2 文本自动分类相关背景第10-11页
        1.1.3 本课题提出的背景和意义第11页
    1.2 国内外研究现状第11-14页
        1.2.1 Web采集技术研究现状第12-13页
        1.2.2 文本自动分类技术研究现状第13-14页
    1.3 本文目标和主要工作第14-15页
    1.4 本文的组织结构第15-17页
第二章 Web采集与自动分类关键技术分析第17-29页
    2.1 Web采集相关技术分析第17-19页
        2.1.1 网络采集技术第17-18页
        2.1.2 网页信息处理技术第18-19页
    2.2 文本自动分类相关技术分析第19-27页
        2.2.1 文本特征提取方法第19-21页
        2.2.2 文本表示方法第21-22页
        2.2.3 文本自动分类算法第22-27页
    2.3 技术难点分析第27-29页
第三章 Web采集与自动分类系统设计第29-49页
    3.1 Web采集与自动分类系统设计目标第29-30页
        3.1.1 Web采集系统的目标第29页
        3.1.2 文本自动分类系统的目标第29-30页
    3.2 系统总体设计与模块划分第30-31页
    3.3 Web采集系统详细设计第31-36页
        3.3.1 Web采集系统输入第32-33页
        3.3.2 Web采集系统过程处理第33-35页
        3.3.3 Web采集文本内容处理第35页
        3.3.4 Web采集信息输出第35-36页
    3.4 文本自动分类系统详细设计第36-49页
        3.4.1 分类数据预处理过程第38-41页
        3.4.2 基于词池的特征词演化第41-43页
        3.4.3 构建自动分类空间第43-45页
        3.4.4 分类模型及分类流程第45-49页
第四章 Web采集与自动分类系统实现第49-65页
    4.1 项目背景与系统环境第49-50页
    4.2 Web采集系统的实现与展示第50-56页
        4.2.1 输入控制与采集规则第50-52页
        4.2.2 采集过程与内容处理第52-55页
        4.2.3 信息规整与输出第55-56页
    4.3 自动分类系统的实现与展示第56-60页
        4.3.1 数据输入及预处理第56-57页
        4.3.2 词池演化特征词实现第57-58页
        4.3.3 分类构建与分类过程第58-60页
    4.4 系统性能分析第60-65页
第五章 结语第65-67页
    5.1 论文工作总结第65-66页
    5.2 进一步研究工作第66-67页
参考文献第67-69页
致谢第69-71页
作者攻读学位期间发表的学术论文目录第71页

论文共71页,点击 下载论文
上一篇:税收优惠型健康保险产品开发研究
下一篇:外部冲击下的银行系统性风险特征研究--基于动态模拟视角