首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于中文分词技术的网络经营行为监管系统分析与研究

摘要第3-4页
Abstract第4页
1 绪论第9-21页
    1.1 研究目的及意义第9-10页
    1.2 文献综述及研究现状第10-13页
        1.2.1 文本分类研究现状第10-11页
        1.2.2 自动分词研究现状第11-13页
    1.3 网络监管在公共管理上的内涵与意义第13-15页
        1.3.1 政府网络监管模式和作用第13-14页
        1.3.2 工商部门网络监管的内涵与实质第14-15页
        1.3.3 技术创新对于完善网络监管的意义第15页
    1.4 工商网络监管现状第15-17页
        1.4.1 市场主体未纳入登记管理范围第16页
        1.4.2 监督检查职能没有得到履行第16页
        1.4.3 未能有效保护消费者权益第16-17页
        1.4.4 商标广告监督管理职能不到位第17页
        1.4.5 违法电子合同无法查处第17页
    1.5 工商行政管理部门在电子商务中监管缺位造成的负面影响第17-19页
        1.5.1 电子商务市场主体鱼龙混杂第17-18页
        1.5.2 不正当竞争行为泛滥第18页
        1.5.3 侵犯消费者利益问题严重第18页
        1.5.4 违法广告商标侵权活动猖撅第18-19页
        1.5.5 合同诈骗及违约行为屡屡发生第19页
    1.6 本文的研究内容第19-21页
2 基本概念第21-41页
    2.1 搜索引擎第21-22页
    2.2 web 挖掘第22-24页
        2.2.1 内容挖掘(Web Content Mining)第23页
        2.2.2 结构挖掘(Web Structure Mining)第23-24页
        2.2.3 应用挖掘(Web Usage Mining)第24页
    2.3 数据挖掘中的分类算法第24-31页
        2.3.1 文本分类的方法第25-29页
        2.3.2 合理分类的前提第29页
        2.3.3 分类器第29-31页
    2.4 中文分词技术第31-36页
        2.4.1 分词词典第31页
        2.4.2 分词算法第31-33页
        2.4.3 歧义字段处理第33-35页
        2.4.4 未登录词处理第35-36页
    2.5 搜索策略第36-41页
        2.5.1 广度优先搜索 BFS第36-38页
        2.5.2 深度优先算法 DF第38-39页
        2.5.3 随机游走搜索算法第39-41页
3 基于中文分词技术的工商行政管理网络经营行为监管系统的设计第41-58页
    3.1 互联网内容监管系统模型设计第42-51页
        3.1.1 需求分析第42-43页
        3.1.2 监管模型概述及总体框架第43-46页
        3.1.3 监管模型模块分析第46-49页
        3.1.4 被动和主动分析监控模型的应用环境第49-50页
        3.1.5 双层结构模型第50-51页
    3.2 信息抓取设计第51-52页
        3.2.1 信息抓取第51-52页
        3.2.2 信息预处理第52页
    3.3 网页内容信息挖掘设计第52-53页
    3.4 网页信息服务功能的设计第53页
    3.5 系统数据库设计第53-55页
        3.5.1 保存抓取的文章第53-54页
        3.5.2 存放后抽取的文本的表第54页
        3.5.3 专业特征词表第54-55页
        3.5.4 敏感信息分类表第55页
        3.5.5 标签库第55页
    3.6 控制台功能设计第55-58页
        3.6.1 IP 扫描第56-57页
        3.6.2 WWW 搜索第57-58页
4 工商行政管理网络经营行为监管系统的设计算法策略与实现第58-79页
    4.1 针对工商网络监管专用搜索引擎过滤算法的改进第58-62页
        4.1.1 一种改进的中文分词算法第58-59页
        4.1.2 词典中最短路径中文分词算法的改进第59-61页
        4.1.3 关于改进分词算法与词典最佳路径求解的评注第61-62页
    4.2 算法的实现第62-68页
        4.2.1 组词信息的查询策略第62-63页
        4.2.2 分词结果输出第63页
        4.2.3 分词过程中的状态第63-65页
        4.2.4 算法实现的流程图第65-68页
    4.3 本系统的具体实现过程第68-79页
        4.3.1 文本预处理第68-71页
        4.3.2 分词处理第71-76页
        4.3.3 分词节点的属性联接、统计和权重的计算第76-79页
5 结束语第79-82页
    5.1 对于中文文本过滤的认识第79-80页
    5.2 本系统目前存在的问题及以后的改进工作第80-82页
参考文献第82-86页
致谢第86-87页
攻读学位期间主要科研成果第87页

论文共87页,点击 下载论文
上一篇:湖南美术出版社艺术品长期投资决策改进研究
下一篇:消费者对网络推荐的抗拒行为研究