首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网页文本干扰信息预处理方法研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-20页
   ·联网发展现状第10-12页
     ·网络的重要性第11-12页
   ·网络不良信息概况第12-16页
     ·网络不良信息的表现形式分类第13-14页
     ·网页不良信息的主要内容第14-16页
   ·网页不良信息的干扰手段第16-18页
     ·不良网页干扰信息的特点第16-17页
     ·不良网页干扰信息预处理的必要性第17-18页
   ·论文主要内容和组织结构第18-20页
     ·研究的主要内容第18-19页
     ·论文的组织结构第19-20页
第2章 预处理背景知识和相关技术第20-29页
   ·网页不良信息过滤的研究现状第20-21页
   ·网页不良信息预处理的研究现状第21-22页
   ·基于文本的不良信息预处理的必要性第22-25页
     ·网页文本的结构化特点第23-24页
     ·干扰手段的多样性第24-25页
   ·预处理的相关技术第25-26页
   ·网页文本干扰信息预处理的难点和系统框架第26-29页
第3章 HTML标签及特殊符号的预处理第29-35页
   ·去除HTML标签的相关研究第29-30页
   ·HTML标签的预处理第30-32页
     ·HTML的特点和结构分析第31页
     ·HTML标签的去除第31-32页
   ·干扰符号的预处理第32-35页
     ·常见的干扰符号类型第33页
     ·正则表达式去除干扰符号第33-35页
第4章 编码的转换机制第35-41页
   ·编码系统的简介第36-40页
   ·支持中文的各编码系统间的相互转换第40-41页
第5章 敏感词的恢复第41-50页
   ·敏感词词汇表的构建第41-42页
   ·敏感词的恢复第42-43页
   ·WM多模式匹配算法的应用第43-50页
     ·常见的多模式匹配算法第44-47页
     ·WM多模式匹配算法及其预处理中的应用第47-50页
第6章 预处理器的设计实现与测试分析第50-57页
   ·预处理器的设计与实现第50-52页
   ·预处理效果第52-56页
   ·本章小结第56-57页
第7章 总结第57-59页
致谢第59-61页
参考文献第61-64页
附录第64页

论文共64页,点击 下载论文
上一篇:基于分类的文本内容判别方法研究
下一篇:东海县曲阳水晶街工程项目进度管理研究