首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文web文本过滤技术研究

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-15页
   ·研究目的、意义及背景第10-11页
   ·国内外研究状况第11-13页
     ·信息过滤技术领域第11页
     ·Web 信息内容识别和提取领域第11-12页
     ·Web 文本分类领域第12-13页
   ·论文结构安排第13-15页
第2章 网络信息过滤相关问题综述第15-20页
   ·Web 信息介绍第15-17页
     ·Html 语言结构第15-16页
     ·文档对象模型(DOM)第16-17页
   ·信息过滤系统的基本结构第17-18页
   ·信息过滤系统的分类第18-19页
   ·文本过滤的性能评价第19-20页
第3章 中文 web 文本过滤关键技术分析第20-35页
   ·文本表示模型第20-22页
     ·布尔模型(Boolean Model)第20-21页
     ·概率模型(Probabilistic Model)第21页
     ·向量空间模型(Vector Space Model,VSM)第21-22页
   ·文本分类算法第22-25页
     ·几种主要的分类算法第23-25页
     ·各分类算法比较第25页
   ·中文分词技术第25-27页
   ·中文分词问题及解决方法第27-28页
   ·网页文本特征选择及特征项权重计算方法第28-31页
     ·特征提取第28-30页
     ·常用权重计算函数第30-31页
   ·用户兴趣模型的创建与更新第31-35页
     ·用户兴趣需求信息的获取第32页
     ·用户兴趣模型的创建第32-33页
     ·用户兴趣模型的更新第33-35页
第4章 中文 web 信息抽取及过滤器研究与设计第35-51页
   ·基于HTML 树和内容分析的可适应性信息抽取第35-44页
     ·中文web 正文内容抽取方法存在的问题和困难第35-36页
     ·基于HTML 树和内容分析的可适应性信息抽取算法第36-43页
     ·实验结果与分析第43-44页
   ·适用于网页文本的多元信息向量空间的提出第44-49页
     ·向量空间模型及其分析第45-46页
     ·多元信息向量空间模型过滤器第46-48页
     ·实验结果与分析第48-49页
   ·本章小结第49-51页
第5章 中文 web 过滤原型系统的设计及实现第51-62页
   ·基于DOM 的网页解析模块第52页
   ·分词子模块第52-55页
     ·分词处理第52-54页
     ·去除停用词第54-55页
   ·特征提取与权值计算模块第55-56页
   ·用户需求与阈值初始化模块第56-57页
   ·过滤匹配模块第57-58页
   ·用户反馈模块第58-59页
   ·系统实现及结果分析第59-61页
   ·本章小结第61-62页
第6章 总结展望第62-63页
   ·本文总结第62页
   ·未来展望第62-63页
参考文献第63-67页
发表论文和科研情况说明第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:基于商空间的视景仿真模型构建
下一篇:基于计算机视觉的人耳识别技术研究