首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

突发事件语料噪声排除与网页去重方法研究

引言第1-12页
第一章 研究的意义与国内外动态第12-15页
   ·研究的意义第12页
   ·国内外研究动态第12-13页
   ·本文的组织第13-15页
第二章 突发事件新闻网页要素提取第15-28页
   ·突发事件新闻特点分析与表示方法第15-17页
     ·Web页面特点第15页
     ·网络新闻的特征第15-16页
     ·突发事件新闻文档分析第16-17页
     ·Web新闻的表示第17页
   ·新闻网页获取第17页
   ·突发事件新闻标题抽取第17-21页
     ·新闻网页标题特点第17-18页
     ·新闻网页标题结构分析第18-20页
     ·标题抽取算法第20-21页
   ·新闻主题内容抽取第21-25页
     ·新闻网页的结构特征第21-22页
     ·新闻主题内容结构分析第22-23页
     ·基于网页分割的噪声排除与主题内容抽取第23页
     ·相关工作第23页
     ·向量模型与文本表示第23-24页
     ·算法实现第24-25页
   ·标题与主题内容抽取结果评价第25-26页
   ·发布日期抽取第26-28页
     ·新闻网页发布时间结构分析第26-27页
     ·发布日期抽取过程第27-28页
第三章 新闻网页去重方法第28-38页
   ·网页的重复特点第28页
   ·现有去重方法简介第28-29页
   ·基于发布日期的网页去重第29-30页
   ·抽取特征的区域第30-31页
   ·特征单元的确定第31-32页
   ·权重计算第32-34页
   ·特征选择方法第34-36页
   ·重复网页判定第36-37页
   ·网页去重算法实现第37-38页
第四章 试验模型设计与试验结果第38-44页
   ·试验模型第38页
   ·试验评估方法第38-40页
   ·试验结果第40-43页
   ·试验结果分析第43-44页
第五章 结束语第44-45页
参考文献第45-48页
致谢第48-49页
附录 A学习期间发表论文情况第49-50页

论文共50页,点击 下载论文
上一篇:黄河水沙变化和三角洲岸滩侵蚀态势
下一篇:海底管线仿生防护技术研究