首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于向量空间模型的网页信息过滤方法研究

摘要第1-5页
Abstract第5-9页
1 绪论第9-15页
   ·内容安全第9-13页
     ·信息安全第9页
     ·内容安全概述第9-10页
     ·内容安全现状第10-12页
     ·内容安全和信息过滤第12-13页
   ·研究意义第13页
   ·本文工作第13-14页
   ·论文结构第14-15页
2 网页信息过滤关键技术第15-28页
   ·中文分词第15-17页
     ·中文分词存在的问题第15-16页
     ·中文分词方法第16-17页
   ·文本表示第17-23页
     ·向量空间模型第17-19页
     ·特征项的选择第19-20页
     ·特征项权重的计算第20-22页
     ·改进的基于HTML标记加权的权重计算第22-23页
   ·特征提取第23-28页
3 网页正文内容抽取方法第28-39页
   ·网页正文内容抽取介绍第28-30页
     ·网页正文内容抽取方法存在的问题和困难第28-29页
     ·本文采用的网页正文内容抽取方法第29-30页
   ·基于中文标点符号的网页正文信息抽取方法第30-39页
     ·网页中中文标点符号的分布特征第30页
     ·网页内容结构化表示第30-36页
     ·网页正文内容的提取第36-37页
     ·实验结果与分析第37-39页
4 网页信息过滤系统的设计与实现第39-58页
   ·系统总体结构设计第39-40页
   ·网页内容过滤模型第40-42页
   ·HTTP数据包的截获和还原第42-49页
     ·HTTP数据包截获方法选择第42-45页
     ·HTTP数据包截获流程第45-46页
     ·HTTP响应结构第46-47页
     ·HTTP数据包还原第47-49页
   ·向量空间模型的生成第49-51页
   ·过滤算法设计第51-56页
     ·以训练样本得到的向量为基准第53-54页
     ·以待判定网页特征词集得到的向量为基准第54-55页
     ·阈值的设定第55-56页
   ·实验结果与分析第56-58页
     ·评价指标第56页
     ·实验结果第56-58页
结论第58-60页
参考文献第60-63页
附录A 向量空间模型生成代码第63-65页
攻读硕士学位期间发表学术论文情况第65-66页
致谢第66-67页

论文共67页,点击 下载论文
上一篇:科兴公司人力资源战略管理研究
下一篇:寿光新龙电化集团竞争战略研究