首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息抽取在书签系统中的应用研究与实现

摘要第1-4页
Abstract第4-5页
目录第5-7页
1 绪论第7-12页
   ·研究背景第7-9页
   ·研究现状第9-10页
   ·本文的主要内容与论文结构第10-12页
2 相关知识与技术第12-25页
   ·Web书签第12-15页
     ·传统浏览器书签第12-13页
     ·浏览器书签同步服务第13-14页
     ·社会化书签系统第14-15页
   ·系统实现中的相关技术第15-18页
     ·Python语言第16页
     ·Tornado Web Server第16-17页
     ·MongoDB第17页
     ·Web前端第17-18页
   ·Web网页信息抽取第18-21页
     ·HTML简介第19-20页
     ·网页信息抽取方法第20-21页
   ·标记系统第21-24页
     ·标记的价值第21-22页
     ·标记陷阱第22-23页
     ·标签推荐第23-24页
   ·本章小结第24-25页
3 Web网页信息抽取的实现第25-49页
   ·Web信息处理流程第25-26页
   ·Goose项目及其存在的问题第26-27页
   ·将Goose移植到Python3第27-28页
   ·引入中文分词系统第28-30页
   ·Web数据抓取第30-33页
     ·基本的Web数据抓取与存在的问题第30-31页
     ·Tornado异步Web请求第31-32页
     ·Tornado网页抓取第32-33页
   ·字符编码问题第33-38页
     ·字符集与编码第34-36页
     ·编码识别第36-38页
   ·改进的Goose信息抽取算法第38-46页
     ·lxml与ElementTree第38-39页
     ·预处理第39-42页
     ·获取网页元数据第42页
     ·正文抽取过程第42-43页
     ·正文格式化处理第43页
     ·测试信息抽取第43-46页
   ·标签推荐第46-47页
   ·网页摘要第47-48页
   ·本章小结第48-49页
4 书签系统设计与实现第49-69页
   ·系统设计第49-50页
   ·Web服务设计第50-52页
   ·数据库设计第52-55页
   ·开发环境第55-60页
     ·基本环境安装第56-58页
     ·MongoDB安装第58-60页
   ·Web客户端实现第60-64页
   ·浏览器插件实现第64-65页
   ·全文搜索实现第65-68页
   ·本章小结第68-69页
5 总结与展望第69-72页
   ·总结第69-70页
   ·展望第70-72页
致谢第72-73页
参考文献第73-75页

论文共75页,点击 下载论文
上一篇:基于人脸图像的性别分类
下一篇:基于多体感设备的人体行为识别