首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Google Web API的中文训练库自动获取方法研究与实现

摘要第1-5页
Abstract第5-9页
第1章 引言第9-12页
   ·课题背景第9-10页
   ·相关研究第10页
   ·课题研究的内容及拟解决的关键问题第10-11页
   ·本文的内容安排第11-12页
第2章 训练库自动获取的相关技术研究第12-28页
   ·中文分词技术研究第12-17页
     ·中文分词的研究与发展现状第12页
     ·中文分词技术第12-15页
     ·关于中文分词系统ICTCLAS第15-17页
   ·训练文本的特征表示模型第17-21页
     ·布尔模型第17-19页
     ·向量空间模型第19-20页
     ·概率模型第20-21页
   ·特征词权重的计算第21-23页
   ·文本分类算法的研究第23-26页
     ·朴素贝叶斯算法第23-24页
     ·类中心向量法第24页
     ·决策树分类法第24页
     ·支持向量机第24-25页
     ·KNN(K最近邻)分类算法第25-26页
   ·本章小结第26-28页
第3章 训练库自动获取系统的设计第28-36页
   ·训练库自动获取的基本思想第28-30页
   ·训练库自动获取系统的设计第30-35页
     ·传统训练库获取方法研究第30页
     ·设计目标第30-31页
     ·训练库自动获取的系统框架第31-33页
     ·训练库自动获取流程第33-34页
     ·系统实现所需技术第34-35页
   ·本章小结第35-36页
第4章 训练库自动获取的实现第36-50页
   ·基于Google Web API的网页自动获取第36-39页
   ·网页清洗第39-43页
   ·特征提取方法第43-48页
     ·特征词提取方法研究第44-46页
     ·基于词性的特征词提取方法研究第46-48页
   ·训练库生成第48-49页
   ·本章小结第49-50页
第5章 改进的训练库自动获取方法第50-58页
   ·根据类及类的层次获取训练样本第50-53页
   ·根据相关词组获取训练样本第53-56页
   ·实验结果及分析第56-57页
   ·本章小结第57-58页
第6章 总结与展望第58-60页
   ·本文总结第58页
   ·今后工作的展望第58-60页
参考文献第60-63页
致谢第63-64页
攻读硕士研究生期间参与的项目和所发表的论文第64页

论文共64页,点击 下载论文
上一篇:基于XML的Web数据存储与数据清洗技术研究与实现
下一篇:有色金属企业调度系统与分布式应用