首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

大规模语料库分词质量评价方法研究

1 绪论第1-12页
   ·课题背景第8-9页
   ·课题研究目标及采用的方法第9页
   ·论文的主要工作及成果第9-11页
   ·论文结构第11-12页
2 文本聚类第12-17页
   ·文本聚类的意义第12-13页
   ·文本聚类算法第13-17页
     ·层次聚类算法第13-14页
     ·分割聚类算法第14-15页
     ·基于密度的聚类算法第15-16页
     ·其它聚类算法第16-17页
3 文本的特征表示第17-22页
   ·文本特征表示及文本相似性计算的一般方法第17-20页
     ·布尔模型第17-18页
     ·概率模型第18-19页
     ·向量空间模型第19-20页
   ·向量空间模型中特征项权重计算第20-22页
4 语料库的统计抽样第22-27页
   ·抽样调查的相关概念第22-23页
   ·抽样调查方法第23-25页
     ·随机抽样第23-24页
     ·分层抽样第24-25页
   ·语料库分词质量评价的分层抽样第25-27页
5 大规模语料库分词质量评价样本的聚类第27-37页
   ·样本聚类系统框图第27-28页
   ·语料库分词质量评价样本的特征提取及权重计算第28-31页
     ·语料库分词质量评价样本特征提取第28-30页
     ·语料库分词质量评价样本各分量权重计算第30-31页
   ·语料库分词质量评价样本的相似性计算第31-32页
   ·聚类算法第32-35页
   ·聚类结果的评价算法第35-37页
6 实验数据分析第37-41页
   ·实验数据第37-38页
   ·结果分析第38-41页
结论与展望第41-42页
致谢第42-43页
参考文献第43-45页

论文共45页,点击 下载论文
上一篇:海洋硫酸多糖916的药代动力学分析方法的研究
下一篇:温室型电动弥雾机的研制及试验