首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于子串的文本分割与主题标注研究

摘要第1-8页
Abstract第8-17页
第1章 绪论第17-45页
   ·引言第17-20页
   ·国内外研究现状第20-42页
     ·文本分割第20-25页
     ·文本表示第25-30页
     ·段落抽取第30-33页
     ·序列标注第33-38页
     ·主题标注第38-42页
   ·本文研究内容第42-44页
   ·全文组织结构第44-45页
第2章 基于子串的文本分割第45-67页
   ·文档模型第45-53页
     ·后缀树文档模型第45-47页
     ·后缀树的构造第47-49页
     ·基于子串的文本表示第49-50页
     ·n元子串和n元组第50-53页
   ·基于正则化割准则的文本分割算法第53-57页
     ·文本连贯性第53页
     ·文本分割算法第53-55页
     ·分割粒度的确定第55-57页
   ·实验与分析第57-66页
     ·实验数据集第57-59页
     ·中英文混合文本的表示第59-61页
     ·文本分割实验结果与分析第61-66页
   ·小结第66-67页
第3章 基于子串的段落抽取第67-80页
   ·基于子串的查询敏感最大割算法第67-71页
     ·段落抽取的依据第67-68页
     ·连贯性割与相关性割第68-69页
     ·基于多目标优化的动态文本分割第69-71页
   ·基于子串的查询扩展第71-74页
     ·查询扩展第71-72页
     ·SQMC相关反馈第72-73页
     ·SQMC查询扩展第73-74页
   ·实验与分析第74-79页
     ·基准方法第74页
     ·实验数据集与评估标准第74-75页
     ·段落抽取实验结果与分析第75-79页
   ·小结第79-80页
第4章 半监督命名实体识别第80-95页
   ·K近似条件随机场第80-86页
     ·k-CRF的定义第80-82页
     ·k-CRF的标注算法第82-83页
     ·k-CRF的训练算法第83-85页
     ·k-CRF的特征第85-86页
   ·词语相似性计算第86-91页
     ·向量表示第87-88页
     ·向量相似性第88-89页
     ·向量正则化第89-90页
     ·向量降维第90页
     ·单值分解第90-91页
   ·实验与分析第91-93页
   ·小结第93-95页
第5章 基于子串的文本主题标注第95-110页
   ·基于子串的文本主题标注算法第95-101页
     ·标记特征权重计算第95-96页
     ·标记的重要性度量第96-98页
     ·高覆盖性标记第98-99页
     ·多文档协同标注第99-101页
   ·子串的选择第101-103页
     ·基于术语表的子串选择第101-102页
     ·子串的位置第102-103页
   ·实验与分析第103-109页
     ·主题标注的评价第103-104页
     ·实验方法与参数选择第104-106页
     ·实验结果第106-109页
   ·小结第109-110页
第6章 文本主题分析原型系统第110-115页
   ·系统结构第110-111页
   ·原型系统第111-115页
第7章 总结与展望第115-117页
参考文献第117-129页
攻读博士学位期间发表的论文第129-130页
致谢第130页

论文共130页,点击 下载论文
上一篇:基于图模型多文档自动文摘研究
下一篇:纳米尺度MOS器件的量子模拟方法研究