首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于分类的智能信息检索研究与实现

1. 基于分类的智能信息检索研究与实现第1-38页
 第一章 引言第7-9页
   ·研究背景第7页
   ·本文的研究思路及主要的工作第7-8页
   ·论文组织第8-9页
 第二章 网页预处理及中文分词的研究第9-14页
   ·网页预处理第9-10页
   ·中文分词第10-14页
     ·中文分词概述第10页
     ·汉字编码问题第10页
     ·分词词典的建设第10-11页
     ·词表的查找第11-12页
     ·分词过程描述第12页
     ·未登录词的识别第12-13页
     ·空间利用率和查找时间复杂度分析第13-14页
 第三章 特征提取第14-18页
   ·特征选取的目的第14页
   ·常见特征提取方法介绍及评价第14-16页
     ·文档频次第14-15页
     ·互信息第15页
     ·信息增益第15页
     ·CHI统计方法(开方拟和检验)第15-16页
   ·本文所采用的特征提取方法第16-17页
   ·特征提取算法描述第17-18页
 第四章 中文网页分类的研究第18-23页
   ·类的定义第18页
   ·网页分类概述第18-19页
   ·基于KNN文档分类介绍第19-20页
   ·文档的机器表示第20-21页
     ·传统的特征加权方法第20页
     ·本文中采用的特征加权方法第20-21页
   ·分类算法描述第21-23页
 第五章 索引和搜索第23-25页
   ·倒排文件第23页
   ·倒排文件的搜索第23-24页
   ·本文的搜索方法第24-25页
 第六章 系统总体设计及实验第25-30页
   ·系统总体结构图第25-26页
   ·各功能模块介绍第26-27页
   ·中文网页数据集第27-28页
   ·中文网页分类实验结果及评价第28-29页
   ·讨论第29-30页
 第七章 将来的工作展望第30-31页
 致谢第31-32页
 参考文献第32-38页
2. Research and Implementation onf Intelligent Information Retrieval Based on Classification第38-75页
 Abstract第38-40页
 Chapter one Preface第40-43页
   ·Background of Study第40-41页
   ·The thinking of research of this paper and main work第41-42页
   ·Framework of paper第42-43页
 Chapter Two the Predisposing of Web Page and Chinese Word Segmentation第43-49页
   ·The pre-disposed of Web Page第43-44页
   ·Chinese word segmentation第44-49页
     ·Summarize of Chinese word segmentation第44页
     ·Code question of Chinese word第44-45页
     ·Construction of segmentation lexicon第45-46页
     ·Finding of dictionary第46页
     ·Describes of segmentation course第46-47页
     ·Discernment of not recorded word第47-48页
     ·Space utilization ratio and the complexity analyze of looking up第48-49页
 Chapter three The Selection of Feature第49-54页
   ·the purpose of selection of feature第49-50页
   ·the recommending and appraising of common method of feature selection and appraise第50-51页
     ·Document Frequency第50页
     ·Mutual Information第50-51页
     ·Information gain第51页
     ·the statistic of x~2第51页
     ·Method of Feature Extraction in this paper.第51-52页
   ·Description of feature selection algorithm第52-54页
 Chapter Four the study of Chinese Web Page Classification第54-60页
   ·Definition of class第54页
   ·summary of document classification第54-55页
   ·the introduction of document classification based on KNN第55-56页
   ·The machine expression of the web page第56-58页
     ·the tradition feature weight method第56-57页
     ·Feature weighting method adopted in this system第57-58页
   ·Description of classification algorithm第58-60页
 Chapter Five the Index and Retrieval第60-62页
   ·Inversed file第60-61页
   ·search of inversed file第61页
   ·The search methods of systems第61-62页
 Chapter six the Whole Design and Experiment第62-67页
   ·the whole strut graph of system第62-63页
   ·the introduction of every function module第63-64页
     ·Material of Chinese web page train sets第64-65页
   ·the result and appraise of Chinese web page第65-66页
   ·Discussions第66-67页
 Chapter seven the Prospective of Work第67-68页
 REFERENCE第68-75页
3. 文本搜索引擎关键技术综述第75-115页
 第一章 文本搜索引擎概述第75-78页
   ·前言第75页
   ·搜索引擎发展简史第75页
   ·常见的搜索引擎第75-78页
     ·目录搜索引擎第75-76页
     ·全文搜索引擎第76页
     ·元搜索引擎第76-77页
     ·小结第77-78页
 第二章 网络蜘蛛第78-83页
   ·前言第78页
   ·常见搜索策略第78-80页
     ·IP地址搜索策略第78页
     ·深度优先搜索策略第78页
     ·宽度优先搜索策略第78-79页
     ·基于内容评价的搜索策战略第79页
     ·基于未来回报价值评价的搜索策略第79-80页
     ·基于巩固学习的搜索策略第80页
   ·爬虫的设计中应该注意的问题第80-81页
   ·网站与网络爬虫第81-82页
   ·小结第82-83页
 第三章 中文分词第83-89页
   ·前言第83页
   ·中文分词研究现状第83-86页
     ·基于字符串匹配的方法第83-84页
     ·基于理解的分词方法第84页
     ·基于统计的分词方法第84-85页
     ·其他的方法第85-86页
   ·分词方法评价准则第86-87页
   ·分词中存在的困难第87-89页
 第四章 特征选取第89-91页
   ·前言第89页
   ·常见特征选取的方法第89-91页
     ·文档频次第89页
     ·信息增益第89-90页
     ·CHI统计第90页
     ·互信息第90-91页
 第五章 分类和聚类第91-97页
   ·前言第91页
   ·类的定义第91-92页
   ·分类算法第92-94页
     ·简单向量距离分类法第92页
     ·贝叶斯算法第92-93页
     ·KNN算法第93-94页
     ·基于投票的方法第94页
   ·聚类第94-97页
     ·聚类概述第94页
     ·常见聚类方法第94-97页
 第六章 索引第97-100页
   ·前言第97页
   ·索引中的关键技术第97-100页
     ·文本的词法分析第97-98页
     ·索引词条的选择第98页
     ·词典第98-99页
     ·倒排文件第99-100页
 第七章 检索技术第100-103页
   ·布尔逻辑模型第100页
   ·模糊逻辑模型第100页
   ·向量空间模型第100-101页
   ·概率检索模型第101-103页
 第八章 搜索结果的排序第103-106页
   ·前言第103页
   ·词频位置加权排序算法第103-104页
   ·PageRank的排序方法第104页
   ·HillTop的排序方法第104-106页
 第九章 结束语第106-108页
   ·内容总结第106页
   ·搜索引擎的技术展望第106-108页
 参考文献第108-115页
4. A Survey of Key Technologies For Text Search Engine第115-164页
 Chapter one A survey of text search engines第118-123页
  §1.1 Preface第118页
  §1.2 History of search engines第118-119页
  §1.3 Normal search engines第119-123页
   §1.3.1 Catalog search engines第119-120页
   §1.3.2 Full text search engines第120页
   §1.3.3 Meta-search engines第120-121页
   §1.3.4 Evaluate of kinds of search engines第121-123页
 Chapter two WebCrawler第123-128页
  §2.1 Preface第123页
  §2.2 Search tactics of WebCrawler第123-124页
   §2.2.1 Search tactics based on IP address第123页
   §2.2.2 Depth first第123-124页
   §2.2.3 Width first search tactics第124页
  §2.3 Question that should be paid attention to in the design of the WebCrawler第124-126页
  §2.4 Website and WebCrawler第126-127页
  §2.5 Brief summary第127-128页
 Chapter three Chinese Word Segmentation第128-136页
  §3.1 Preface第128-129页
  §3.2 The current state of Chinese segmentation method第129-133页
   §3.2.1 Segmentation method string match based第129-130页
   §3.2.2 Segmentation method based on understand第130页
   §3.2.3 Segmentation method based on statistics第130-131页
   §3.2.4 Other segmentation method第131-133页
  §3.3 Evaluation of segmentation method第133-134页
  §3.4 Difficult in segmentation method第134-136页
 Chapter four Feature Selection第136-139页
  §4.1 Preface第136页
  §4.2 Usual methods of characteristic extraction第136-139页
   §4.2.1 Frequency of document第136-137页
   §4.2.2 Information Gain第137页
   §4.2.3 Statistic of x2第137-138页
   §4.2.4 Mutual information第138-139页
 Chapter five Classification and Clustering第139-146页
  §5.1 Preface第139页
  §5.2 Definition of class第139-140页
  §5.3 Methods of classification第140-143页
   §5.3.1 Simple vector distance classification第140-141页
   §5.3.2 Bayesian classification第141页
   §5.3.3 KNN algorithm第141-142页
   §5.3.4 According to the polling method第142-143页
  §5.4 clustering第143-146页
   §5.4.1 Summary of clustering第143页
   §5.4.2 Procedure of clustering第143-146页
 Chapter six Index and Search第146-150页
  §6.1 Significance of index第146页
  §6.2 Kernel technology in index第146-150页
   §6.2.1 Analysis of text syntax第146-147页
   §6.2.2 Choice of index term第147-148页
   §6.2.3 Lexicon第148页
   §6.2.4 Inversed file第148-150页
 Chapter seven Search Technology第150-153页
  §7.1 Boolean logic model第150页
  §7.2 Fuzzy logic model第150页
  §7.3 Vector space model第150-152页
  §7.4 Probability search model第152-153页
 Chapter eight the Sort of Search Result第153-155页
  §8.1 Preface第153页
  §8.2 Sort method by word frequency weight第153-154页
  §8.3 Page Rank sort method第154-155页
  §8.4 Hilltop sort method第155页
 Chapter nine Conclusion第155-158页
   ·Summaries第155-156页
   ·Prospects of search engine technology第156-158页
 Reference literature第158-164页

论文共164页,点击 下载论文
上一篇:血管内皮生长因子、转化生长因子、单核细胞趋化蛋白-1在子宫腺肌病中的表达及意义
下一篇:蓄热室热工特性及优化设计研究