首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

Improving Statistical Bayesian Spam Filtering Algorithms

Table of Contents第5-8页
List of Tables第8-9页
List of Figures第9-10页
Abstract第10页
Acknowledgements第12-13页
1 Introduction第13-19页
    1.1 Spam and its Types第13-14页
    1.2 Anti-spamming Techniques第14-16页
    1.3 Previous Works on Bayesian Spam Filtering第16-17页
    1.4 Contributions第17-18页
    1.5 Thesis Organization第18-19页
2 Statistical Bayesian Spam Filtering Algorithms第19-28页
    2.1 Spam Filtering Steps第20-22页
    2.2 Naive Bayes (NB) Algorithm第22-23页
    2.3 Paul Graham's (PB) Algorithm第23-25页
    2.4 Gary Robinson's (GR) Algorithm第25-27页
    2.5 Dealing with Small Probabilities and Normalization第27-28页
3 Preprocessing and Feature Selection第28-31页
    3.1 Preprocessing第28-29页
    3.2 Feature extraction or Tokenization第29-31页
4 Filtering Based on Co-weighted Multi-estimations第31-35页
    4.1 Main Idea and Algorithm Description第31-33页
    4.2 Training Algorithm第33-34页
    4.3 Classification Algorithm第34-35页
5 Filtering Based on Co-weighted Multi-area Information第35-39页
    5.1 Main Idea and Algorithm Description第35-37页
    5.2 Training Algorithm第37页
    5.3 Classification Algorithm第37-39页
6 Dataset Collections and Evaluation Measures第39-44页
    6.1 Corpora Collections第39-41页
    6.2 Evaluation Measures第41-44页
7 Experiments and Analysis第44-60页
    7.1 Parameters Tuning第44-46页
    7.2 Experiments with Co-weighted Multi-estimations第46-52页
        7.2.1 Experiments and Results第46-51页
        7.2.2 Analysis第51-52页
    7.3 Experiments with Co-weighted Multi-area Information第52-60页
        7.3.1 Experiments and Results第52-57页
        7.3.2 Analysis第57-60页
8 Conclusions and Future Work第60-62页
    8.1 Conclusions第60-61页
    8.2 Future Work第61-62页
Appendix第62-157页
    A Implementation of Filter Application第62-69页
        A.1 Data Structures第62-65页
        A.2 Source Files第65-68页
        A.3 Data Files第68-69页
    B Application User's Manual第69-79页
        B.1 System Requirements第69页
        B.2 Installation of the Application第69-70页
        B.3 Running and Using the Application第70-79页
            B.3.1 Dataset Preparer第70-71页
            B.3.2 Trainer第71-72页
            B.3.3 Classifier第72-75页
            B.3.4 Tester第75-79页
    C Program Documentation第79-155页
        C.1 Package and Class Summaries第79-81页
            C.1.1 Class Summary第79-80页
            C.1.2 Enum Summary第80-81页
        C.2 Hierarchy For Package rsspambayes第81-82页
            C.2.1 Class Hierarchy第81页
            C.2.2 Enum Hierarchy第81-82页
        C.3 Class Details第82-150页
            C.3.1 Algorithm第82-83页
            C.3.2 Category第83-85页
            C.3.3 Classifier第85-90页
            C.3.4 Counts第90-94页
            C.3.5 DatasetPreparer第94-95页
            C.3.6 FreqTable第95-98页
            C.3.7 Frequencies第98-105页
            C.3.8 GRobinsonBayes第105-109页
            C.3.9 NaiveBayes第109-113页
            C.3.10 PGrahamBayes第113-117页
            C.3.11 RShresthaBayesl第117-121页
            C.3.12 RShresthaBayes2第121-128页
            C.3.13 Stats第128-131页
            C.3.14 Tester第131-135页
            C.3.15 Tokenizer第135-142页
            C.3.16 Trainer第142-144页
            C.3.17 Utils第144-150页
        C.4 Enum Details第150-155页
            C.4.1 Algorithms第150-151页
            C.4.2 Areas第151页
            C.4.3 EmailCats第151-152页
            C.4.4 Headers第152页
            C.4.5 HtmlTags第152-153页
            C.4.6 Method Detail for All Enum Types第153-155页
    D List of Papers Published第155-157页
Bibliography第157-161页

论文共161页,点击 下载论文
上一篇:Φ-混合样本下分位数回归模型回归系数的经验似然置信区域
下一篇:信托处置不良资产法律问题研究