MD垃圾邮件过滤器的工作过程
MD-垃圾邮件过滤器-启发式-贝叶斯的关系
很多人都知道MD有强大的垃圾邮件处理能力,知道有垃圾邮件过滤器,有贝叶斯,有启发是,但是却不知道3者之间倒地存在着怎样的关系。
下面是3幅图,注意红框圈出来的段落。
垃圾邮件过滤器:这里显示了3个处理方式
启发式:注意到这里显示的是2个不同的分值。
贝叶斯:我们只要关注是否启用了贝叶斯分类。
先说第二副图的中的两个分值,5分和12分,这表示一封邮件的分值,被判为5分以下的为正常邮件,5分以上的就是垃圾邮件,垃圾邮件在12分以上的就会被直接拒绝。那么5分到12分的邮件会怎么办么?我们回到第一幅图,上面不是写着3种处理方式么?对了,就是根据这3种方式你选择了什么就怎么处理。
现在我们知道了这些分数是怎么划分的,也知道了划分了之后这些邮件被怎么处理了,那么这些分数从何而来的呢?来源很多~~~MD有很多内置的过滤规则都可以给这些评分产生影响,其中一个就是贝叶斯算法。从MD的一条内置默认规则中,我们发现:
BAYES_95 表示贝叶斯分类给出了这封邮件95%-99%的可能性是一封垃圾邮件,然后就给予了一定的分值。这些分值加上其它的分数就形成了这封信的整体分数,用于进行启发式的判定,然后对邮件进行处理。
有时候我们会发现,有些邮件标题多了[***SPAM*** Score/Req: _SCORE(0)_/_REQD_]的一段东西。我们看第一副图中三个处理方式的第三个,标记邮件继续向下传递,怎么标记呢?就是添加这个标题,来警告收件人这可能是封垃圾邮件。有些人不喜欢这个标题,能不能改变么?当然可以,第二副图中,就有这个主题标签的设置,自己找找吧
第一幅图中还有一个处理方法,就是放到垃圾邮件公共文件夹,当选择这个选项时,公共文件夹中就会自动生成一个spam trap的文件夹。
如果要问还有没有其他的分数的来源,有很多~比如第一幅图中所说,白名单中的地址会被减去100分。黑名单中的就会增加100分。还有MD有很多内置规则会加分。
这些内置规则在MD安装目录下面的 spamassassin文件夹以及其子文件下。其中 50_scores.cf这个文件中列出了各种情况会扣除的分数。