如今互联网业务蓬勃发展,邮件已经成为我们日常生活中不可缺少的通信方式,同时也成了媒体宣传的重要手段。许多不法分子因为有利可图利用邮件这个通信工具大做文章,大量发送垃圾邮件。垃圾邮件的危害众所周知,垃圾邮件耗费我们大量人力物力的同时给我们的正常生活带来了很大的麻烦。试想一下你的收件箱中每天100封邮件中只有10封是正常邮件,剩下90封都是垃圾邮件的悲惨情景。
熟悉反垃圾邮件技术的人都知道,垃圾邮件的种类是多样化的,发送垃圾邮件的手段是千变万化的。同时由于发送垃圾邮件有巨大的利益驱动,所以发送垃圾邮件者为了达到目的不择手段,发垃圾邮件的技术也是“日新月异”。“道高一尺,魔高一丈”,在发送垃圾邮件技术和反垃圾邮件技术的博弈中,谁能抓住对方的要害,谁就能占得先机。目前没有任何的一种技术敢说能把垃圾邮件一扫而光,好的反垃圾邮件效果都是多种技术应用的结果。
263反垃圾邮件技术小组本着为用户着想的宗旨,在传统反垃圾邮件技术的基础上不断的推陈出新研究新技术,从而达到越来越好的反垃圾效果。263反垃圾邮件系统使用的一些先进的反垃圾邮件技术如下:
·周全的频率统计模型
对IP的发信频率、RCPT频率、RCPT错误频率、AUTH认证频率和对发件人的发信频率、RCPT频率、RCPT错误频率、AUTH认证频率等进行缜密的监控,做到未雨绸缪,把垃圾邮件的危害降到最低。
·先进的黑、白名单机制
系统根据发送垃圾邮件的行为特征对发送垃圾邮件的持续行为、周期行为、间歇行为等多种行为进行深度数据挖掘,自动进行黑名单的分类、收集和释放。为了百分百的保证正常用户的发信不受影响,系统建立了健全的白名单体系。
·高效的正则内容识别技术
系统采用FFST(Fast Finite State Machine)快速有限状态机算法,进行正则内容和邮件主题、邮件内容的匹配,避免内容的重复匹配,从而大大的提高了匹配效率。
·贝叶斯垃圾邮件过滤
贝叶斯算法通过计算邮件属于每个类别(垃圾、正常)的概率来实现对邮件的自动分类。系统通过探针、蜜罐、手工、举报等方式自动提取垃圾邮件的样本来进行学习,完全实现了自动学习、自动识别。从而提高了垃圾邮件的识别率、降低了误判率。
·特征码图像识别技术
目前比较流行的图片垃圾邮件,一般图片都是经过特殊的处理,如背景干扰信息、噪点干扰信息、背景+噪点干扰信息、背景和字体经过复杂的颜色处理等,这就给本来就很困难的图片语义识别增加更大的难度。263反垃圾邮件系统应用一种基于非语义识别的图像识别技术来识别垃圾图片。263反垃圾邮件系统的图像识别技术是通过去除图像的背景色、图像的噪点等主要干扰信息后,从图像中提取特征(包括合成图像的行为特征)来识别垃圾图片。
·特征码链接类型垃圾邮件识别技术
在众多垃圾邮件种类中,链接类型垃圾邮件在DNS技术的支持下能非常简单的做到“变幻莫测”。这种链接类型的垃圾邮件通过文本的语义分析是没有任何意义的,传统技术根本无法识别,也正因为如此链接类型垃圾邮件占垃圾邮件的比例在不断攀升,保守估计2007年第4季度这个比例达到50%以上。263反垃圾邮件系统通过识别链接的实质内容,做到识别一个样本后识别所有相似样本,进而有效的拦截这种垃圾邮件。
·防患于未然,保证良好的互联互通性
263反垃圾邮件系统对接收的垃圾邮件进行识别和过滤的同时,对263内部用户往外发送的垃圾邮件进行识别,及时的控制,一方面避免了对外界的影响,两一方面减少了被外界拒收的几率,从而达到非常良好的互通性。
263反垃圾邮件系统通过多种技术的综合应用垃圾邮件的识别率超过99%而误判率低于万分之一。然而263反垃圾邮件技术小组并不满足现有的反垃圾效果,仍然时刻在研究垃圾邮件的最新发展动态,从而推出新的反垃圾邮件技术,为反垃圾邮件事业做出贡献。
(责任编辑:李磊)