いろいろ
Seize the day.
2007-10-15 [長年日記]
■ [comp] IEEE のメールサービスが日本語メールを高確率でスパム扱いする件
少し前から,IEEE メンバー専用のメールエイリアスサービスを使っている. 一応 IEEE には結構な年会費を払っているので,それなりに信頼性の高いサービスだという認識で使っていた.ところが最近,一部のメールが正しく届かないことに気がついてしまった.
自分宛にメールを送ったらいつまで経っても届かない.少なくとも 2 件発生した.他人からのメールが消えている可能性も十分に考えられる.けっこう重要な用途で使うことがあったので正直戦慄を覚えた.
もしかしてスパムフィルタに引っかかった? IEEE のメールサービスは 1 ヵ月半ほど前にスパム対策ポリシーを opt-in から opt-out に変更している.つまりこれまでは希望者のみフィルタが機能していたのが,デフォルトでフィルタリングするようになった.スパムと判定されたメールはサーバで消去される. というわけで,フィルタをくぐり抜けて無事に届いたメールのヘッダを見てみる.ちなみに内容はごく普通の日本語ビジネスメールで,Gmail から送ったもの.
X-Bayes-Prob: 0.9999 (Score 5) X-Spam-Score: 9.50 (*********) [Hold at 12.00] FB_4WORD_DOLLARe,FB_WORD_01DOLLAR1,GAPPY_SUBJECT,SARE_MSGID_LONG40,SARE_SUB_CASH_CHAR,SPF(pass,0),Bayes(0.9999,5.0)ちょwwwwwwものすごい勢いでスパム扱いされてるんですけどwwwwwwww
ここによると,ヘッダのフォーマットは
X-Bayes-Prob: ベイズ投票によるスパム確率 (Score 投票によるスパムスコア ) X-Spam-Score: 投票とフィルタルールから計算した複合スコア (****) [Hold at 閾値 ] スコア増大に関与しているルールというようになっている.つまり上のメールは,99.99% の確率でスパムだと判定されたわけだ.スコアが閾値より低かったのでなんとか生き残ったというところか.
別の例.こちらは jp ドメインから Mew で送付してみた場合で,日本語ビジネスメール.
X-Bayes-Prob: 0.0001 (Score 0) X-Spam-Score: 9.80 (*********) [Hold at 12.00] FB_4WORD_DOLLARe,FM_MULTI_ODD2,FS_OBFU_Q0,HELO_EQ_JP,HOST_EQ_JP,SARE_RAND_2,X_IP,SPF(none,0)こちらはルールベースでスコアが上がったらしい.なんか HELO_EQ_JP とか HOST_EQ_JP がスパムの原因になっているっぽい.多分 HELO が jp ドメインを返したとかそういう意味だよねこれ.jp ドメインからだとスパム度が高いって素敵過ぎる.
あまりのことに,さらに調べてみたところ,どうやらフィルタの実体は SpamAssassin らしい. 上記の例に挙がっているルールを調べてみた.
FB_4WORD_DOLLARe: 文字列中にダラー.Micro$oft はおkなのかwwww
body FB_4WORD_DOLLARe /[^a-z]\b(?!Micro\$oft)[a-z]{2,7}\$[a-z]{1,5}\b/i
FB_WORD_01DOLLAR1: これも文字列中ダラーの一種.ISO-2022-JP だと多分テキメン.
body FB_WORD_01DOLLAR1 /\b[a-z]{1,4}\$[a-z]{0,4}[a-z01][a-z]{2,5}\b/i
GAPPY_SUBJECT: G.a.p.p.y-T.e.x.t みたいなやつ.
header GAPPY_SUBJECT Subject =~ /\b(?:[a-z]([-_.=~\/:,*!\@\#\$\%\^&+;\"\'<>\\])\1{0,2}){4,}/i
describe GAPPY_SUBJECT Subject: contains G.a.p.p.y-T.e.x.t
SARE_SUB_CASH_CHAR: Subject: にダラー.
header SARE_SUB_CASH_CHAR Subject =~ /[a-zA-Z]\$[a-zA-Z]/ describe SARE_SUB_CASH_CHAR Subject has letter then $ then letterFM_MULTI_ODD2: 英語ではありえないような文字のつながり?
# Core obfu rules, these are generated from multiple US dictionary files. body __FB_OBFU_J /j[bcfgw]/i body __FB_OBFU_OTHER /(?:vj|vk|xj|xk|yy|zf|zj)/i body __FB_OBFU_Q0 /[jkpqtvwz]q/i body __FB_OBFU_Q1 /q[afhjkmnsy]/i body __FB_OBFU_V /[fgqw]v/i body __FB_OBFU_X /[cgjkqsvz]x/i body __FB_OBFU_Z /[fjkpqx]z/i meta __FM_MULTI_ODD2 ((__FB_OBFU_J + __FB_OBFU_OTHER + __FB_OBFU_Q0 + __FB_OBFU_Q1 + __FB_OBFU_V + __FB_OBFU_X + __FB_OBFU_Z) &lgt; 1) meta FM_MULTI_ODD2 (__FM_MULTI_ODD2 && !__BADMIMEPARSES)FS_OBFU_Q0: Subject: に英語としてありえない文字列がある.
header FS_OBFU_Q0 Subject =~ /[jkpqtvwz]q/iHELO_EQ_JP: HELO で jp ドメイン.
header HELO_EQ_JP X-Spam-Relays-Untrusted =~ /^[^\]]+ helo=[^ ]+\.jp /iHOST_EQ_JP: 逆引きしたら jp ドメイン.
header HOST_EQ_JP X-Spam-Relays-Untrusted =~ /^[^\]]+ rdns=[^ ]+\.jp /iSARE_RAND_2: 謎.Mew から送ったせいか.
70_sare_random.cf tries to detect common mis-fires on bulk mail software.X_IP: X_IP ヘッダがある.うちの SMTP 鯖はいつもつけてますが.
header X_IP exists:X-IPとりあえず,英語圏のスパムフィルタには気をつけたほうがよいと実感.フィルタは速攻でオフにした.大事なメールが消失してないことを祈るしかない.
[ ツッコミ | permalink | trackback ]
[TrackBack URL: http://nao.s164.xrea.com/td/tb.rb/20071015]
[(注) スパム対策のため,言及リンクのないトラックバックは受け付けていません.]
[(注) スパム対策のため,言及リンクのないトラックバックは受け付けていません.]
本日のリンク元
検索
- X-Spam-Score ×20 / キーワード不明 ×6 / spamassassin X_IP ×6 / X-Spam-Score: ×3 / SARE_RAND_2 ×3 / ieee.org 設定 alias ×3 / "X-Spam-Score" ×3 / 日本語メール 届かない スパム ×2 / SpamAssassin X_IP ×2 / GAPPY_SUBJECT ×2 / spamassassin GAPPY_SUBJECT ×2 / X_IP spamassassin ×2 / ieee エイリアス gmail ×2 / SMTP X_IP ×2 / "GAPPY_SUBJECT" " ISO-2022-JP" ×2 / X-IP header ×2 / Spamassassin GAPPY_SUBJECT ×1 / ieee alias gmail ×1 / X-spam-score ×1 / spamassassin GAPPY_SUBJECT ×1 / spamassassin サービス ×1 / spamassassin HELO_EQ_JP HOST_EQ_JP ×1 / IEEE 会費 ×1 / spamassassin RDNS NONE ×1 / IEEE メールサーバ ×1 / SPAM GAPPY ×1 / GAPPY_SUBJECT 意味 ×1 / ieee.org spam filter ×1 / spam score ×1 / エイリアス メール ieee ×1 / IEEE Alias ×1 / メールサーバ メールbody消失 原因 ×1 / spam scoring mew ×1 / spamd score 0 ×1 / メールヘッダー x-ip ×1 / SARE_RAND_2 spamassassin ×1 / ieee.org フィルタ ×1 / X-Spam-Relays ×1 / IEEE エイリアス ×1 / X-IP spamassassin ×1 / spamassassin X-IP ×1 / spamassassin ×1 / ieee.org メールエイリアス ×1 / X_IP spamassasin ×1 / X-Spam-Score spamassassin ×1 / IEEE 会費 高い ×1 / SARE_RAND_2 Spam ×1 / OBFU 意味 ×1 / メール ieee.org ×1 / yahoo メール SPAM扱い ×1 / IEEE 変更メール ×1 / spamassassin ieee メール ×1 / 英語圏 spamassassin ×1 / x-ip mail ×1 / ドメイン ieee.org ×1 / X-Spam-Score: 2.214 ×1 / GAPPY_SUBJECT Subject: contains G.a.p.p.y-T.e.x.t ×1 / IEEE Personal Email Alias ×1 / spamフィルタ ieee ×1 / x-ip ヘッダ spamassasin ×1 / x-spam-score rfc ×1 / rdns メールサーバ ×1 / 設定方法 X-Spam-Score ×1 / Gappy スパム ×1 / ieee.org メール ×1
以下の広告はサーバによって自動的に挿入されています.
Copyright © 2004-2006, nao. All rights reserved.





