Oct 10, 2005

SpamAssassin をインストールしてみた

例のごとく SPAM メール対策だが、実際にはプライベートなメールは GMail 経由なのでほとんど SPAMメールが届くことはない。逆に仕事で使ってるメールアドレスの方には、1日200通くらいくる。ということで、そっちの方の SPAM をどうにかしようということで、SpamAssassin を導入してみた。

SpamAssassin は本文の内容をチェックして、SPAM とおぼしき文章などを元にスコアを加算していき、あるしきい値以上になったら SPAM と判定するもので、学習させることも可能。なによりサーバー上で動かせるので、例えばあるスコア以上はもう SPAM 確定ってことで破棄して、それ未満のものはSPAM かもしれないよ、ってことでとりあえず配送してみる、なんてこともできる。スコアのつけ方も設定次第だし、学習によって誤認識も少なくできる。そうやって徐々にサーバー側で破棄するメールを増やしていけば、その分クライアント側で受け取るメールを減らせる。

元々メールを読むローカルマシン上で POPFile を使用していて、そこで振り分けをしてるので、サーバー側でやる必要もないんだが、あまりにも不要なメールが多いのと、ブログネタにもいいかな、ということでセットアップした。

仕事で使ってるマシンも OpenBSD で、SpamAssassin の最新版は 3.1.0 で ports のは 3.0.2。今回は ports からインストールした。実行ファイルは /usr/local/bin に spamassassin と spamc, spamd と3つコピーされる。spamc と spamd はそれぞれクライアントとデーモンでセットで使う。spamassassin は単体で使う。とりあえずメールごとに spamassassin を起動するのも何なので、spamd を起動しておいて(/etc/rc.local 変更)、spamc をキックすることにする。

SpamAssassin の設定ファイルは /etc/mail/spamassasin/local.cf にインストールされる。このファイルに SPAM 判定のためのルール(スコアのつけ方)など記入するらしいが、とりあえず細かいことはほったらかし。ただデフォルトで4行コメントアウトされてるうちの下記2行のみ有効にしてみた(なんか反映されてないような気がしないでもない...)。

rewrite_header Subject *****SPAM*****
report_safe 1

さらに仕事で使ってるサーバーでは vpopmail によってメールボックスを管理してるので、/home/vpopmail/domains/DOMAIN(ドメイン名) に .qmail-ACCOUNT(自分アカウント)というファイルを用意して下記のように設定。

|/usr/local/bin/spamc | /home/vpopmail/bin/vdelivermail ' ' ACCOUNT

これで一旦 spamc で判定してから再度自身のメールボックスに配送する。

しばらくすると何通か SPAM 判定されてくる。その場合下記のようなメールと共に送られてくる。

Content analysis details:   (9.4 points, 5.0 required)

 pts rule name              description
---- ---------------------- --------------------------------------------------
 0.0 RCVD_BY_IP             Received by mail server with no name
 1.5 RCVD_NUMERIC_HELO      Received: contains an IP address used for HELO
 1.1 SUBJ_HAS_UNIQ_ID       Subject contains a unique ID
 0.6 RCVD_HELO_IP_MISMATCH  Received: HELO and IP do not match, but should
 1.2 SORTED_RECIPS          Recipient list is sorted by address
 0.0 HTML_60_70             BODY: Message is 60% to 70% HTML
 0.0 HTML_MESSAGE           BODY: HTML included in message
 2.0 HTML_IMAGE_ONLY_08     BODY: HTML: images with 400-800 bytes of words
 1.2 MIME_HTML_ONLY         BODY: Message only has text/html MIME parts
 1.8 RCVD_IN_BL_SPAMCOP_NET RBL: Received via a relay in bl.spamcop.net

どういう基準で SPAM と判断したのか、スコアのつけ方など詳細が分かるので、このあたりを参考に設定ファイルを変更したりするといい。

ちなみに、まだ現時点ではすべてのメールを配送するような設定なので、最初に書いた通りあるスコア以上ならサーバー側で捨てる、なんて設定も今後試してみようと思う。

学習方法だが、メール本体が必要なので、その場合は IMAP でサーバーにアクセスして、SPAM or HAM 用フォルダを作成して、一旦受信したメールをそこに書き戻して、サーバー側では適当に cron でそれらのディレクトリをスキャンして学習、ってな方法が一番簡単かなと思っているが、まだこれはやってない。うまくいったらまたそのあたりの詳細もネタにする予定。


Related Info.

Comments

No comments yet

Add Comments

※下記の単語・フレーズはコメントで使用できません。大文字・小文字は同一視します。
poker, backgammon, tramadol, casino, insurance, loans
JavaScript is required when you submit comment %20%20%3c%61%20%69%64%3d%22%6e%75%63%6c%65%75%73%5f%63%66%22%3e%3c%2f%61%3e %3c%66%6f%72%6d%20%6d%65%74%68%6f%64%3d%22%70%6f%73%74%22%20%61%63%74%69%6f%6e%3d%22%23%6e%75%63%6c%65%75%73%5f%63%66%22%3e %09%3c%64%69%76%20%63%6c%61%73%73%3d%22%63%6f%6d%6d%65%6e%74%66%6f%72%6d%22%3e %3c%69%6e%70%75%74%20%74%79%70%65%3d%22%68%69%64%64%65%6e%22%20%6e%61%6d%65%3d%22%61%63%74%69%6f%6e%22%20%76%61%6c%75%65%3d%22%61%64%64%63%6f%6d%6d%65%6e%74%22%20%2f%3e %3c%69%6e%70%75%74%20%74%79%70%65%3d%22%68%69%64%64%65%6e%22%20%6e%61%6d%65%3d%22%75%72%6c%22%20%76%61%6c%75%65%3d%22%68%74%74%70%3a%2f%2f%6b%69%6d%69%74%61%6b%65%62%6c%6f%67%2e%6e%65%74%2f%69%74%65%6d%2f%32%34%36%22%20%2f%3e %3c%69%6e%70%75%74%20%74%79%70%65%3d%22%68%69%64%64%65%6e%22%20%6e%61%6d%65%3d%22%69%74%65%6d%69%64%22%20%76%61%6c%75%65%3d%22%32%34%36%22%20%2f%3e %09%09 %09%09%3c%6c%61%62%65%6c%20%66%6f%72%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%62%6f%64%79%22%3eコメント%3a%3c%2f%6c%61%62%65%6c%3e %09%09%3c%74%65%78%74%61%72%65%61%20%6e%61%6d%65%3d%22%62%6f%64%79%22%20%63%6c%61%73%73%3d%22%66%6f%72%6d%66%69%65%6c%64%22%20%63%6f%6c%73%3d%22%34%30%22%20%72%6f%77%73%3d%22%31%30%22%20%69%64%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%62%6f%64%79%22%3e%3c%2f%74%65%78%74%61%72%65%61%3e %09%09%3c%6c%61%62%65%6c%20%66%6f%72%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%6e%61%6d%65%22%3eお名前%3a%3c%2f%6c%61%62%65%6c%3e %09%09%3c%69%6e%70%75%74%20%6e%61%6d%65%3d%22%75%73%65%72%22%20%73%69%7a%65%3d%22%34%30%22%20%6d%61%78%6c%65%6e%67%74%68%3d%22%34%30%22%20%76%61%6c%75%65%3d%22%22%20%63%6c%61%73%73%3d%22%66%6f%72%6d%66%69%65%6c%64%22%20%69%64%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%6e%61%6d%65%22%20%2f%3e %09%09%3c%6c%61%62%65%6c%20%66%6f%72%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%6d%61%69%6c%22%3eウェブサイト%3a%3c%2f%6c%61%62%65%6c%3e %09%09%3c%69%6e%70%75%74%20%6e%61%6d%65%3d%22%75%73%65%72%69%64%22%20%73%69%7a%65%3d%22%34%30%22%20%6d%61%78%6c%65%6e%67%74%68%3d%22%36%30%22%20%76%61%6c%75%65%3d%22%22%20%63%6c%61%73%73%3d%22%66%6f%72%6d%66%69%65%6c%64%22%20%69%64%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%6d%61%69%6c%22%20%2f%3e %09%09%3c%6c%61%62%65%6c%20%66%6f%72%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%65%6d%61%69%6c%22%3eメール%3a%3c%2f%6c%61%62%65%6c%3e %09%09%3c%69%6e%70%75%74%20%6e%61%6d%65%3d%22%65%6d%61%69%6c%22%20%73%69%7a%65%3d%22%34%30%22%20%6d%61%78%6c%65%6e%67%74%68%3d%22%31%30%30%22%20%76%61%6c%75%65%3d%22%22%20%63%6c%61%73%73%3d%22%66%6f%72%6d%66%69%65%6c%64%22%20%69%64%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%65%6d%61%69%6c%22%20%2f%3e %09%09 %09%09%3c%69%6e%70%75%74%20%74%79%70%65%3d%22%63%68%65%63%6b%62%6f%78%22%20%76%61%6c%75%65%3d%22%31%22%20%6e%61%6d%65%3d%22%72%65%6d%65%6d%62%65%72%22%20%69%64%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%72%65%6d%65%6d%62%65%72%22%20%20%2f%3e %09%09%3c%6c%61%62%65%6c%20%66%6f%72%3d%22%6e%75%63%6c%65%75%73%5f%63%66%5f%72%65%6d%65%6d%62%65%72%22%3e情報を記憶しておく%3c%2f%6c%61%62%65%6c%3e %09%09%3c%69%6e%70%75%74%20%74%79%70%65%3d%22%73%75%62%6d%69%74%22%20%61%6c%74%3d%22コメントを追加%22%20%76%61%6c%75%65%3d%22コメントを追加%22%20%63%6c%61%73%73%3d%22%66%6f%72%6d%62%75%74%74%6f%6e%22%20%2f%3e %09%3c%2f%64%69%76%3e %3c%69%6e%70%75%74%20%74%79%70%65%3d%22%68%69%64%64%65%6e%22%20%6e%61%6d%65%3d%22%6e%70%5f%70%72%6f%74%65%63%74%62%79%6d%64%35%22%20%76%61%6c%75%65%3d%22%38%63%33%39%61%62%63%32%35%61%38%31%61%33%33%36%38%31%63%66%65%66%33%64%30%37%30%64%37%30%38%66%22%3e %3c%69%6e%70%75%74%20%74%79%70%65%3d%22%68%69%64%64%65%6e%22%20%6e%61%6d%65%3d%22%6e%70%5f%70%72%6f%74%65%63%74%62%79%6d%64%35%5f%68%61%73%68%22%20%76%61%6c%75%65%3d%22%65%33%32%34%34%32%30%33%61%66%33%35%30%34%61%39%38%31%62%62%64%63%35%62%66%39%39%64%36%35%64%62%22%3e %3c%2f%66%6f%72%6d%3e %20%20

OpenID を使ってログインすることができます。

Identity URL:

Trackbacks

トラックバック
このエントリにトラックバックはありません
このトラックバックURLを使ってこの記事にトラックバックを送ることができます。 もしあなたのブログがトラックバック送信に対応していない場合にはこちらのフォームからトラックバックを送信することができます。.
visitor stats