Changes

Email Server - Extended Spam filtering

1,431 bytes added, 11:46, 9 October 2016
Spamassassin tanítása
A spam-eket minden felhasználó a spam mappába kell hogy rakja a saját fiókjában. Egy scriptel végig fogunk menni a spam mappákba rakott leveleken, és egyrészt tanítani fogjuk vele a spamassassin-t, másrészt jelenteni fogjuk a razor és a pyzor spam adatbázisok felé.
==Spamassassin kézi tanítása==
A spamassassin-t a '''sa-learn''' prorammal lehet tanítani. Meg kell tanítani, hogy mi a spam és mi a ham, nem elég csak a spam-et megmutatni neki. Fontos hogy tudja, hogy mit nem gondolunk spam-nek. A '''sa-learn''' létrehoz egy úgynevezett '''BayesDB'''-t, amit a spamassassin használ fel a spam valószínűség eldöntésére. Ez az adatbázis a felhasználó home mappájában a ~/.spamassassin mappában kell hogy legyen. A spamassassin futás közben a futtató user '''~/.spamassassin''' mappájában fogja keresni az adatbázist. Mivel a spamassassin nálunk az amavis user nevében fut, fontos, hogy a /'''var/spool/amavisd/.spamassassin''' mappában jöjjön létre az adatbázis.
* use_bayes ( 0 | 1 ) (default: 1)
* bayes_auto_learn ( 0 | 1 ) (default: 1): Bekapcsol egy automata tanító mechanizmust. Ilyenkor nem csak az általunk beadott email-ek alapján tanul, hanem maga is hozzáad spam és ham-eket az adatbázishoz a pontszámuk alapján.
* bayes_min_ham_num: Minimum ennyi ham-et kell neki mutatni, mielőtt elkezdi a BayesDB használatát.
* bayes_min_spam_num: Minimum ennyi spam-ek az adatbázisába, hogy megkezdje a szűrést.
bayes_min_ham_num 200
bayes_min_spam_num 200
 
bayes_auto_learn 1
use_bayes 1
...
</pre>
==Spamassassin automatikus tanítása==
https://spamassassin.apache.org/full/3.1.x/doc/Mail_SpamAssassin_Plugin_AutoLearnThreshold.html<br>
Be lehet állítani, hogy egy bizonyos pontszám alatt vagy felett a spamassassin magától is betegye a bayes adatbázisba a leveleket.
 
===Beállítások===
Használatához a '''AutoLearnThreshold''' spamassassin plugin-re van szükség:<br>
/etc/mail/spamassassin/v310.pre
<pre>
..
loadplugin Mail::SpamAssassin::Plugin::AutoLearnThreshold
..
</pre>
 
A local.cf-be az alábbi paraméterekkel szabályozhatjuk az autómatikus tanulást:
* bayes_auto_learn_threshold_nonspam n.nn (default: 0.1) --> The score threshold below which a mail has to score, to be fed into SpamAssassin's learning systems automatically as a non-spam message.
* bayes_auto_learn_threshold_spam n.nn (default: 12.0) --> The score threshold above which a mail has to score, to be fed into SpamAssassin's learning systems automatically as a spam message.
* bayes_auto_learn ( 0 | 1 ) (default: 1) --> Whether SpamAssassin should automatically feed high-scoring mails (or low-scoring mails, for non-spam) into its learning systems
 
 
===Tesztelés===
 
Küldjünk magunknak egy olyan emailcímről levelet, ami biztos hogy nagyon alacsony pontszámot fog kapni, pl gmail. Ekkor a fejlécben meg kell jelenjen, hogy a spamassassin HAM-ként felvette a levelet az adatbázisba: '''autolearn=ham'''
A kapott email<nowiki>X-ek spam fejlécében is látszikSpam-Status: No, score=-3.649 tagged_above=-999 required=6.2 tests=[BAYES_00=-1.9, ha a spamassassin automatikusan megtanultaDKIM_SIGNED=0.1, DKIM_VALID=-0.1, DKIM_VALID_AU=-0.3, DKIM_VERIFIED=-0.1, FREEMAIL_ENVFROM_END_DIGIT=0.25, FREEMAIL_FROM=0.001, HTML_MESSAGE=0.001, RCVD_IN_DNSWL_NONE=-0.0001, RCVD_IN_MSPIKE_WL=-2.1, RCVD_IN_SORBS_SPAM=0.5, SPF_PASS=-0.001] autolearn=ham</nowiki>
== Razor és pyzor tanítás==