Contenu

1.2   Identification du Spam
SpamSieve utilise différentes méthodes pour identifier le SPA, la plus efficace et de loin reste l'analyse statistique de Bayesian qui s'adapte aux nouvelles techniques de Spam. Consultez si vous le souhaitez l'article de Paul Graham en complément d'information.
Dans un premier temps
SpamSieve a besoin d'être exercé à reconnaître le bon courrier du spam. Quand vous recevez un nouveau message, il évalue la fréquence d'utilisation de chacun des mots le composant dans le cadre du spam et du courriel légitime. Plus il y aura de mots caractéristiques d'un spam plus il peut être sûr qu'il s'agit de SPAM. La présence de mots communs dans vos messages légitimes et leur relative absence des spams pourrait cependant constituer une faille dans le repérage mais cette approche flexible permet à SpamSieve de repérer la quasi totalité du spam sans être abusif et cataloguer comme Spam du courrier légitime, ce que tout utilisateur veut éviter.
Puisque vous exercez
SpamSieve sur votre courrier réel vous avez les pleins pouvoirs. Si SpamSieve fait une erreur de jugement sur un mel, vous pouvez éviter qu'il ne recommence. De plus les spammeurs n'ont aucune connaissance de l'allure de vos mels legitimes habituels ( ne serait-ce que la langue ou les abréviations) et ne peuvent deviner le filtrage que vous effectuez avec SpamSieve. Le filtrage est de plus en plus efficace dans le temps à mesure des mels qu'il engrange et de l'élargissement de son corpus lexical.
Contenu