E-Mail Klassifikation (inkl. Spam Klassifikation) mit POPFile auf Ubuntu Feisty Fawn

Version 1.0
Author: Falko Timme


Diese Anleitung veranschaulicht, wie man POPFile auf einem Ubuntu Feisty Fawn Desktop installieren und verwenden kann um eingehende E-Mails zu klassifizieren. Es ist ein POP3 Proxy, der Deine E-Mails von Deinem Mail Server abholt, klassifiziert und sie an Deinen E-Mail Client weiterleitet. Natürlich muss POPFile geschult werden, E-Mails richtig zu klassifizieren. Von der POPFile Webseite: "POPFile is an automatic mail classification tool. Once properly set up and trained, it will scan all email as it arrives and classify it based on your training. You can give it a simple job, like separating out junk e-mail, or a complicated one-like filing mail into a dozen folders. Think of it as a personal assistant for your inbox."
Diese Anleitung ist ohne jegliche Gewähr!

1 Vorbemerkung

Um POPFile mit Deinen E-Mail Client verwenden zu können, müssen im E-Mail Client einige Einstellungen geändert werden. Ich werde dies mit dem Evolution E-Mail Client demonstrieren, Du kannst natürlich auch jeden anderen E-Mail Client (z.B. Thunderbird) verwenden - die Modifizierungen sind sehr ähnlich.

2 Installation von POPFile

Öffne den Synaptic Package Manager (System > Administration > Synaptic Package Manager):


Gib Dein Passwort ein:


Klicke auf das Search Feld:


Suche nach popfile:


Die Suche müsste ein Paket namens popfile ergeben. Klicke darauf und wähle Mark for Installation aus dem Menü:


POPFile benötigt einige andere Pakete. Akzeptiere die anderen Pakete indem Du auf Mark klickst:


Klicke dann auf Apply:


Bestätige Deine Auswahl indem Du erneut auf Apply klickst:


Die Pakete werden nun runter geladen und installiert:



Klicke danach auf Close und verlasse den Synaptic Package Manager:


3 Konfiguration von POPFile

POPFile hat ein Web Interface, das auf Port 7070 ausgeführt wird, öffne also einen Browser und gehe zu http://127.0.0.1:7070. Zuerst siehst Du die History Seite, die fürs Erste nichts Interessantes bereit hält:


Gehe zur Buckets Seite. Scrolle bis zum Ende der Seite (zum Maintenance Bereich) und erstelle Deine E-Mail Kategorien ("buckets" in POPFile Sprache), z.B. personal, work und spam:





Danach solltest Du Deine neuen Kategorien am Anfang der Buckets Seite sehen. Es macht sich immer ganz gut für jede Kategorie eine bestimmte Farbe auszuwählen, damit Du später in der Statistik die Kategorien besser unterscheiden kannst:


Mehr müssen wir nicht konfigurieren. Natürlich kannst Du Dir auch die anderen Registerkarten ansehen, um Dich mit dem POPFile Interface vertraut zu machen. Auf der Magnets Seite kannst Du Regeln festlegen (z.B. From oder To E-Mail Adressen), die bewirken, dass passende E-Mails immer in eine bestimmte Kategorie gesteckt werden:


Auf der Configuration, Security und Advanced Registerkarte findest Du weitere POPFile Konfigurationsoptionen. Diese solltest Du nur dann ändern, wenn Du genau weißt was Du tust:




4 Konfiguration des E-Mail Clients

In diesem Beispiel verwende ich Evolution als E-Mail Client. Bei anderen Clients (z.B. Thunderbird) sollte die Konfiguration nicht großartig anders sein.

Nun müssen wir unserem E-Mail Client mitteilen, dass er E-Mails von unserem POPFile Proxy und nicht dirket vom Mail Server abholen soll. Daher müssen wir die Einstellungen des E-Mail Kontos, für das wir POPFile verwenden möchten, modifizieren. Gehe zu Edit > Preferences:


Wähle das entsprechende E-Mail Konto aus und klicke auf Edit:


Gehe zur Receiving Email Registerkarte. Nun müssen wir den Configuration Bereich ändern. Gehen wir davon aus, Du hast pop.example.com im Server Feld und someuser@example.com im Username Feld. POPFile wird auf 127.0.0.1 (localhost) auf Port 7071 ausgeführt, daher setzen wir 127.0.0.1:7071 in das Server Field und ändern das Username Feld zu servername:username, z.B. pop.example.com:someuser@example.com:


Klicke danach auf das Send/Receive Feld. Wenn alles klappt, sollte Evolution nun E-Mails von POPFile abholen (POPFile holt die E-Mails vom originalen POP3 Server, pop.example.com in diesem Beispiel):


Wenn Du POPFile zum ersten Mal verwendest, ist POPFile noch nicht geschult und weiß noch nicht, wie E-Mails klassifiziert werden, daher wird die Zeichenfolge [unclassified] in die Betreffzeile der E-Mails gesetzt (das Markieren der E-Mails kannst Du auf der Buckets Seite im Web Interface von POPFile ändern - wenn POPFile also den ursprünglichen Betreff nicht ändern soll, kannst Du veranlassen, dass z.B. die Headers der E-Mails modifiziert werden):


Lass uns nun im Inbox Ordner Unterverzeichnisse für unsere E-Mail Kategorien anlegen (personal, work). Klicke mit der rechten Mouse-Taste auf den Inbox Ordner und wähle New Folder...:


Erstelle dann zwei neue Ordner mit den Bezeichnungen Personal und Work im Inbox Ordner:



Bei Evolution müssen wir keinen Spam Ordner anlegen, da Evolution standardmäßig einen Junk Ordner hat. Es kann sein, dass Du bei anderen E-Mail Clients einen Spam Ordner anlegen musst.

Lass uns nun Nachrichten-Filter erstellen, die E-Mails mit der Markierung [spam] in den Junk Ordner, E-Mails mit der Markierung [personal] in den Personal Ordner und E-Mails mit der Markierung [work] in den Work Ordner befördern. Gehe zu Edit > Message Filters:


Wähle Show filters for mail: Incoming und klicke auf Add:



Erstelle eine Regel mit der Bezeichnung Spam wie folgt:

Subject contains [spam] => Set Status Junk


Erstelle dann die Regel Personal wie folgt:

Subject contains [personal] => Move to Folder Inbox/Personal


Erstelle dann eine ähnliche Regel namens Work:


(Bitte beachte: Wenn Du POPFile so konfigurierst, dass es nicht die Betreffzeile sondern den Header einer E-Mail verändert, musst Du die Nachrichten-Filter anpassen.)

5 POPFile schulen

Um POPFile zu schulen, gehe zur History Seite im POPFile Web Interface (http://127.0.0.1:7070). Dort solltest Du alle Mails finden, die von POPFile verarbeitet wurden. Jede unklassifizierte Nachricht hat rechts ein Drop-Down Menü, in dem Du die jeweilige Kategorie für diese Mail auswähleln kannst. Wähle die entsprechende Kategorie für jede E-Mails aus und klicke auf das Reclassify Feld. Pass bitte auf, dass Du nicht nur Spam klassifizierst, sondern auch Nachrichten für Deine anderen Kategorien, so dass POPFile richtig geschult wird.


Danach sind Deine zuvor unklassifizierten E-Mails in eine Deiner Kategorien sortiert worden. Falls Du eine E-Mail in eine falsche Kategorie gesteckt hast, kannst Du auf das Undo Feld klicken:


Auf der Buckets Seite findest Du nun Statistiken über Deine E-Mails und Kategorien. Falls Du jeder Kategorie eine Farbe zugewiesen hast, sollte jede Kategorie in der jeweiligen Farbe angezeigt werden:


Das Schulen kann am Anfang etwas dauern, aber nach einiger Zeit macht es sich bezahlt, es lohnt sich.

6 Links