entmüllt

Lernfähiger Spam-Filter von Strato kommt mit Hirnschmalz

Interne Beta-Version sieht zukünftige Schwachstellen voraus
Von Lars Hessling

E-Mail-Spam nervt gewaltig: Seit einiger Zeit bestehen etwa 98 Prozent des gesamten Mail-Verkehrs aus unerwünschten Werbebotschaften. Doch vom Großteil des elektronischen Datenmülls bekommen die Nutzer gar nichts mit. Immer ausgeklügeltere Spam-Filter blockieren eindeutig als Spam identifizierbare Massen-E-Mails lange vor den E-Mail-Konten. Im Postfach landen nur noch erwünschte Mitteilungen oder solche, bei denen sich die Spam-Filter nicht hundertprozentig sicher sind. Noch schlimmer als Spam wäre schließlich, wenn wichtige Nachrichten gar nicht ankämen. Doch auch die Versender der unerwünschten Nachrichten schlafen nicht: Sie verbessern ständig ihre Bot-Netze, um die Spam-Filter zu umgehen. Darauf müssen wiederum die Entwickler der Barrieren reagieren.

Strato setzt in Zukunft auf intelligenten Spam-Filter

Der kürzlich von der Telekom übernommene Webhoster Strato verfolgt die Strategie, das wachsende Spam-Aufkommen nicht mit immer größerer Rechenleistung aufzuhalten. Dies wäre dem Unternehmen zufolge ein sinnloses Unterfangen, da größere Kapazitäten sofort von den Spammern ausgelastet würden. Stattdessen setzt das Unternehmen auf einen modularen Spam-Filter, der sich in Zukunft durch automatisiertes, theoretisches Lernen selbständig verbessern soll. Ziel ist, dass der Filter weniger manuell nachtrainiert werden muss und sich die Mitarbeiter mehr anderen sicherheitsrelevanten Aufgaben widmen können.

Lernfähige Software könnte noch dieses Jahr zum Einsatz kommen

Eine Dose des namensgebenden Produkts Spam. Ursprung des Begriffs Spam ist eine Sorte Dosenfleisch. Inzwischen sind die unerwünschten Nachrichten für 98 Prozent des E-Mail-Verkehrs verantwortlich.
Foto: teltarif.de
Strato entwickelt den modularen Spam-Filter seit 2005 in Zusammenarbeit mit der Humbold-Universität Berlin und dem Max-Planck-Institut für Informatik ständig weiter. Die ersten Prototypen waren noch zu rechenaufwändig, die jetzige Beta-Version soll aber voraussichtlich noch in diesem Jahr soweit sein, dass sie zum praktischen Einsatz kommen kann. Das Neue an der Software ist, dass sie die Gegenmaßnahmen der Spammer in Zukunft durch Analyse der eigenen Abwehr-Maßnahmen vorausahnen soll. Der Filter basiert auf verschiedenen Modulen, die sich unterschiedlich gewichten lassen. Branchenüblich sind Module, die Betreff und Text jeder E-Mail auf bestimmte Signalwörter oder Formulierungen prüfen. Verbreitet sind auch Komponenten, die massenhaft zum selben Zeitpunkt verschickte Nachrichten erkennen.

Gewichtete Filter-Module sind vielfältiger Natur

Beim Strato-Filter speichert darüber hinaus ein weiteres Modul in einem anonymisierten sozialen Graphen, wer mit wem absichtlich kommuniziert. So könnten sich beispielsweise Ärzte über die medizinisch sinnvolle Verabreichung von Viagra unterhalten, ohne dass ihr E-Mail-Verkehr im Spam-Filter hängen bleibt. Ein anderes Modul legt Fingerabdrücke von Grafik-, Text-, Audio- oder Videodateien an, in denen Spammer Werbebotschaften tarnen oder verstecken könnten. Diese berücksichtigen über einfache Rendering-Verfahren beispielsweise bei Grafiken das Farbeverhältnis oder Farbunterschiede im Bild. Ein weiteres Modul prüft nicht nur E-Mails, sondern auch darin verlinkte Seiten auf Werbung. Ein IP-basiertes Filter-Modul bewertet des Weiteren Informationen über den Weg einer Spam-Mail. Dazu gehört unter anderem, wie oft Zustellversuche abgelehnt wurden. Die häufig anzutreffenden Bot-Netze erkennt der Filter über ein weiteres Modul ebenfalls.

Wie die Spammer die bisherige Filter umgehen und ob demnächst auch Telekom-Postfächer durch den neuen Filter geschützt sind, lesen Sie auf der nächsten Seite.

Weitere Artikel zum Thema Spam