Index-Spam ist neben den unerwünschten Werbemails im Postfach zu einer echten Plage geworden. Glücklicherweise gibt es gegen Index-Spam ein Mittel, das trotz seiner Einfachheit sehr wirksam ist. Die Technik macht sich die Tatsache zunutze, dass Index-Spam von «Bots» verteilt wird. Dies sind Programme die das Internet nach Formularen aller Art absuchen, die einzelnen Formularfelder mit Links auf zu bewerbende Angebote ausfüllen und zuletzt das Formular absenden. Wird ein Formular mit einem nur durch Menschen Menschen lesbaren Textbild (Captcha) ergänzt, dessen Inhalt in ein Formularfeld eingegeben werden muss, läuft der Spam-Bot ins Leere. Der Inhalt des Textbildes kann von einem Computerprogramm nur sehr schwer oder gar nicht erkannt werden kann.
Es geht sogar noch etwas einfacher: Um festzustellen, ob das Formular von einem Computer oder von einem Menschen ausgefüllt wird, wird eine einfache mathematische Aufgabe gestellt, deren Ergebnis zusammen mit den anderen Formularfeldern ausgefüllt werden muss. Zum Beispiel: Was ergibt 7 + 2. Sicher, hier ist die Chance vorhanden, dass ein Bot die Falle erkennt und richtig reagiert. Ich wollte das genau wissen und baute im Gästebuch eines Verbandes eine entsprechende Abfrage ein. Um zu verhindern, dass eine Erkennungslogik greift, streute ich unsichtbare Zeichen in den Text der Frage ein und gab den Formularfeldern interne Namen, die keinerlei Sinn ergeben. Dann liess ich mit von jedem abgewiesenen Spam per Mail eine Kopie senden.
Einen Monat lang beobachtet ich die Ergebnisse. Während dieser Zeit wurden jeden Tag zwischen 100 und 150 Spam’s gesendet. Am Inhalt war leicht zu erkennen, dass es sich um völlig verschiedene Bots handelte. Einige davon streuten einfach in jedes Feld Links, andere füllten die TEXTAREA’s mit kurzen Texten wie ‚Nice site‘ aus, andere füllten diese Felder mit mehr als 300 Links aus! Und wieder andere sendeten Links in einem Format, das nur für Foren wie phpBB gültig ist und deshalb nicht hier funktioniert – wen kümmert’s!
Die Meldungen stammen meist von dynamischen IP’s, Dialup und ADSL-Zugängen, die Bots laufen somit auf Windows PC’s deren Besitzer von diesen Aktivitäten nichts wissen. Und wie steht es mit der «Intelligenz» dieser Störenfriede? Von den mehr als 3600 Meldungen bestand keine einzige den einfachen Test. Das Feld, in dem das Rechenergebnis erwartet wird, steht meistens nichts, der Name eines Medikamentes oder eines der folgenden Worte: Default, Unknown oder None.