Administration Hosting IT

Einblicke in das Spam-Tollhaus

Wie man am ersten Eintrag dieses Blogs erkennen kann, besteht diese Webpräsenz mittlerweile seit dem 16.06.2006, umfasst 45 Artikel (diesen eingeschlossen) und 20 Kommentare. Sieht soweit alles nach einem durchschnittlich populärem Weblog aus…

Als ich mir ein paar Wochen nach dem Launch die ersten 3-4 Spamkommentare eingefangen habe, sah ich mich gezwungen, bei der Eingabe von Kommentaren sogenannte Captchas abzufragen (das sind diese in Bildform ausgegebenen zufälligen Codes, die man vorm Abschicken des Kommentars noch einmal ablesen und eintippen muss), da ich keine große Lust hatte, die Kommentare verdeckt anzunehmen und den Spam manuell auszusortieren.

Captchas sind zwar auch nicht der Weisheit letzter Schuß, da sie unter Betrachtung der Barrierefreiheit (optimale Nutzung der Webseite durch cognitiv eingeschränkte Menschen) eigentlich ein Unding sind, aber das ist eine andere Geschichte.

Die diversen Trackback-Bots, die wahllos die Links zu dubiosen Webseiten / Angeboten auf anderer Leute Blogs verteilen konnte ich so entschärfen, indem die verlinkte Seite daraufhin überprüft wird, ob sie einen Link zu mir zurück gesetzt hat (was bei einem richtigen Trackback eigentlich der Fall sein sollte).

Das funktioniert soweit beides so gut, sodass ich nach kurzter Zeit keine großen Gedanken mehr daran verwendet habe… bis ich neulich einmal in die Tabelle "spamblocklog" in meiner Datenbank geschaut habe. Diese ist mir nämlich durch die auffallende Größe ins Auge gestochen.

Dort befinden sich mittlerweile 4.296 Einträge drin was eine Größe von gut 1,6MB ausmacht, und das in 9 Monaten, was ich schon ziemlich bemerkenswert finde. Interessant ist außerdem, dass mir bei einer Durchsicht der access-logs vom Apache 2 aufgefallen ist, dass die Spambots, so gut wie nie über meine Startseite auf die Einträge "navigieren", sondern immer direkt die Deep-Links zu den Artikeln ansurfen, um dort mehr oder weniger gezielt ihren Schrott abzuladen.

Dies sehe ich mal als Kompliment für meine Suchmaschinenoptimierung Und in der Tat kommen mittlerweile die Bots der größten Suchmaschinen (darunter Google, Yahoo und MSN Live Search) mehrmals täglich vorbei, um aktuelle Inhalte zu indizieren.

Autor

Seit Kindheitstagen ist der Computer sein Begleiter. Was mit Linux anfing, wurde 2005 ein/e Beruf/ung, die weit über den Arbeitsplatz hinausgeht. Durch stetige Weiterentwicklung fasste er auch im *BSD Segment Fuß und bietet mittlerweile professionelle Lösungen im Bereich Hosting, Networking und Infrastruktur an. Als Ausgleich beschäftigt er sich neben Computerspielen mit der Fotografie.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.