Google Translate zur Spam-Abwehr nutzen

Wie einige vielleicht wissen, setzen wir hier zur Spam-Abwehr das Plugin Antispam Bee ein. Heute wurde eine neue Version des Plugins freigegeben, die nun mithilfe einer Google API noch mehr Spam erwischen soll. Wir haben dieses Update bereits vorab testen dürfen. 

Ein neues optionales Feature der Antispam Bee ist „Kommentare nur in bestimmter Sprache zulassen“. Um die Sprache festzustellen, muss hierfür ein API Key der Google Translate API in das Plugin eintragen werden. Nach der aktivieren werden alle Kommentare, die nicht Deutsch sind als Spam markiert. Hierfür werden circa die ersten 200 Zeichen des Kommentars an Google übermittelt. Andere Daten wie Mail-Adresse oder Name werden nicht mit übertragen.

An dieser Stelle noch dieser Hinweis. Vor rund drei Wochen gab es bei WordPress Deutschland einen Bericht über die Verwendung von Akismet. Daraufhin erhielt ich einige Mails von Nutzern, die fragten, ob wir das auch nutzen. An dieser Stelle ein klares Nein. Akismet überträgt eine Vielzahl an Daten einen Server in den USA. Viele Daten davon werden zu einer sicheren Spam-Abwehr gar nicht benötigt.

Wir nutzen die meisten Optionen der Antispam Bee. Derzeit sind dies folgende: Kommentare und Pings aus bestimmten Ländern verhindern. Bei der Datenbank „IPInfoDB API Key“ wird die Länderzuordnung der IP-Adresse ohne weitere Daten abgefragt. Steht das Land auf der Blacklist, wird der Kommentar als Spam markiert. „Project Honey Pot als Spammer-Quelle heranziehen“. Hierfür wird die IP-Adresse in modifizierter Form mit dem Spammer-Bestand von Honey Pot abgeglichen. Eine Speicherung findet nicht statt.

Bei unserem Test der Antispam Bee 2.0 stellte es sich als nützlich heraus auch die Option „Bereits als Spam markierte Kommentare berücksichtigen“ zu nutzen. Hierbei wird die IP-Adresse des aktuellen Kommentars mit dem lokalen Bestand der als Spam markierten Kommentaren verglichen. Ist die IP-Adresse dort vorhanden, wird der Kommentar als Spam markiert.

In der Regel werden die vorhandenen Spam-Kommentare nach einem Tag automatisch gereinigt. Gerade in den letzten paar Wochen gab es immer wieder englischsprachige Kommentare mit nur einem Link, der vom Spamschutz nicht als Spam erkannt wurde. Beim Test mit einigen dieser „Kommentare“ stellte ich fest, dass unter Zuhilfenahme der Google Translate API erfolgreich und datenschutzfreundlich gegen Spam vorgegangen werden kann.

Teile diesen Artikel:

comment ommentare zur “Google Translate zur Spam-Abwehr nutzen

  • that sounds good^^
    hoffentlich wird der Kommentar jetzt nicht als SPAM erkannt xD
    Finde ich eine Klasse Idee!
    Und wegen dem Datenübertragen: von mir aus könnt ihr sogar google analytics mit voller IP Speicherung verwenden, weil ich der Meinung bin das man ohne den Provider eh nicht auf mich schließen kann (und dann wäre das auch nur mein Vater xD)

    PS.: das ist jetzt auch eine offizielle Stimme für google analytics xD

    • Seit Ende Dezember läuft die Biene und diese blockiert am Tag so im Schnitt 40-45 Spams. Könnte eigentlich sogar noch deutlich höher liegen, da die Kommentare von alten Postings geschlossen werden (alles älter als 180 Tage).
      Spitzentag war erst vor rund einer Woche mit 244 Spams.

    • Bots fischen sich doch alles an Adressen raus. Du kannst einen Blog aufsetzen mit 2-3 Beiträgen und den ’nen Jahr lang tot liegen lassen. Selbst dort würdest du mit hoher Wahrscheinlichkeit irgendwelch Spam in den Kommentaren finden.

      Jede Seite die „öffentliche“ Formulare anbietet, sollte über einen Spamschutz verfügen. Besonders wenn man auf Software setzt, die weit verbreitet ist.

  • Siehe Fußzeile: Antispam Bee hat bisher 3.455 Spam-Kommentare blockiert und wenn ich recht weiß läuft der Blog erst seit Ende Dezember auf WordPress.

  • Und wos passiert wenn ma net auf Hochdeitsch schreibt sondern in irgendan Dialekt? Erkeint er des daun a as Deitsch oda wirds as Spam markiert?

  • Ist mal interessant zu wissen, das nur 200 Zeichen übertragen werden. Denn dann ist es doch unwahrscheinlich, dass die 100000 Zeichen der API nicht ausreichen.

    • Limit gilt am Tag und kann auch nach Kontakt zu Google erhöht werden.
      Wir haben es seit rund 30-32 Stunden laufen und bisher wurde rund 9500 Zeichen abgefragt. (die Zahl siehst du wenn du Traffic Reports in der Console gehst).
      Auch werden nicht alle Kommentar abgefragt. Tappt ein Bot in die CSS-Falle, markiert die Biene den Kommentar als Spam und prüft nicht weiter.

      • bei mir läufts jetzt so um die 22 Stunden, da wurden gerade einmal 7 Zeichen abgefragt.

        Also ca 1-2 Worte; obwohl inzwischen ca. 10 Spams kamen.
        Es prüft also wirklich spät priorisiert via Google.

        • Die Reihenfolge müsste diese sein:
          CSS-Hack > Server IP > Ländercode > Honeypot > Spam IP > Sprache (wenn alles aktiv ist)

Kommentare sind geschlossen.