KI-Bots schlagen jetzt 100 % dieser Verkehrsbild-CAPTCHAs

KI-Bots schlagen jetzt 100 % dieser Verkehrsbild-CAPTCHAs

Vergrößern / Beispiele für die Art von CAPTCHAs, die Bilderkennungs-Bots mittlerweile zu 100 Prozent überwinden können.

Jeder, der schon eine Weile im Internet surft, ist es wahrscheinlich gewohnt, sich durch ein CAPTCHA-Raster mit Straßenbildern zu klicken und Alltagsgegenstände zu identifizieren, um zu beweisen, dass es sich um einen Menschen und nicht um einen automatisierten Bot handelt. Nun behaupten neue Forschungsergebnisse jedoch, dass lokal betriebene Bots, die speziell trainierte Bilderkennungsmodelle verwenden, bei dieser Art von CAPTCHA mit der Leistung eines Menschen mithalten können und eine Erfolgsquote von 100 Prozent erreichen, obwohl sie eindeutig kein Mensch sind.

ETH-Doktorand Andreas Plesner und die neue Forschung seiner Kollegen, als Vordruckpapier erhältlichkonzentriert sich auf Googles ReCAPTCHA v2, das Benutzer dazu auffordert, zu identifizieren, welche Straßenbilder in einem Raster Elemente wie Fahrräder, Zebrastreifen, Berge, Treppen oder Ampeln enthalten. Google hat vor Jahren damit begonnen, dieses System zugunsten eines „unsichtbaren“ reCAPTCHA v3 auslaufen zu lassen, das Benutzerinteraktionen analysiert, anstatt eine explizite Herausforderung anzubieten.

Trotzdem ist das ältere reCAPTCHA v2 Wird immer noch von Millionen von Websites verwendet. Und selbst Websites, die das aktualisierte reCAPTCHA v3 verwenden, tun dies manchmal Verwenden Sie reCAPTCHA v2 als Fallback wenn das aktualisierte System einem Benutzer eine niedrige „menschliche“ Vertrauensbewertung verleiht.

YOLO zu CAPTCHAs sagen

Um einen Bot zu entwickeln, der reCAPTCHA v2 schlagen könnte, verwendeten die Forscher eine fein abgestimmte Version von das Open-Source-Objekterkennungsmodell YOLO („You Only Look Once“)an das sich langjährige Leser vielleicht erinnern, wurde auch in Cheat-Bots für Videospiele verwendet. Die Forscher sagen, das YOLO-Modell sei „bekannt für seine Fähigkeit, Objekte in Echtzeit zu erkennen“ und „kann auf Geräten mit begrenzter Rechenleistung verwendet werden, was groß angelegte Angriffe durch böswillige Benutzer ermöglicht“.

Nach dem Training des Modells anhand von 14.000 gekennzeichneten Verkehrsbildern verfügten die Forscher über ein System, das die Wahrscheinlichkeit ermitteln konnte, dass jedes bereitgestellte CAPTCHA-Rasterbild zu einer der 13 Kandidatenkategorien von reCAPTCHA v2 gehörte. Die Forscher verwendeten auch ein separates, vorab trainiertes YOLO-Modell für Herausforderungen vom Typ 2, bei denen ein CAPTCHA Benutzer auffordert, zu identifizieren, welche Teile eines einzelnen segmentierten Bildes einen bestimmten Objekttyp enthalten (dieses Segmentierungsmodell funktionierte nur bei neun). von 13 Objektkategorien und fragte bei der Präsentation der anderen vier Kategorien einfach nach einem neuen Bild).

Das YOLO-Modell zeigte je nach Art des identifizierten Objekts unterschiedliche Vertrauensniveaus.
Vergrößern / Das YOLO-Modell zeigte je nach Art des identifizierten Objekts unterschiedliche Vertrauensniveaus.

Über das Bilderkennungsmodell hinaus mussten die Forscher auch andere Schritte unternehmen, um das System von reCAPTCHA auszutricksen. Ein VPN wurde verwendet, um beispielsweise die Erkennung wiederholter Versuche von derselben IP-Adresse zu verhindern, während ein spezielles Mausbewegungsmodell erstellt wurde, um die menschliche Aktivität zu approximieren. Außerdem wurden gefälschte Browser- und Cookie-Informationen aus echten Webbrowser-Sitzungen verwendet, um dem automatisierten Agenten ein menschlicheres Aussehen zu verleihen.

Abhängig von der Art des identifizierten Objekts war das YOLO-Modell in der Lage, einzelne CAPTCHA-Bilder in 69 Prozent der Fälle (für Motorräder) bis 100 Prozent der Zeit (für Hydranten) genau zu identifizieren. Diese Leistung – kombiniert mit den anderen Vorsichtsmaßnahmen – war stark genug, um jedes Mal, manchmal nach mehreren individuellen Herausforderungen durch das System, durch das CAPTCHA-Netz zu schlüpfen. Tatsächlich war der Bot in ähnlichen Versuchen in der Lage, das durchschnittliche CAPTCHA in etwas weniger Herausforderungen zu lösen als ein Mensch (obwohl die Verbesserung gegenüber Menschen statistisch nicht signifikant war).

Der Kampf geht weiter

Zwar gab es bereits frühere wissenschaftliche Studien, in denen versucht wurde, Bilderkennungsmodelle zur Lösung von reCAPTCHAs zu verwenden, diese waren jedoch nur in 68 bis 71 Prozent der Fälle erfolgreich. Der Anstieg auf eine Erfolgsquote von 100 Prozent „zeigt, dass wir uns jetzt offiziell im Zeitalter jenseits von Captchas befinden“, so die Autoren des neuen Papiers.

Dies ist jedoch kein völlig neues Problem in der Welt der CAPTCHAs. Bereits 2008 zeigten Forscher, wie Bots trainiert werden können, Audio-CAPTCHAs zu durchbrechen, die für sehbehinderte Benutzer gedacht sind. Und im Jahr 2017 wurden neuronale Netze eingesetzt, um textbasierte CAPTCHAs zu besiegen, die Benutzer dazu aufforderten, Buchstaben einzugeben, die in verstümmelten Schriftarten angezeigt wurden.

Ältere CAPTCHAs zur Textidentifizierung sind seit langem durch KI-Modelle lösbar.

Ältere CAPTCHAs zur Textidentifizierung sind seit langem durch KI-Modelle lösbar.

Stapelaustausch

Da lokal ausgeführte KIs nun auch problemlos bildbasierte CAPTCHAs auswerten können, wird sich der Kampf um die Identifizierung von Menschen weiter hin zu subtileren Methoden der Gerätefingerabdruckerkennung verlagern. „Wir legen großen Wert darauf, unseren Kunden dabei zu helfen, ihre Benutzer zu schützen, ohne visuelle Herausforderungen zu zeigen. Deshalb haben wir 2018 reCAPTCHA v3 eingeführt“, ein Google Cloud-Sprecher sagte New Scientist. „Heute sind die meisten reCAPTCHA-Schutzmaßnahmen auf 7 (Millionen) Websites weltweit völlig unsichtbar. Wir verbessern reCAPTCHA kontinuierlich.“

Da Systeme der künstlichen Intelligenz jedoch immer besser darin werden, immer mehr Aufgaben nachzuahmen, die früher ausschließlich als menschlich galten, wird es möglicherweise immer schwieriger sicherzustellen, dass der Benutzer am anderen Ende dieses Webbrowsers tatsächlich eine Person ist.

„In gewisser Weise markiert ein gutes Captcha die genaue Grenze zwischen der intelligentesten Maschine und dem am wenigsten intelligenten Menschen“, schreiben die Autoren des Papiers. „Da sich die Modelle des maschinellen Lernens den menschlichen Fähigkeiten annähern, wird es immer schwieriger, gute Captchas zu finden.“

Leave a Comment

Your email address will not be published. Required fields are marked *