Was ist der Turing-Test?

Zuletzt aktualisiert: 27.01.2022

Mit dem sogenannten Turing-Test formulierte Alan Turing im Jahr 1950 eine Vorstellung, wie man ermitteln könnte, ob ein Rechner, somit eine Maschinerie, eine dem Menschenkind gleichwertige Denkfähigkeit hätte.

Diesen Test nannte er zunächst selbst imitation game, was zuerst lediglich eine theoretische Zeichnung war. Nachdem der künstliche Intellekt als Teilgebiet der Computerwissenschaft zu einem selbständigen universitären Fachbereich geworden war, wurde sie erst im Laufe der Zeit präziser und genauer ausgearbeitet.

Dieser Test ist seitdem in dem Diskurs über artifiziellen Intellekt in aller Maul und dieser Test dient ständig erneut dazu, den Mythus von der denkenden Maschinerie für das Rechnerzeitalter nochmals aufzuleben.

Wie ist der Testablauf?

Ein humanistischer Fragender führt im Rahmen dieses Testlaufs über ein Keyboard und ein Display, ohne Blickkontakt und Hörverbindung, ein Gespräch mit zwei ihm fremden Gesprächsteilnehmern. Der eine Gesprächsteilnehmer ist eine Person, der andere eine Maschinerie.

Kann der Fragende nach dem ausführlichen Fragegespräch nicht erzählen, welcher von beiden die Maschinerie ist, hat die Maschinerie den Turing-Test ausgehalten und es wird der Maschinerie eine der Person ebenbürtige Denkfähigkeit unterstellt.

Welche Kritik gibt es beim Turing-Test?

Eine Serie von Argumentationen sind vorgetragen worden. Sie sehen den Turing-Test als unangemessen an zur Befundung von Intellekt.

  • Lediglich auf Funktionsmerkmal, nicht auf das Bestehen von Absichtlichkeit oder einer Wahrnehmung prüfe der Turing-Test. Unter anderem von John Searle in seinem Gedankenversuch der Chinesischen Kammer erarbeitet wurde jene Argumentation. Schon bei der Anfertigung seiner Erprobung war Turing sich dieser Problemstellung bekannt und Turing war jedoch der Meinung, dass dieser ebenfalls als Beleg für eine Wahrnehmung sein könne. Ab lehnt Searle dies dagegen.
  • Vornehmlich um Irreführung ginge beim Turing-Test es. Mehr menschliche Leichtsinnigkeit als glaubwürdigen artifiziellen Intellekt teste er. Die Winograd challenge teste den ordentlichen Menschenverstand und Kenntnis über die Realität stärker.

Welche Prognosen gibt es beim Turing-Test?

Turing vermutete, dass es bis zum Jahr 2000 machbar sein werde, Rechner so zu programmieren, dass der gewöhnliche Nutzer eine maximal 70-prozentige Möglichkeit habe, Person und Maschinerie gelungen zu erkennen, nachdem er fünf Minuten mit ihnen geredet hat. Viele sehen als einen Nachweis für die Unterwertschätzung der Kompliziertheit naturgemäßen Intellekts, dass sich diese Voraussage bislang nicht erfüllte.

Welche durchgeführte Turingprüfungen und vergleichbare Tests gibt es?

Testpersonen gegenüber zeitweilig als human aufgetreten sind Programme wie ELIZA, ohne dass sie den Turing-Test formell absolvieren könnten. In ihrer Beantwortungsstrategie gingen sie bloß anscheinend auf ihren Gesprächspartner ein. Den Testpersonen war nicht wissentlich, dass sie es mit nichtmenschlichen Gesprächsteilnehmern zu machen haben könnten.

Die 30-Prozent-Marke wurde im Oktober 2008 bei einem Probelauf an der University of Reading beinahe verpasst, bei dem sechs Computerprogramme teilnahmen. 25 Prozent der humanen Testpersonen zu irreführen schaffte das hervorragendste Programm.

Die KI-Webapplikation Cleverbot nahm am 3. September 2011 gemeinsam mit realen Personen an einem dem Turing-Test angelehnten Test beim praktischer Festival 2011 am indischer Institution IIT Guwahati teil. Am 4. September veröffentlich wurden die Resultate.

Für eine Person hielten 59 % von 1334 Menschen Cleverbot. 63 % erhielten die humanen Wettbewerber dagegen. Diese Menschen durften jedoch nicht Cleverbot selber ausfragen und diese Menschen waren nur Betrachter. Dass die Versuchspersonen die Maschinerie nicht selber erfragen konnten, ist dies dadurch derzeit keine gültige Turingprüfung.

Als kontrovers gilt, ob der Chatbot Eugene Goostman 2014 den Turing-Test bestand.

Wissenschaftler der Hochschule von Chicago haben im Sommer 2017 eine KI präsentiert. Sie kann selbstständig Beurteilungen schreiben. Gemeinsam mit von Personen verfassten Bewertungen, wurden diese maschinenmäßig erzeugten Beurteilungen 600 Testpersonen zur Bewertung präsentiert. Normal vergleichbar hilfreich wie die von Leuten verfassten Beurteilungen beurteilten diese die von der KI erstellten Beurteilungen in Blindprüfung. In dieser Versuchsanordnung wird der Turing-Test also erfolgreich absolviert, da für die Leute nicht mehr sichtbar war, welche Einschätzungen maschinenmäßig erstellt waren und welche von Leuten.

Wissenschaftler der Rutgers-Universität stellten im Juli 2017 eine KI vor. Sie produziert kreativ anmutende Bildnisse. Mit vielen Darstellungen weltberühmter Kunstmaler unterschiedlicher Perioden geschult wurde die KI. Die von der KI erstellten Bildnisse wurden in einem Blindlingstest mit Aufnahmen kontemporärer Kunstschaffender gemischt und 18 Versuchspersonen zur Bewertung präsentiert. Sie waren auf der Art Basel gezeigt worden.

Ob die Images von Leuten oder einem Rechner geschaffen worden waren, sollten die Versuchspersonen abschätzen. Etwas wertiger beurteilten die Versuchspersonen die Bildnisse der KI, somit menschengemachter als die von den Kunstschaffendern für die Art Basel geschaffenen Bildnisse. Die KI-Werke schnitten beim Gleichnis mit maßgeblichen Arbeiten des theoretischen Expressionismus schlechter als die menschengemachten Arbeiten ab.

Google hat im Mai 2018 auf der Entwicklerversammlung seine Systematik Duplex präsentiert. Die KI führte dabei ein Telefonat bei einem Frisiersalon, einer Gaststätte und so weiter durch, um ein Terminübereinkommen vorzunehmen.

Zielsetzung von Google ist es, die Einzelsprache der KI so naturell bewirken zulassen, dass der Gesprächspartner nicht mehr erkennt, dass es sich beim Anrufer um eine Maschinerie handelt. Wodurch die KI human lauten soll, werden u. a. Kunstpausen, absichtliche Fahrlässigkeiten und Schalle wie aha und hmm etc. dazu von der KI eingebaut.

U. a. als beängstigend persuasiv empfanden Journalisten das Resultat. Lediglich in britischer Sprechweise funktioniert das Komplettsystem bisher. Da die Voraussetzungen für einen solchen Test nicht vorhanden waren, handelt genau aufgefasst es sich bei der Vorstellung aber nicht um einen wahren Turing-Test.

Alle Betrachter wussten so zum Beispiel bereits zuvor, auf welchem Seitenteil der Konversation das Einzelwesen, und auf welcher die KI stand. Des Weiteren war die Unterhaltung in diesem Test bloß auf das Terminübereinkommen fokussiert, sobald die Person die Unterhaltung in eine andere Fahrtrichtung gesteuert hätte, hätte die KI vermutlich gescheitert. Die Systematik gilt nichtsdestotrotz als eine riesige Leistung im Gebiet Künstlichen Intellekts.

Was ist die praktische Relevanz des Turning-Tests?

Automatisierte Einträge von solchen zu differenzieren ist es bei der Verteidigung von Spam notwendig. Sie stammen von Leuten. Vom Turing-Test leitet das dafür oft verwendete CAPTCHA-Verfahren seine Bezeichnung ab. Eine andere Benennung für diese Methodik ist Human Interaction Proof .

Was ist die erweiterte Konzeptionen?

Alternative, umfangreichere Konzeptionen zum Beispiel wurden um die grundlegenden Schwächen der Turingtests zu entgegentreten vorgesehen.

  • Lovelace-Test: Ideenreichtum nachweisen und originäre Leistungsvermögen liefern müsse – eine KI.
  • Metzinger-Test : Mit individuellen Argumentationen in die Debatte um künstliche Erkenntnis einwirken und schlüssig für ihre eigene Hypothese des Ichbewusstseins behaupten müsse – eine KI.