AlphaZero

Zuletzt aktualisiert: 22.01.2024

Ein autodidaktisches Computerprogramm von DeepMind ist AlphaZero. dessen Rechenvorschrift erlernt mehrere komplizierte Brettspiele ausschließlich anhand der Verfahrensabläufe und Siegvorbedingungen sowie durch kräftiges Spiel gegen sich selber. Eine verallgemeinerte Herangehensweise von verwendet das Programm. AlphaGo Zero . . . . . und beherrscht nach passender Schulung nicht bloß Go, sondern außerdem die Strategiespiele Schachspiel und Shōgi.

Am 5. Dezember 2017 veröffentlichte . DeepMind, eine Forschungsanlage für artifiziellen Intellekt und Tochterfirma von Alphabet Inc., ein Preprint auf ArXiv über das Programm . AlphaZero, in dem geschildert wird, dass . AlphaZero innerhalb von 24 Stunden durch bestärkendes Lernen eine herausragende Spielstärke erreichte und die leistungsfähigsten Programme Stockfish, Elmo und eine Drei-Tages-Version von . AlphaGo Zero . . . . . in ihren respektiven Teildisziplinen besiegte, dabei allerdings leistungsstärkere Gerätschaft als die Gegnerprogramme verwendete. Nur zehn Hauptgewinnpartien von wurden mit dem Schriftstück. AlphaZero gegen Stockfish publiziert. Alle größeren Begegnungen sowie zudem . AlphaZero selber waren zuerst nicht erreichbar und die Resultate des Schriftstückes nicht durch ein Peer-Review bestätigt. In dem Magazin Science erschien eine erweiterte und begutachtete Fassung des Zeitungsartikels am 7. Dezember 2018.

AlphaZero schlug das freie Schachprogramm . Stockfish 8 . . . nach neun Stunden Selbstständiglernen. 64 TensorFlow Processing Units der zweiten Altersstufe wurden für das Fürlernen des nachgemachten nervlichen Netzes benutzt. Für die Herstellung der dazu nötigen Schulungspartien verwendet wurden weitere 5.000 TPUs der ersten Altersstufe. Auf einem alleinigen Rechner mit nur vier TPUs spielte die Rechenvorschrift mit dem trainierten nervlichen Netz anschließend.

Verknüpfung mit AlphaGo Zero

AlphaZero nutzt eine generalisierte, generische Version des Berechnungsverfahrens von . AlphaGo Zero . . . . . und ist begabt, nach betreffendem Fürlernen die drei Brettspiele Shōgi, Schachspiel und Go auf übermenschlicher Ebene aufzuspielen. : sind Unterschiedlichkeiten zwischen AZ und AktiengesellschaftZ.

  • AlphaZero hat aufrecht programmierte Berechnungsverfahren zur Ausrechnung von Rummelparametern.
  • Stetig überarbeitet wird das künstliche nervliche Netz.
  • Unveränderlich zur Situation des Feldes, somit ebenso nach Spiegelbild und Umdrehung valid sind die Vorschriften des fernöstlichen Brettspiels Go. Die Programmierung von . AlphaZero zieht im Unterschied zu . AlphaGo Zero . . . . . keinen Nutzen aus diesen Paritäten.
  • Mit einem Gleichstand beenden können Shōgi aus welchen Gründen. AlphaZero dieses zusätzliche Spielende als Aussicht in Frage halten muss. Statt der Hauptgewinnrate durchprobiert . AlphaZero daher den zu erwartenden Partieangang zu optimalisieren.

AlphaZero in Relation zu Stockfish und Elmo

Die Brettspiele Schachspiel, Shōgi und Go sind in der Spielwissenschaft endliche Zwei-Personen-Nullsummenspiele mit vollkommenem Informationsstand ohne Zufallseinwirkung. Auf einer viereckigen Spielfläche führen zwei Gegner wechselweise einen Eisenbahnzug aus. Hinsichtlich ihrer respektiven Spielfeldweite, der Zahl der Stilfiguren, der Spiel-Komplexität, ihrer Variabilität bei Windung oder Reflexion des Spielfeldes und ihrer möglichen Spielenden unterscheiden die Strategiespiele sich.

Klassische Schachprogramme wie . Stockfish evaluieren Stellungen und Wesen anhand von Charakteristiken, die überwiegend von humanen Meistern konkretisiert und gewertet werden, zusammengelegt mit einer leistungsfähigen Alpha-Beta-Suche, die einen übergroßen Suchbaum mit einer gewichtigen Zahl von Schätzungen und domänenspezifischen Modifikationen erzeugt und bewertet. Das Berechnungsverfahren von . AlphaZero spielt bloß auf Basis der Verfahrensabläufe und anlegen von Zufälligkeitszügen gegen sich selber, bewertet die Resultate und optimiert seine Zuglüfte und Vorgehensweisen durch Modifikation der Körpergewichte seines Netzes. Im Berücksichtigung auf das von . AlphaZero Das Programm nur 80.000 Stellungen pro Sekunden bei Schachspiel und 40.000 bei Shōgi bewertet verwendete Monte-Carlo-Suchverfahren wohingegen. Stockfish 70 Millionen und . Elmo 35 Millionen errechnet. AlphaZero kompensiert die bei weitläufigem niedrigere Zahl an Verwertungen durch ein nervliches Netz, das sich auf die aussichtsvolleren Ausführungen innerhalb des Suchbaums konzentriert.

Ergebnisse

Schach

Das Schachprogramm . Stockfish 8 . . . gewann im Dezember 2016 die . Top Chess Engine Championship . . , eine internationale, annuell ausgetragene Computerschach-Meisterschaft. In den Schachpartien von . AlphaZero gegen Stockfish 8 . . . Beide Programme hatten jedesmal eine Minute Nachdenkzeit pro Spielzug. Von 100 Partien mit typischer Beginnaufstellung gewann . AlphaZero 25 Partien mit farblosen Stilfiguren, dreifach mit Schwarz und erzielte 72 Gleichstände. Aus einer Serie von zwölf 100-Spiele-Serien gegen . Stockfish, die mit den zwölf beliebtesten Einstiegen begannen, gewann . AlphaZero 290 Mal, verlor 24 Mal und spielte 886 Fleck Gleichstand. Da Das Berechnungsverfahren von . AlphaZero in beiden Fallen über mehr Rechenkapazität als . Stockfish verfügte, lassen sich keine glatten Schlussfolgerungen bezüglich der Effektivität der verwendeten Berechnungsverfahren führen.

Den Triumph von kritisieren einige Entscheidendschachgroßmeister, wie Hikaru Nakamura und der Komodo-Entwickler Larry Kaufman. AlphaZero verrinnen, dass das Resultat erheblich schmal ausgefallen wäre, wenn die beiden Programme Eröffnungsdatenbanken hätten benutzen dürfen, da . Stockfish hierfür perfektioniert sei. Faktisch unterliefen . Stockfish in einigen Durchläufen schon in dem Beginn grobe Fehlgriffe, die mit einem Eröffnungstaschenbuch entgangen worden wären.

Tord Romstad, einer der leitenden Erfinder von . Stockfish, publizierte auf . Chess.com anschließende Anmerkung: .

Shōgi

Im Verständigung zu Schachspiel ist das japanische Shōgi ein komplizierteres Strategiespiel in Hinsicht auf die Zahl beliebiger Zuglüfte, da es auf einem umfangreicheren Spielbrett und mit mehr Erscheinungen aufgespielt wird und da die meisten geschlagenen Gestalten fast allerorts verwendet werden können. Nach 12 Stunden Selbstständiglernen gewann . AlphaZero 90 von 100 Auftritten gegen . Elmo, verlor acht und zwei gingen Remis aus. Um die Spielstärke von . Elmo Weniger als zwei Stunden Übung wurden gebraucht. Bemängelung an den Spielvorbedingungen zwischen den Engines von gab innerhalb der Gemeinde von Shōgi-Programmierern es. AlphaZero und Elmo.

Go

Nach 34 Stunden Selbstständiglernen von Go gewann . AlphaZero gegen eine drei Tage trainierte Fassung von . AlphaGo Zero . . . . . in 60 Sachverhalten und verlor 40-mal. AlphaZero erreichte aber bereits nach acht Stunden die Spielstärke von . AlphaGo Lee . . Jene Programmversion ist das. Sie gewann im März 2016 die Vergleichsschlacht AlphaGo gegen Lee Sedol 4:1.

Reaktionen

Dass die Schachschulung nur vier Stunden benötigte, titelten mehrere Zeitungswesen wie die Frankfurter Allgemeine Zeitung oder die The Times of London die Tatsache: It was managed in little more than the time between breakfast and lunch ”. Wired bejubelte AlphaZero als the first multi-skilled AI board-game champ. Dass Googles knack for good publicity ” sie in eine starke Stellung gegenüber Mitwettbewerbern bringe, merkte Joanna Bryson, eine Spezialistin für artifiziellen Intellekt an:

In einem Gespräch mit der BBC sagte der dänische Meister Peter Heine Nielsen:

Als insane attacking chess ” mit tiefgründigem Stellungsspiel charakterisierte der norwegische Meister Jon Ludvig Hammer AlphaZero. : sagte der zeitligere Schachweltmeister Garri Kasparow.

Alle erhältlichen Abschnitte von AlphaZero analysierte der englische Meister Matthew Sadler und der englische Meister Matthew Sadler veröffentlichte gemeinsam mit Natasha Regan im Frühlingszeit 2019 das Taschenbuch. Game Changer . ISBN 978 – 90 – 5691 – 818 – 7, in dem er die Spielweise des Programms als epochemachend und dessen Spielstärke als verblüffend bezeichnet.

Das Open-Source-Projekt . Leela Chess Zero . , zeitweilig . Lc0Die bislang von versucht. DeepMind veröffentlichten Gestaltungsansätze und Berechnungsverfahren für heimische PCs und transportable Gerätschaften zu umsetzen und wird mit Einsatz der Gemeinschaft dressiert. Auf der vergleichbar motivierten Go-Engine basiert es. Leela und erzielte schon im Jahr 2018 Achtungserfolge bei Computer-Schachmeisterschaften. Lc0 siegte im Mai 2019 erstmalig bei der. Top Chess Engine Championship . . .

    👉 Dir gefällt dieser Beitrag?
    Success! Thanks for Your Request.
    Error! Please Try Again.