TechStart forside
Nyheder indenfor IT og teknologi
Annullér [x]




Log på  Bliv medlem   Om TechStart
Onsdag, 15. juli, 2020
Forside   »   Software   Spil   »   Nyudviklet AI blev sat til at lære sig selv Go - og slog alle

Nyudviklet AI blev sat til at lære sig selv Go - og slog alle


Firmaet DeepMind har udsendt en udgivelse der beskriver skabelsen af en ny AI, der kan spille det avancerede spil Go.


  |   via Ars Technica   |   Redaktør: jakobdam   |   Indsendt af: thimon

Det er ikke længe siden at den første AI formåede at slå verdens bedste spillere i Go. Problemet var at denne machine learning algoritme bestod af 2 neurale netværk. Det første blev trænet ved hjælp af mennesker, der var eksperter i spillet Go. Dette netværk var dedikeret til at evaluere de mest sansynlige træk en menneskelig modstander ville lave. Det andet netværk var trænet til at forudsige vinderen efter ethvert givent træk. De 2 algoritmer blev kombineret af software, og sammenlagt krævede det applikationsspecifikke processorer ved navn "tensor processing units", udviklet af Google.

Resultatet var at algoritmen kunne slå selv de bedste mennesker i spillet Go, men problemet er at denne fremgangsmåde kun kan bruges på områder hvor der allerede eksisterer menneskelige eksperter, og man vil formentligt ikke få at se ting som mennesker ikke ville overveje at gøre.

Folkene hos DeepMind besluttede sig derfor for at lave en AI der kunne lære sig selv at spille Go. Dette blev opnået ved hjælp af en process ved navn reinforcement learning. Den nye algoritme er blevet døbt AlphaGo Zero, og den blev trænet ved blot at spille mod en anden instans af sig selv.

Begge instanser af AlphaGo Zero blev givet reglerne for Go, og sat til at spille med tilfældige træk indenfor disse regler. Når et træk var udført, så algoritmen på om det resulterede i et bedre udfald af spillet.

Over tid resulterede dette i en meget sofistikeret spillestil. DeepMind kørte nemlig de to instanser mod hinanden i 3 dage, hvilket svarede til næsten 5 millioner spil - og et gennemsnit på 0,4 sekund per træk.

Da træningen var færdig, blev en af instanserne sat op på en maskine med blot 4 stk. tensor processing units, og derefter sat til at spille mod en mennesketrænet AI, der kørte på flere computere og ialt 48 tensor processing units. AlphaGo Zero vandt stort med 100-0.

Faktisk var AlphaGo Zero allerede i stand til at slå menneketrænede AIs efter blot 1 dag, og på dag 4 begyndte den konsistent at vinde over den første AI der kunne slå de bedste menneskelige modstandere.

På dag 25 slog den de mest sofistikerede mennesketrænede AIs, og på dag 40 vandt den 89 spil ud af 100 mod de bedste AIs. Enhver menneskelig spiller der blev sat til at spille mod AlphaGo Zero tabte.

AlphaGo Zeros åbningsspil bestod i træk der allerede bruges af de bedste menneskelige spillere - eller variationer på disse. Slutspillet mindede også om noget et menneske ville gøre - men midterspillet var unikt. Her brugte AlphaGo Zero ikke strategier som mennesker kunne se meningen med - i stedet vandt den måder at komme en smule foran på, selv hvis den skulle tabe terræn for at opnå dette.

Nyudviklet AI blev sat til at lære sig selv Go - og slog alle

Billede: Flavio Takemoto, FreeImages.com


Kategori: Software   Spil  


Tags: alphago zero   ai   artificial intelligence   machine learning   reinforcement learning   go  





Kommentarer: 0
Visninger: 924
Gå til kilde
Foreslå rettelser

Du skal være logget på for at kommentere.



Log på via "log på"-linket i toppen eller bliv medlem.



Relaterede nyheder:

  Alle nyheder i samme kategori Alle nyheder på TechStart

Mandag, 09/03, kl. 11:29
The Last of Us udkommer som TV-serie

Læs mere...

Tirsdag, 25/02, kl. 11:57
HTC Vive Cosmos Elite kan forudbestilles nu

Læs mere...

Onsdag, 11/12, kl. 10:50
GTFO er udkommet på Steam Early Access

Læs mere...

Onsdag, 02/10, kl. 10:37
Sony sætter prisen ned på PlayStation Now

Læs mere...

Tirsdag, 18/06, kl. 15:58
Sponsoreret: Leder du efter en PC, der for alvor kan trække din gaming?

Læs mere...

^ Gå til top

 
Indsend nyhed »  
Seneste kommentarer i:
Hvad er dette?


Søges: Gammelt 486 bundkort til projekt.


Skærm / Skærmelement til Dell Vostro 3550 15.6"


Pas på: Dansk firma snyder Netflix-kunder


Min seneste besættelse...


VR-ready computer - er I klar? :)


AVG pinger ud af Techstart (hacked?)


Jeg er ham...


Apple Pay og Danmark?


TechStart har givet sit bud på årets bedste smartphone


10 dage siden sidste nyhed


Skype sound recorder


Gamle computere.


Engelsk pund nede med 10% - billigt elektronik :)


Standalone mikrofon.


Lexar introducerer 3 nye ultrakompa


SanDisk lancerer microSD-kort med 1


Pokémon Go spillere kan langt om læ


Alternativet, S og SF ønsker pant p


LG lancerer ny 31,5 tommer skærm me


Alienware udgiver tynd og letvægts


Nintendo udgiver nye trådløse retro


Sony lancerer PlayStation Classic


8K er på vej: 33 MPixels fjernsyn


JVC udgiver mere prisvenlig 4K DLP-


Sponsoreret artikel: Snabel a


Officiel Tor browser udkommer til A


Nintendo lancerer online service fo


Western Digital lancerer nye SSDer


ASUS Mixed Reality Headset kommer s