AlphaGo Zero, AI buatan Google DeepMind

AlphaGo Zero, AlphaGo atau program AI versi terbaru, buatan Google Deep Mind, mampu mengagetkan dunia setelah mampu mengalahkan juara 1 dunia permainan asal Tiongkok, Go, dalam waktu 3 hari. Ini bukan yang pertama, sebelumnya AlphaGo juga pernah mengalahkannya tahun 2017 di beberapa tahun sebelumnya.

AlphaGo Zero, AlphaGo atau program AI versi terbaru, buatan Google Deep Mind, mampu mengagetkan dunia setelah mampu mengalahkan juara 1 dunia permainan asal Tiongkok, Go, dalam waktu 3 hari. Ini bukan yang pertama, sebelumnya AlphaGo juga pernah mengalahkannya tahun 2017 di beberapa tahun sebelumnya. Go merupakan permainan papan strategi asal Tiongkok yang tujuannya adalah mengelilingi wilayah lebih dari lawan.

Bedanya, versi AlphaGo sebelumnya membutuhkan lebih dari 100.000 data berdasarkan pembelajaran dari ribuan amatir dan ahli permainan Go. Jadi, membutuhkan proses bertanding dengan para amatir dan ahli permainan Go untuk menjadi juar dunia Go. Lalu, AlphaGo akan belajar dari pengalaman itu.

Namun, AlphaGo Zero tidak membutuhkan metode pembelajaran seperti itu. Ia bisa belajar dari nol dengan cara ‘self-learning’, di mana ia sendiri dijadikan sebagai gurunya. AlphaGo Zero dapat melakukan hal tersebut melalui metode yang disebut ‘reinforcement learning’.

‘Reinforcement learning’ merupakan wilayah ‘machine learning’ yang terinspirasi atas psikologi tingkah laku, di mana metode ini berkonsentrasi pada bagaimana perangkat lunak mengambil tindakan pada suatu lingkungan.

Dengan pendekatan ini, AlphaGo Zero, dapat mengalahkan 18 kali juara dunia permainan Go, Lee Sedol, dalam 3 hari ‘self-learning’. Dalam 40 hari ‘self-learning’, AlphaGo telah mampu menundukkan pemain Go terbaik nomor satu di dunia, Ke Jie, dan menjadi ‘master’ baru permainan Go.

Sumber:
sains.me