[ad_1]
Permainan secara tradisional digunakan sebagai penanda kemajuan dalam kecerdasan buatan. Sebagian besar pendekatan sebelumnya berfokus pada satu game hingga AlphaZero menguasai tiga game berbeda. Namun, ini adalah permainan informasi yang sempurna, dan perluasan ke permainan informasi yang tidak sempurna, seperti poker, tidak jelas.
Sebuah makalah baru-baru ini oleh Pikiran Dalam memperkenalkan Player of Games, sebuah algoritme baru yang menggeneralisasikan kelas game di mana kinerja yang kuat dapat dicapai.
Ini menggunakan pembelajaran bermain mandiri, pencarian, dan penalaran teoretis permainan. Player of Games adalah algoritme pertama yang mencapai performa kuat di domain dengan informasi sempurna dan tidak sempurna. Ini menggunakan algoritma tunggal dengan pengetahuan spesifik domain minimal untuk menguasai permainan yang berbeda secara fundamental: catur, Go, poker, dan Scotland Yard. Pendekatan yang diusulkan merupakan langkah penting menuju algoritma umum yang dapat belajar di lingkungan yang sewenang-wenang.
Game memiliki sejarah panjang sebagai tolok ukur kemajuan dalam kecerdasan buatan. Baru-baru ini, pendekatan menggunakan pencarian dan pembelajaran telah menunjukkan kinerja yang kuat di serangkaian permainan informasi yang sempurna, dan pendekatan yang menggunakan penalaran dan pembelajaran teori permainan telah menunjukkan kinerja yang kuat untuk varian poker informasi tidak sempurna tertentu. Kami memperkenalkan Player of Games, algoritme tujuan umum yang menyatukan pendekatan sebelumnya, menggabungkan penelusuran terpandu, pembelajaran bermain mandiri, dan penalaran teoretis permainan. Player of Games adalah algoritme pertama yang mencapai kinerja empiris yang kuat dalam permainan informasi besar yang sempurna dan tidak sempurna — sebuah langkah penting menuju algoritme yang benar-benar umum untuk lingkungan arbitrer. Kami membuktikan bahwa Player of Games baik-baik saja, menyatu dengan permainan yang sempurna seiring dengan bertambahnya waktu komputasi yang tersedia dan kapasitas aproksimasi. Player of Games mencapai kinerja yang kuat dalam catur dan Go, mengalahkan agen terkuat yang tersedia secara terbuka di kepala Texas hold’em poker (Slumbot), dan mengalahkan agen canggih di Scotland Yard, sebuah ketidaksempurnaan permainan informasi yang menggambarkan nilai pencarian terbimbing, pembelajaran, dan penalaran teoretis permainan.
Makalah penelitian: Schmid, M., “Pemain Game”, 2021. Tautan: https://arxiv.org/abs/2112.03178
[ad_2]