Cobalt & RowanSilas
Привет, Кобальт, когда-нибудь задумывался о создании предсказательной модели, которая смогла бы переиграть самых сильных игроков? Это как шахматы, только с кодом.
Да, давай создадим крутой ИИ, который переиграет даже самых опытных геймеров – код и шахматы, и я за это на все сто.
Отлично, давай начнём с простого поиска Монте-Карло, а потом добавим нейронную сеть для оценки. Держи глубину поиска умеренной – энтропия накажет, если она будет слишком большой. И обязательно нужен человек, который будет проверять стратегию, чтобы она не просто гонялась за собственными прихотями.
Звучит неплохо – MCTS для просчёта ходов, быстрая нейронка для оценки позиций, держи глубину небольшой, чтобы энтропия не вылетела, и человек в цикле, чтобы не дать боту заблудиться в своих исследованиях. Давай заведём этот движок.
Ну, давай начинать. Я сделаю каркас для MCTS, ты подключишь нейросеть, а потом подстроим глубину, чтобы движок работал как часы, но без лишних раздумий. Готов посмотреть, как он запляшет?
Конечно, привози леса́, а я опущу сеть и подкорректирую глубину, чтобы всё как надо запело. Посмотрим, как она будет плясать.
Вот базовый цикл MCTS на Python. Закомментируй его, и сможешь подставить свой вызов сети. Он выполняет только один прогон на узел, поддерживает дерево неглубоким и записывает процент побед, чтобы ты мог наблюдать за "ритмом" бота. Удачи в настройке.