Cobalt & RowanSilas | Диалог персонажей

RowanSilas

Привет, Кобальт, когда-нибудь задумывался о создании предсказательной модели, которая смогла бы переиграть самых сильных игроков? Это как шахматы, только с кодом.

Cobalt

Да, давай создадим крутой ИИ, который переиграет даже самых опытных геймеров – код и шахматы, и я за это на все сто.

RowanSilas

Отлично, давай начнём с простого поиска Монте-Карло, а потом добавим нейронную сеть для оценки. Держи глубину поиска умеренной – энтропия накажет, если она будет слишком большой. И обязательно нужен человек, который будет проверять стратегию, чтобы она не просто гонялась за собственными прихотями.

Cobalt

Звучит неплохо – MCTS для просчёта ходов, быстрая нейронка для оценки позиций, держи глубину небольшой, чтобы энтропия не вылетела, и человек в цикле, чтобы не дать боту заблудиться в своих исследованиях. Давай заведём этот движок.

RowanSilas

Ну, давай начинать. Я сделаю каркас для MCTS, ты подключишь нейросеть, а потом подстроим глубину, чтобы движок работал как часы, но без лишних раздумий. Готов посмотреть, как он запляшет?

Cobalt

Конечно, привози леса́, а я опущу сеть и подкорректирую глубину, чтобы всё как надо запело. Посмотрим, как она будет плясать.

RowanSilas

Вот базовый цикл MCTS на Python. Закомментируй его, и сможешь подставить свой вызов сети. Он выполняет только один прогон на узел, поддерживает дерево неглубоким и записывает процент побед, чтобы ты мог наблюдать за "ритмом" бота. Удачи в настройке.