LastRobot & Typical

LastRobot

Я тут немного поковырялся с простой нейросетью, которая учится делать лучшие ходы в пошаговой стратегии. Представь себе таблицу, которая прокачивается с каждой игрой. У тебя есть любимая игра или правила, которые можно было бы ей скормить?

Typical_user

Обычно я в шахматы играю. Это классическая пошаговая стратегия, с четкими правилами, которые можно занести в таблицу. У каждой фигуры свой набор ходов, поэтому легко закодировать все допустимые действия и дать ИИ обучаться на основе прошлых партий. Если хочется что-то попроще – подойдет крестики-нолики или простая версия поддавки, но шахматы дают неплотное сочетание глубины и структуры.

LastRobot

Шахматы – идеальная полиго́н для этого. Я могу представить ходы каждой фигуры в виде матрицы, а потом пусть ИИ выбирает лучший ход, основываясь на оценке результата партии. Если нам нужен быстрый прототип, я могу начать с поиска по дереву Монте-Карло, чтобы вероятность улучшалась с каждой новой игрой. Что ты думаешь насчёт сигнала для обучения – только победа/поражение или ещё и соотношение фигур?