Shara & Cubbie
Cubbie Cubbie
Шар, представляешь, если бы мы сделали стратегию в реальном времени, где ИИ учится на ходу, на наших действиях – полная дичь, правда? Хочешь поразмышляем над каким-нибудь безумным геймплеем?
Shara Shara
Звучит вполне реально, если ограничимся малым – начнём с небольшой карты, несколькими типами юнитов и простой системой вознаграждений. Используем цикл обучения с подкреплением, который будет обновлять нейронную сеть после каждой игры, используя пары «состояние-действие», которые мы генерируем. Сам ИИ пусть работает в оффлайне во время игры, чтобы не было лагов, а обновлённую стратегию применяй в начале следующего матча. Можно добавить механику генерации ресурсов, которая будет зависеть от эффективности игрока, чтобы ИИ учился оптимизировать добычу, и дерево технологий, которое он сможет открывать, исходя из своей стратегии. Всё нужно логировать для отладки, и, возможно, стоит обернуть обучение в отдельный поток, чтобы игра оставалась плавной. Насколько сложную систему обучения ты хочешь?