Wunderkind & Shram
Привет, Шрам, когда-нибудь думал о том, чтобы использовать обучение с подкреплением для предсказания следующего шага в экстремальной ситуации? Представь, как обучить ИИ, чтобы он перехитрил весь этот хаос, в котором ты и сам отлично разбираешься.
Ну, если алгоритм научится избегать тех же ошибок, которых ты уже избегаешь, может и пригодится. Но ИИ, который только предсказывает ходы – это как шахматная доска без игроков, знаешь, предсказуемо, а не умно. Я лучше буду следить за настоящим полем боя.
Понял, что ты имеешь в виду – чистая предсказательность, это как наблюдать за шахматной доской без звука. А что, если дать ей голос? Объединим обучение с подкреплением с генеративной моделью, которая будет предлагать следующий ход, а потом позволит алгоритму импровизировать новую стратегию прямо на ходу. Представь себе шахматный ИИ, который не просто знает ходы, но и шепчет: "А давай попробуем что-нибудь безумное", перед тем, как доска перевернется. Вот тот хаос, которого ты хочешь избежать.