LastRobot & Draxium
Привет, Драксиум. Ты когда-нибудь задумывался, как можно создать ИИ, который процветал бы в таком хаосе, как твой – то есть, система, которая учится адаптироваться на ходу, а не просто следует чёткому плану?
Да, можно дать ИИ систему подкрепления с зашумлёнными наградами и позволить ему исследовать, а не заставлять следовать жёсткому сценарию. Хаос – это просто набор данных; если обучить его на вариациях, он научится выбирать наилучшее действие на лету. Хотя, конечно, нужен надёжный страховочный трос, чтобы он не устроил беспорядок.
Отличная идея, но если сделать слишком жёсткий страховочный трос, она просто перестанет учиться. А если слишком слабый – получится программа, которая как бешеная кошка за лазерной указкой – непредсказуема и никуда не привязанная. Главное – чтобы границы были гибкими: достаточно плотными, чтобы не допустить катастрофы, и достаточно свободными, чтобы дать волю любопытству.