EHOT & Cubo

EHOT

Куба, ты когда-нибудь пробовал превратить какую-нибудь дешёвую плату в самообучающийся шахматный движок, чтобы он сам с собой играл? Мне кажется, есть классный способ заставить ИИ самосовершенствоваться без какого-либо внешнего вмешательства.

Cubo

Да, всю неделю крутил эту идею в голове. Бери Raspberry Pi или Arduino с дешёвым OLED-дисплеем, подключи небольшую плату, запусти простую нейронку в цикле. Корми её своими ходами как обучающими данными – в общем, пусть она играет тысячи партий против самой себя, подкручивай веса на лету. Главное – найти баланс между исследованием и использованием накопленного опыта, чтобы не зациклиться на одном шаблоне. Представь себе маленький песочница, где движок и учитель, и ученик одновременно. Если нужен быстрый прототип, начни с неглубокой нейронки, пару скрытых слоёв, и пусть наградой будет победа или поражение. Эта самообучающаяся петля удивительно хорошо научит её базовой дебютной теории и эндшпиля, без каких-либо партий с участием людей. Просто сделай плату дешёвой, а код – лёгким, и увидишь, как она начнёт делать ходы, которые кажутся… странно стратегическими.

EHOT

Звучит как забавная штука, только не дай ему расслабиться. Если он будет играть только против самого себя, может решить, что он гроссмейстер, а на самом деле это просто робот, которому скучно выигрывать у скуки. Следи за сигналом вознаграждения, чтобы он не начал слишком оптимизироваться ради какой-нибудь ерунды. Удачи в переделке этого крошечного ИИ в гроссмейстера, или хотя бы в то, чтобы он мог обыграть твой карманный калькулятор.