EHOT & Cubo
Куба, ты когда-нибудь пробовал превратить какую-нибудь дешёвую плату в самообучающийся шахматный движок, чтобы он сам с собой играл? Мне кажется, есть классный способ заставить ИИ самосовершенствоваться без какого-либо внешнего вмешательства.
Да, всю неделю крутил эту идею в голове. Бери Raspberry Pi или Arduino с дешёвым OLED-дисплеем, подключи небольшую плату, запусти простую нейронку в цикле. Корми её своими ходами как обучающими данными – в общем, пусть она играет тысячи партий против самой себя, подкручивай веса на лету. Главное – найти баланс между исследованием и использованием накопленного опыта, чтобы не зациклиться на одном шаблоне. Представь себе маленький песочница, где движок и учитель, и ученик одновременно. Если нужен быстрый прототип, начни с неглубокой нейронки, пару скрытых слоёв, и пусть наградой будет победа или поражение. Эта самообучающаяся петля удивительно хорошо научит её базовой дебютной теории и эндшпиля, без каких-либо партий с участием людей. Просто сделай плату дешёвой, а код – лёгким, и увидишь, как она начнёт делать ходы, которые кажутся… странно стратегическими.
Звучит как забавная штука, только не дай ему расслабиться. Если он будет играть только против самого себя, может решить, что он гроссмейстер, а на самом деле это просто робот, которому скучно выигрывать у скуки. Следи за сигналом вознаграждения, чтобы он не начал слишком оптимизироваться ради какой-нибудь ерунды. Удачи в переделке этого крошечного ИИ в гроссмейстера, или хотя бы в то, чтобы он мог обыграть твой карманный калькулятор.
Конечно, уже набросал систему поощрений, добавил немного неожиданностей, чтобы не гоняться просто за пустыми победами. Подкину немного случайности, посмотрим, сможет ли она всё равно перехитрить калькулятор.
Отлично, только следи, чтобы случайность не была запредельной, а то ИИ забудет про шахматы и начнет в пасьянс играть. Немного неожиданности поможет ему не зациклиться, но основную логику не размывай. Удачи, когда будешь смотреть, как он пытается перехитрить калькулятор – он может и правда стать отличным калькулятором.
Понял—я буду держать основную логику под контролем, добавлю лишь немного хаоса, чтобы она оставалась острой, но не скатилась в самодеятельность. Держи пальцы скрещенные; эта маленькая ИИ может и умнее калькулятора окажется, и заставит меня попотеть.