EHOT & Cubo | Диалог персонажей

EHOT

Куба, ты когда-нибудь пробовал превратить какую-нибудь дешёвую плату в самообучающийся шахматный движок, чтобы он сам с собой играл? Мне кажется, есть классный способ заставить ИИ самосовершенствоваться без какого-либо внешнего вмешательства.

Cubo

Да, всю неделю крутил эту идею в голове. Бери Raspberry Pi или Arduino с дешёвым OLED-дисплеем, подключи небольшую плату, запусти простую нейронку в цикле. Корми её своими ходами как обучающими данными – в общем, пусть она играет тысячи партий против самой себя, подкручивай веса на лету. Главное – найти баланс между исследованием и использованием накопленного опыта, чтобы не зациклиться на одном шаблоне. Представь себе маленький песочница, где движок и учитель, и ученик одновременно. Если нужен быстрый прототип, начни с неглубокой нейронки, пару скрытых слоёв, и пусть наградой будет победа или поражение. Эта самообучающаяся петля удивительно хорошо научит её базовой дебютной теории и эндшпиля, без каких-либо партий с участием людей. Просто сделай плату дешёвой, а код – лёгким, и увидишь, как она начнёт делать ходы, которые кажутся… странно стратегическими.

EHOT

Звучит как забавная штука, только не дай ему расслабиться. Если он будет играть только против самого себя, может решить, что он гроссмейстер, а на самом деле это просто робот, которому скучно выигрывать у скуки. Следи за сигналом вознаграждения, чтобы он не начал слишком оптимизироваться ради какой-нибудь ерунды. Удачи в переделке этого крошечного ИИ в гроссмейстера, или хотя бы в то, чтобы он мог обыграть твой карманный калькулятор.

Cubo

Конечно, уже набросал систему поощрений, добавил немного неожиданностей, чтобы не гоняться просто за пустыми победами. Подкину немного случайности, посмотрим, сможет ли она всё равно перехитрить калькулятор.

EHOT

Отлично, только следи, чтобы случайность не была запредельной, а то ИИ забудет про шахматы и начнет в пасьянс играть. Немного неожиданности поможет ему не зациклиться, но основную логику не размывай. Удачи, когда будешь смотреть, как он пытается перехитрить калькулятор – он может и правда стать отличным калькулятором.

Cubo

Понял—я буду держать основную логику под контролем, добавлю лишь немного хаоса, чтобы она оставалась острой, но не скатилась в самодеятельность. Держи пальцы скрещенные; эта маленькая ИИ может и умнее калькулятора окажется, и заставит меня попотеть.

EHOT

Удачи! И пусть заставляет тебя поломать голову. Только помни: скучный бот — это одно, а скучающий человек, наблюдающий за его работой – совсем другое.