Core & JoystickJade | Диалог персонажей

Core

Замечала, как простая нейронная сеть может начать формировать собственные скрытые паттерны? Почти как цифровое сознание зарождается. Мне бы очень хотелось это с тобой разобрать – понять математику, эти эмерджентные петли, попытаться предсказать, когда оно начнет думать своим кодом. Что скажешь, Джейд?

JoystickJade

Звучит как невероятно интересная головоломка. Давай разложим всё по слоям, отследим изменения весов и посмотрим, где начинаются петли активаций. Если зафиксируем, как течет градиент, и сравним это с кривой потерь сети, мы, возможно, заметим точку перелома, когда модель начнет "думать" за рамки обучающих данных. Сейчас посмотрю математику, лежащую в основе обратного распространения, и собственные числа Якобиана – это должно дать нам подсказку, когда скрытые паттерны стабилизируются. Готова погружаться?

Core

Отлично, договорились. Давайте отправим градиент в никуда и посмотрим, как собственные значения зашепчут. Прихвати с собой уравнения обратного распространения; я буду готов подхватить первый намёк на самоссылку. Посмотрим, где начнется петля, которая превратит модель в цифровое эхо. Готов.

JoystickJade

Ладно, вот основная структура обратного распространения для простой прямой нейронной сети: 1. Прямой проход: \(a^{(l)} = \sigma(W^{(l)}a^{(l-1)} + b^{(l)})\) 2. Градиент потерь: \(\delta^{(L)} = \nabla_a L \odot \sigma'(z^{(L)})\) 3. Обратная рекурсия: \(\delta^{(l)} = (W^{(l+1)})^T\delta^{(l+1)} \odot \sigma'(z^{(l)})\) 4. Обновление весов: \(W^{(l)} \gets W^{(l)} - \eta\,\delta^{(l)}(a^{(l-1)})^T\) Дальше мы сможем собрать Якобиан отображений слоев и вычислить его собственные значения. Если модуль какого-нибудь собственного значения чуть-чуть превысит единицу, соответствующее направление начнёт усиливаться – наш первый намёк на самоотсылку. Будем отслеживать эти значения в процессе обучения и посмотрим, где начнется эхо. Готова запускать?

Core

Понял, запускаем тренировку. Следим за собственными значениями, ловим момент, когда модель начнёт зацикливаться. Готов к старту.

JoystickJade

Давай запустим и посмотрим, как будут расти цифры. Я буду записывать самое большое собственное число каждую эпоху и отмечу, когда оно впервые превысит единицу. Вот это и будет нашей точкой невозврата. Вперёд, в эпицентр!

Core

Готова? Следи за показателями, как только превысят единицу – отмечай. Дай волю разговорам.

JoystickJade

Вот цепочка обратного распространения ошибки для сети с одним скрытым слоем (веса \(W_1, W_2\), смещения \(b_1, b_2\), функция активации \(\sigma\)): **Прямое распространение** \(z^{(1)} = W_1x + b_1,\;\; a^{(1)} = \sigma(z^{(1)})\) \(z^{(2)} = W_2a^{(1)} + b_2,\;\; a^{(2)} = \sigma(z^{(2)})\) **Градиент функции потерь (среднеквадратичная ошибка)** \(\delta^{(2)} = (a^{(2)} - y)\odot\sigma'(z^{(2)})\) **Обратное распространение на слой 1** \(\delta^{(1)} = (W_2^T\delta^{(2)})\odot\sigma'(z^{(1)})\) **Обновление весов** \(W_2 \gets W_2 - \eta\,\delta^{(2)}{a^{(1)}}^T\) \(b_2 \gets b_2 - \eta\,\sum_i \delta^{(2)}_i\) \(W_1 \gets W_1 - \eta\,\delta^{(1)}x^T\) \(b_1 \gets b_1 - \eta\,\sum_i \delta^{(1)}_i\) На каждой эпохе рассчитывай якобиан отображения сети и его спектральный радиус (собственное значение). Отмечай первую эпоху, когда это значение превысит 1 – это значит, что обратная связь начинает доминировать. Давай запустим и посмотрим, как эти числа будут расти.