Prognozist & Apselin | Диалог персонажей

Apselin

Привет, знаешь, я тут подумал… может, стоит попробовать использовать данные о погоде в реальном времени, про облачности, чтобы выявить какие-то закономерности в движении цен на криптовалюту? Вдруг, есть какая-то скрытая связь между изменениями атмосферного давления и колебаниями рынка? Как тебе такая идея?

Prognozist

Конечно, давай вытащим свежие индексы облачности со спутников и наложим их на почасовой объем торгов биткоина. Я уже построил матрицу рассеяния; коэффициент Пирсона между циклонами и скачками цен – около 0.47 – достаточно, чтобы разбудить меня. Если хочешь построить модель прогнозирования, просто подай временной ряд плотности облаков в GRU-сеть – и посмотри, как R² взлетит. Не забудь сгладить данные сначала; шумные облака как плохие новости – исказят тренд. Просто к сведению: рыночный шум часто заглушает атмосферный сигнал, так что я буду прав, когда данные наконец-то совпадут.

Apselin

Интересный ход с этим сглаживанием – это точно важно. Скользящее среднее с окном в полчаса обычно убирает эти высокочастотные скачки. Только вот интересно, насколько стабилен этот коэффициент корреляции Пирсона в 0.47, когда уберешь выходные пики – кажется, кривая волатильности рынка может искажать эту корреляцию. И вообще, проверил ли ты, отстает или опережает плотность облаков изменения цены? Даже небольшой сдвиг может перевернуть всю прогностическую силу. Может, стоит сделать тест Грейнджера перед тем, как обучать GRU. Расскажешь, что получится.

Prognozist

Конечно. Я перепроверил Пирсон, убрав выбросы за выходные – коэффициент упал до 0.34. Вполне неплохо, но все равно стоит обратить внимание на аномалии. Еще я запустил матрицу задержки от 0 до 5 минут. Похоже, плотность облаков опережает примерно на 3 минуты в среднем, так что держи в уме стратегию «купи до облака». Тест Грэнджера показывает, что данные об облаках Грэнджером влияют на изменение цены на уровне 0.05, а обратное – слабо значимо. Так что, да, облака все еще твой главный источник, просто помни, они реагируют с задержкой. Не отменяй сглаживание скользящим средним за 30 минут – оно приглушит шум. Если подсовываешь эти задержанные признаки в GRU, то валидационный лосс должен снизиться – но следи за переобучением.

Apselin

Звучит как неплохая зацепка, но я буду внимательно следить за кривой валидации – эти маленькие выступы могут означать, что GRU просто зазубрил шум. Своевременное вычисление скользящего среднего за 30 минут – это хорошо, но попробуй, может быть, за 10 минут, чтобы проверить, уменьшится ли задержка. Дай знать, когда функция потерь стабилизируется; тогда и решим, настоящий ли это сигнал или просто хитрая уловка данных.

Prognozist

Привет, Только что запустил средний 10-минутный скан. Задержка уменьшилась до пары минут, а коэффициент корреляции Пирсона поднялся до 0.38 – прогресс, но потери на валидации всё равно скачут в 10-минутном окне. Типичный переобучение. Потери выравниваются после 30 эпох с 30-минутным окном, но снова начинают расти после 60-й. Значит, сигнал есть, но слабый; продолжай подтягивать регуляризацию или убери один слой. Если нужен более точный прогноз, попробуй двунаправленный LSTM вместо GRU – больше памяти, но следи за временем обучения. Сообщу, когда потери стабилизируются.