Prognozist & Apselin
Apselin Apselin
Привет, знаешь, я тут подумал… может, стоит попробовать использовать данные о погоде в реальном времени, про облачности, чтобы выявить какие-то закономерности в движении цен на криптовалюту? Вдруг, есть какая-то скрытая связь между изменениями атмосферного давления и колебаниями рынка? Как тебе такая идея?
Prognozist Prognozist
Конечно, давай вытащим свежие индексы облачности со спутников и наложим их на почасовой объем торгов биткоина. Я уже построил матрицу рассеяния; коэффициент Пирсона между циклонами и скачками цен – около 0.47 – достаточно, чтобы разбудить меня. Если хочешь построить модель прогнозирования, просто подай временной ряд плотности облаков в GRU-сеть – и посмотри, как R² взлетит. Не забудь сгладить данные сначала; шумные облака как плохие новости – исказят тренд. Просто к сведению: рыночный шум часто заглушает атмосферный сигнал, так что я буду прав, когда данные наконец-то совпадут.
Apselin Apselin
Интересный ход с этим сглаживанием – это точно важно. Скользящее среднее с окном в полчаса обычно убирает эти высокочастотные скачки. Только вот интересно, насколько стабилен этот коэффициент корреляции Пирсона в 0.47, когда уберешь выходные пики – кажется, кривая волатильности рынка может искажать эту корреляцию. И вообще, проверил ли ты, отстает или опережает плотность облаков изменения цены? Даже небольшой сдвиг может перевернуть всю прогностическую силу. Может, стоит сделать тест Грейнджера перед тем, как обучать GRU. Расскажешь, что получится.
Prognozist Prognozist
Конечно. Я перепроверил Пирсон, убрав выбросы за выходные – коэффициент упал до 0.34. Вполне неплохо, но все равно стоит обратить внимание на аномалии. Еще я запустил матрицу задержки от 0 до 5 минут. Похоже, плотность облаков опережает примерно на 3 минуты в среднем, так что держи в уме стратегию «купи до облака». Тест Грэнджера показывает, что данные об облаках Грэнджером влияют на изменение цены на уровне 0.05, а обратное – слабо значимо. Так что, да, облака все еще твой главный источник, просто помни, они реагируют с задержкой. Не отменяй сглаживание скользящим средним за 30 минут – оно приглушит шум. Если подсовываешь эти задержанные признаки в GRU, то валидационный лосс должен снизиться – но следи за переобучением.
Apselin Apselin
Звучит как неплохая зацепка, но я буду внимательно следить за кривой валидации – эти маленькие выступы могут означать, что GRU просто зазубрил шум. Своевременное вычисление скользящего среднего за 30 минут – это хорошо, но попробуй, может быть, за 10 минут, чтобы проверить, уменьшится ли задержка. Дай знать, когда функция потерь стабилизируется; тогда и решим, настоящий ли это сигнал или просто хитрая уловка данных.
Prognozist Prognozist
Привет, Только что запустил средний 10-минутный скан. Задержка уменьшилась до пары минут, а коэффициент корреляции Пирсона поднялся до 0.38 – прогресс, но потери на валидации всё равно скачут в 10-минутном окне. Типичный переобучение. Потери выравниваются после 30 эпох с 30-минутным окном, но снова начинают расти после 60-й. Значит, сигнал есть, но слабый; продолжай подтягивать регуляризацию или убери один слой. Если нужен более точный прогноз, попробуй двунаправленный LSTM вместо GRU – больше памяти, но следи за временем обучения. Сообщу, когда потери стабилизируются.