Bancor & Sealoves
Привет. Я тут копаюсь с моделью для предсказания циклов цветения планктона, и постоянно вижу параллели с волатильностью на рынке. Хочешь вместе посмотрим на данные? Может, общая платформа поможет нам обоим делать более точные прогнозы?
Конечно, сейчас поищу свой полевой дневник и таблицу с данными о планктоне прошлой весны. Там у меня есть столбец с данными о хлорофилле, который скачет, как косяк сардин в потоке. Если мы сможем сопоставить это с данными S&P, может, найдем какую-то закономерность. Приноси свой код, а я принесу графики рассеяния в виде водорослей. С нетерпением жду нашего межотраслевого "столкновения"!
Звучит отлично. Сейчас подготовлю последнюю версию модели, которую я использовал для S&P, и настрою её так, чтобы мы могли напрямую сопоставить временные метки с твоими данными по хлорофиллу. Скажи, если тебе понадобятся какие-нибудь скрипты для предварительной обработки данных о планктоне.
Отлично! Я уже подготовила данные о хлорофилле, разделив их на 5-минутные интервалы и убрав все пропуски, которые могли бы запутать модель. Просто пришли мне временные метки S&P и любые столбцы с признаками, которые тебе кажутся важными, и я сведу их с моей серией данных о планктоне. Если тебе понадобится небольшой скрипт, чтобы убрать нули или нормализовать значения, просто скажи – в моих заметках указано, что наилучший результат дают значения, центрированные относительно среднего. Давай созвонимся и посмотрим, какие волны мы сможем поймать вместе!
Конечно, сейчас же отправлю тебе данные S&P 500 за тот же период, что и у тебя с хлорофиллом. Вытаскиваю такие колонки: время, цена открытия, максимум, минимум, цена закрытия, объем, дневная доходность, скользящая средняя за 5 минут и волатильность за 5 минут. Если нужны значения, центрированные или нормализованные, просто скажи, добавлю этот шаг. Как только выровняешь временные метки, сможем подавать согласованные ряды в ту же регрессионную модель, которую ты используешь для планктона. Если что еще нужно, говори.
Звучит отлично! Просто добавлю столбцы с хлорофиллом и S&P в мой регрессионный скрипт – в заметках указано, что нужно стандартизировать оба набора, чтобы коэффициенты не были искажены масштабом. Если у тебя есть версия с центрированием по среднему – будет вообще идеально, упростит вычисления. И ещё, если можно добавить простой лаг для волатильности за пятиминутный период – думаю, это поможет предсказывать всплески планктона. Не забудь отметить столбец с отметками времени в UTC, у меня в полевом дневнике местное время, а то будет двойная ошибка. Посмотрим, совпадает ли ритм океана с пульсом рынка – если совпадёт, может, дельфины, наконец, предугадают следующий сбой сервера!
Конечно, вот небольшой фрагмент, который ты можешь добавить в начало скрипта, чтобы и серии были центрированы по среднему, и чтобы учесть пятиминутную задержку для скользящей волатильности. Я оставил временные метки в UTC и использовал простую задержку в один период для волатильности.
Это должно дать тебе приличный набор предикторов. Дай знать, как будет выглядеть подгонка, и действительно ли задержка волатильности работает как фактор, предсказывающий цветение.
Этот фрагмент выглядит отлично — отличная работа с временными метками UTC, чтобы избежать проблем с часовыми поясами. Небольшой совет: если ты хочешь убедиться, что отстающая волатильность действительно предсказывает содержание хлорофилла, попробуй вычислить взаимную корреляцию с запаздыванием от 0 до 3. Задержка в 5 минут покажет немедленную реакцию, но иногда задержка в 10 минут даёт более чёткую картину того, как планктон реагирует на рыночное давление. И сохрани копию необработанных, ненормализованных данных на отдельном листе — она пригодится для проверки и для тех, кто предпочитает абсолютные значения. Как только запустишь регрессию, напиши мне R² и какие-нибудь неожиданные знаки коэффициентов — вдруг найдём новый способ предсказания приливов, спрятанный в данных S&P!