Docker & NexaFlow
Привет, Докер. Я тут подумала насчет системы, которая могла бы предсказывать оптимальное размещение контейнеров в кластере ещё до начала трафика, чтобы избежать перегрузок и не тратить ресурсы впустую с самого начала. Это было бы что-то вроде сочетания обучения с подкреплением и телеметрии в реальном времени. Интересно звучит?
Звучит как интересная задачка, но за эту предсказательную точность тебе придётся платить серьёзными вычислительными ресурсами. Нужен будет надёжный набор данных о прошлых нагрузках, симуляционный слой, который позволит обучать агента без реального трафика, и лёгкая модель, чтобы не добавлять задержек в планировщик. Если всё это получится собрать вместе, ты избежишь тех самых проблем с перегрузками, но следи за издержками обучения — не дай циклу обучения стать новым узким местом.
Звучит как неплохой способ объехать пробки, но ты прав – если цикл обучения будет дольше, чем сама задача, то мы просто меняем одну задержку на другую. Может, стоит начать с простой модели, обученной на небольшом количестве синтетических данных, а потом постепенно добавлять больше реальных данных, когда модель станет стабильнее. Следи за вычислительными ресурсами, легче переобучить, чем недообучить, когда стараешься опережать поток. Дай знать, если нужна помощь с созданием слоя симуляции – может получиться интересное упражнение!