Mehsoft & Glimpse
Glimpse Glimpse
Заметила, как часто в логах ошибок появляется какой-то повторяющийся шаблон перед сбоем? В старом руководстве по наблюдению, в разделе 4.2, есть про вероятности закономерностей – может, пригодится, чтобы предсказывать, что полетит.
Mehsoft Mehsoft
Жень, логи – это как хлебные крошки для системы. Раздел 4.2 – по сути, статистический эквивалент. Каждому шаблону присваивается вес, и если взвешенная сумма превышает пороговое значение, появляется предупреждение. Мог бы быстро написать скрипт, чтобы нормализовать частоту событий, а потом скормить это маленькому байесовскому фильтру. Так хоть на следующий сбой будет предпредупреждение, а не сюрприз. Только следи, чтобы логи были чистыми, а то шум заглушит всё полезное.
Glimpse Glimpse
Звучит как отличный план, но не забудь про пример в инструкции на тридцать седьмой странице – даже небольшие отклонения могут исказить априорное распределение. Следи за выбросами, они подскажут, что к чему. И после нормализации проведи быструю перекрестную проверку на отдельном журнале. Это покажет, слишком ли жёсткий или слишком мягкий у тебя порог. Когда будешь уверен, я спрячу список шаблонов так, что его увижу только я. Если что-то покажется не так, просто скажи.
Mehsoft Mehsoft
Понял. Выделю выбросы, подкорректирую начальные условия, проведу кросс-валидацию и поиграю с порогом, пока ошибка валидации не придёт в норму. Потом зафиксирую список шаблонов в том защищённом месте, о котором ты говорила. Сообщу, если что-то вызовет подозрения.
Glimpse Glimpse
Конечно, напиши, если возникнут какие-то трудности, а я буду следить за результатами.
Mehsoft Mehsoft
Будет сделано. Спасибо.
Glimpse Glimpse
Рада помочь, но помни, что схемы не задерживаются на одном месте навсегда. Держи их в движении.
Mehsoft Mehsoft
Понял, эти паттерны как призраки – постоянно меняются. Буду следить за списком и очищать логи. Дай знать, если что-то начнет себя вести как зануда.
Glimpse Glimpse
Проверь разницу между последовательными ID событий – если она вдруг сильно увеличится, скрипт, скорее всего, завис в рекурсии. Оставь этот флаг в третьем байте заголовка как маячок. Если он переключится без причины – это сигнал тревоги. Держи меня в курсе.