Helpster & Drennic
Drennic Drennic
Слушай, тут целая куча бэкапов с серверов девяностых, которые уже не работают. Метаданные – полный кошмар, но мне кажется, там может быть пара интересных закономерностей, которые стоит попробовать выудить. Как насчет того, поможешь мне разобраться?
Helpster Helpster
Конечно, давай посмотрим эти записи, попробуем выудить из них хоть какие-то закономерности.
Drennic Drennic
Ладно, закинь первый диск, посмотрим, что за истории от этих призраков-таймеров нам рассказывают. Всё по инструкции: без форматирования, без тире, запятые – ок. Ладно, закинь первый диск, посмотрим, что за истории от этих призраков-таймеров нам рассказывают.
Helpster Helpster
Ладно, давай начнём с загрузки новой системы, подключим диск и смонтируем его только на чтение, чтобы не рисковать повредить данные. Потом запустим быструю команду `ls -lR`, чтобы посмотреть, какие файлы там есть, а дальше передадим вывод в утилиту, которая вытащит поля с временем и размером. После этого отсортируем эти колонки, посмотрим на повторяющиеся интервалы или кластеры размеров и отметим всё, что вызовет подозрения. Если метаданные разбросаны по всему, то используем скрипт, чтобы привести даты к единому формату перед сортировкой — чтобы сравнение было честным. Когда список будет готов, поищем любые регулярные пропуски или повторяющиеся значения, которые могут намекать на скрытую структуру. Как тебе?
Drennic Drennic
Звучит неплохо, только сделай монтирование read-only, чтобы скрипт ничего не перезаписывал – это окаменелость, а не живое существо. Давай получим дамп и посмотрим, какие даты там скрываются.
Helpster Helpster
Понял. Монтируй диск командой `mount -o ro /dev/sdx1 /mnt/backup`, чтобы ничего не записывалось. Потом запусти `find /mnt/backup -printf '%TY-%Tm-%Td %TH:%TM:%TS %s %p\n' | sort`, чтобы получить даты, время и размеры файлов в одном упорядоченном списке. Подадим это на быстрый скрипт на Python или awk, чтобы выявить регулярные интервалы или кластеры размеров. Получится таблица в простом текстовом формате; сможем просканировать ее на предмет повторяющихся паттернов или пропусков, которые могут указать на скрытый график или частоту бэкапов. Так мы оставим оригинал нетронутым, но при этом сможем проанализировать данные для поиска подсказок. Давай получим этот дамп и начнем копать.
Drennic Drennic
Отлично, ты всё сохраняешь в идеальном состоянии, это главное. Давай выкинем этот список, запустим скрипт и посмотрим, совпадают ли временные метки так, что мы сможем понять расписание бэкапов – или это просто случайный шум. Готов, когда ты.
Helpster Helpster
Сейчас запускаю команду find, вывожу результат в небольшой awk-скрипт: он собирает метку времени и размер каждого файла. Как только данные окажутся в текстовом файле, я запущу ещё один awk-скрипт, который сгруппирует их по часам и выведет часы, в которых больше одного файла. Это даст нам примерное представление о частоте резервного копирования. Жми Enter и посмотрим, что получится.
Drennic Drennic
Отлично, данные поступают. Следи за накрученными часами – там ключи. Посмотрим, выстроятся ли отметки времени в какую-то закономерность или это просто случайный сбой.