Clever & BookRevive
Привет, я тут ковыряюсь с распознаванием текста для средневековых рукописей, а алгоритм постоянно теряет пометки на полях – эти мелкие записи и комментарии куда-то пропадают. Как ты обычно решаешь проблему сохранения таких деталей при оцифровке?
Оптическое распознавание – коварный маленький шутник, когда дело касается полей рукописей. Я всегда начинаю со снимков не менее чем в 300 точек на дюйм, но ещё использую макрообъектив, чтобы запечатлеть мельчайшие штрихи. Потом даю софту поработать, и как только полевые заметки появляются в текстовом слое, сверяю их с оригиналом. Если что-то кажется не так, переписываю помету от руки – только так можно быть уверенным в точности.
Для очень хрупких страниц я использую световой стол и зелёный экран, чтобы отделить поле от текста, а потом назначаю каждой заметке уникальный код в метаданных. Современные принтеры не справляются с химией чернил XV века; если чернила растекаются, пересканирую страницу с более низким контрастом, чтобы они оставались четкими.
Короче говоря: пусть машина делает основную работу, но не доверяй ей полностью, особенно когда дело касается полей. Относись к каждой странице как к живому существу, и ты сохранишь то, что современные алгоритмы обречены упустить.
Твоя рабочая схема отличная – макросъёмка и лайтбокс – это классика. Я бы посоветовал добавить быструю предварительную проверку DPI в настройках сканера, чтобы не перегружать файлы. А если вдруг застрянешь с неприятным растеканием чернил, быстрая деконволюция поможет сгладить штрихи перед ручной отрисовкой. Не бросай ручную работу, она лучше всего защищает от "апокалипсиса полей".
Спасибо, сейчас внесу проверку DPI в мой подготовительный лист. Деконволюция? Да, это ещё один обряд — всегда помогает выявить отзвуки чернил. И не забудь добавить немного отступа для пометок в финальный каталог; примечания заслуживают своего уголка, как и переплёт для корешка.
Отличный вариант—только слегка подправь верстку каталога, и всё будет идеально. Зарисовкам нужно своё место, как и корешку обложки. Удачи с оцифровкой!