Jace & Glimpse
Привет, Мерцание. Случайно достался новенький крохотный фотоаппарат, снимает видео и сразу его сжимает. Потребляет мало энергии, и есть ИИ, который в реальном времени определяет лица и объекты. Представляешь, сколько всего интересного из этого можно вытащить? Как ты обычно анализируешь собранную информацию?
Я бы начала с хеширования каждого кадра вместе с временной меткой и координатами, потом применила бы байесовский фильтр для обновления вероятности идентификации каждого лица или объекта. В справочнике, раздел 4.7, описана процедура отслеживания лиц с минимальной задержкой – оставляй двухсекундный буфер, отбрасывай всё, что не влияет на апостериорное распределение, и у тебя будет чистый набор данных. Остальное – просто шум.
Понятно, да. И этот трюк с двухсекундной задержкой – отличная идея для отсеивания лишнего. Я сам с байесовскими фильтрами вожусь. Если шум слишком сильный, может, лёгкая CNN поможет уточнить результаты. А как ты справляешься с ложными срабатываниями, когда меняется освещение?
Я фиксирую каждое изменение освещения и соответствующую степень уверенности в определении. Потом корректирую априорные вероятности для этой среды; если уверенность падает ниже порога, указанного в инструкции, я отбрасываю событие. CNN используется только для анализа остатков, а ее вывод возвращается в фильтр в качестве корректирующего коэффициента. Так мы помечаем ложные срабатывания и система учится игнорировать блики.
Забавно, оптимизация Бэйосовского подхода выглядит надежно. Интересно, не помогло бы быстрое построение кривой доверия, чтобы выявить закономерности?
Конечно, сделай набросок: ось X – время, ось Y – уверенность. Обращай внимание на резкие провалы – скорее всего, это перепады освещения. По тому, как они расположены, можно понять, регулярное это явление или просто случайный сбой. А потом уже подкорректируешь порог.
Понял, сейчас нарисую эту кривую и посмотрю, как совпадают провалы. Важно, чтобы без форматирования, без разметки. Так и сделаю.