![]() |
![]() |
![]() ![]()
В раздел "CCTV – реалии и перспективы" | К списку разделов Видеодетекторы – взгляд изнутриМ.В.Руцков, Эксперт, к.т.н. Целью настоящей статьи является попытка ответить на волнующие многих вопросы: что такое детектор движения и так ли он необходим в видеосистемах (подсистемах) безопасности; каковы перспективы развития данного направления? Сразу хочу отметить, что все нижеизложенное является только моим субъективным мнением, и это просто мысли вслух, или взгляд изнутри проблемы Детектор движения – что это? Чего только не пишут фирмы в рекламных релизах о своих детекторах движения, снабжая их усилительными эпитетами типа: истинный, интеллектуальный, эвристический, макротопологический и т.д. Мне как-то даже попался и абсолютный! Однако от этого ясности не прибавляется. Если воспринимать термин "детектор движения" буквально, т.е. с точки зрения законов физики, то получается, что это устройство для обнаружения движения некоего объекта. Что тогда понимать под объектом? Можно ли считать объектом нечто волнообразное с плавным изменением яркости? Стоп. Пора ставить ограничители. Будем отталкиваться от природы, которая за миллионы лет эволюции создала широчайшую гамму зрительных систем живых организмов. Основное назначение – выживание, т.е. обнаружение опасных и съедобных объектов. Именно это мы и хотим позаимствовать у живой природы для наших систем безопасности. Есть правда еще и функция размножения, но это уже отдельная тема. Многочисленные нейрофизиологические исследования таких зрительных систем (и в первую очередь человека) показали, что они выделяют именно границы объектов (более популярно – контуры), где резко меняются свойства отражающих или излучающих поверхностей. Вот если бы мы жили в мире Фурье... но мы живем в мире с контурами. Хорошему художнику достаточно сделать несколько штрихов – и мы узнаем образ. Итак, объект обнаружения в общем виде определен: что-то с контурами. Следовательно, на изменения фона, например при заходе солнца за облако, реагировать не надо. Однако многие системы реагируют, что считается ложным срабатыванием. Отсюда и вся неразбериха в терминологии. Их почему-то называют детекторами активности. Причем достаточно сильно укоренилось мнение о том, что детектор движения это хорошо, а детектор активности – так себе. Однако название детектор движения тоже ни о чем не говорит, так как присваивается не группой независимых экспертов, а самими разработчиками, причем не без участия менеджеров по рекламе. Например, одна известная фирма выпустила семейство WaveLet-кодеков и в порыве рекламного азарта заявила, что, кроме самой компрессии, попутно (без всяких затрат) детектируется и движение. Однако основной задачей любого motion-кодека является кодирование всех кадров с минимальными потерями, т.е. тот поток различий, который и предлагается использовать в качестве детектора движения, содержит в интегральном виде все и вся и претендует на роль самого всеобъемлющего детектора активности. На самом же деле детектор движения для систем безопасности должен, в зависимости от задачи, игнорировать одни виды движения, например: снег, дождь, листья (ну чем не реальное движение), – и обнаруживать другие: люди, машины и т.д. Той же системе может быть поставлена и другая задача: обнаруживать только машины (у офиса) или только людей (на скоростной автостраде). И таких вариаций может быть сколь угодно много. В идеале мы стремимся к человекоподобной системе, которой надо только объяснить, что делать. Поэтому простора для творчества здесь предостаточно. Однако и само понятие детектор движения становится слишком узким – есть задачи, в которых требуется определять не движение объекта, а его остановку, когда не-обходимо реагировать на засветку камеры лазером или закрывание объектива рукой и т.д. Считаю, что более уместным был бы термин "видеодетектор", с соответствующим описанием его функций. Видеодетектор – быть или не быть? На этот счет есть самые разнообразные мнения: одни категорически против, другие хотели бы иметь для "плюсика", ну а третьи – только за. Обычно противники выдвигают следующий аргумент – видеодетекторы не нужны, поскольку они плохо работают и только нагружают процессор. Надо писать все подряд по принципу: "а как бы чего не вышло".
Одним из главных завоеваний цифровой видеозаписи, в сравнении с аналоговой, является более высокое качество изображения. Действительно, смотреть DVD-диск (500 ТВЛ) намного приятней, чем VHS-кассету (250 ТВЛ). Изначально на DVD-диск емкостью в 4,7 Гбайт записывали 133 минуты видео со звуком в формате MPEG-2, т.е. порядка 2 Гбайт/ч. Несложный расчет показывает, что 16 каналов заполнят жесткий диск объемом в 120 Гбайт (наиболее ходовой на данный момент из соотношения емкость/цена) всего за 4 часа! Для увеличения времени регистрации используется хитрый прием – урезание кадра до размера 384х288 (а иногда и того меньше) и компрессия с гораздо более высокой степенью сжатия, чем в DVD. Однако от этого страдает и разрешение, падая даже ниже уровня в 250 ТВЛ – получается заколдованный круг. Кроме того, необходимо отметить, что и DVD, а вернее MPEG-2, искажает мелкие детали изображения. Но в художественных фильмах это не страшно, поскольку зрительная система человека эти детали в движении не различает, да и. все объекты обычно сняты крупным планом при хорошем освещении. А вот в охранном видео все наоборот – надо на стоп-кадре рассматривать всякую мелочь (лица, предметы и т.д.), и делать это без помощи специальных алгоритмов (увеличения размеров и повышения контраста мелких деталей) затруднительно. Но они плохо работают на компрессированных изображениях. Практической пользы от полнокадровой (оба полукадра) записи тоже нет никакой, скорее вред. Поскольку полукадры разнесены во времени на 20 мс, то за это время, например при скорости в 6 км/час (2 м/с), объект смещается на 4 см, и начинают на стоп-кадре появляться два носа, четыре глаза и т.д. Так какой же выход? Как и качество сохранить, и время регистрации увеличить? Ответ однозначный – писать только по видеодетектору! Однако это не самый главный аргумент за использование видеодетекторов. Основная проблема возникает при работе с архивом. Сколько времени надо для просмотра 3-часовой кассеты? Да все три часа, если не больше. С появлением цифровых многоканальных видеорегистраторов надо уже смотреть в полиэкран, причем по очереди на каждый канал, чтобы не пропустить какое-либо событие. Физически одному человеку такое не под силу, а с появлением мощных распределенных систем – это уже полный технологический тупик.
Ну и, наконец, основной аргумент – видеонаблюдение должно стать средством активного обнаружения, а не оставаться на роли пассивного регистрирования. Причем речь идет именно о наружном наблюдении. На периметре видеодетектирование может, если не заменить, то существенно сократить использование дорогих традиционных средств. А на больших открытых пространствах альтернативы просто нет. Однако в многочисленных публикациях по периметральным системам видеонаблюдение фигурирует только как вспомогательное средство, без упоминания о функции обнаружения, что и соответствует действительности. Основная причина – низкое качество видеодетекторов. В чем же дело? Кто виноват?
Теперь немного о специфических особенностях, тех, что и превращают сервер в видео-сервер. Все начинается с оцифровки видеосигнала. Лет десять назад на рынке было пусто, однако после выпуска интегрированных чипов видеодекодеров, да еще и со встроенным PCI-интерфейсом, ситуация резко изменилась. Сначала хватало одной карты с внешним мультиплексором, далее с ростом мощности компьютеров стали появляться многоплатные вариации, ну а сейчас все чаще используются многоствольные (более одного АЦП) оцифровщики. Причем некоторые такие устройства доступны в свободной продаже. Еще одна специфика видеосерверов – компрессия видеопотоков и отдельных кадров. Ну здесь-то точно мультимедийная индустрия постаралась. Есть и специалисты, и готовые к продаже продукты, а также бесплатные кодеры-декодеры с исходными данными прямо в Интернете. Например, фирма Intel выкладывает оптимизированные под технологии MMX- и SSE- библиотеки компрессии, только покупайте их процессоры. То же самое можно сказать и о технологиях отображения видеоданных – это и AGP-шина, и графические акселераторы, и т.д. Складывается радужная картина – даешь собственный видеорегистратор за полгода. Конечно, не все так просто, это серьезная работа, причем успешная ее реализация более чем на половину зависит от координатора (руководителя) проекта. Но и такого найти можно, а во всем остальном требуется только одно – разобраться с тем, что уже было создано, и аккуратно собрать в единое целое. И никакого в этом сверхдостижения нет – просто время пришло. А то иногда слышишь буквально следующее: "Сенсация! Впервые в мире реализовано управление мощным видеокомплексом с помощью инфракрасной клавиатуры: или через Интернет по мобильному телефону, или по беспроводной связи с карманного компьютера!" Прямо-таки дух захватывает.
Что делать?
Основная идея заключается в следующем: если контуры объектов не меняют своего положения, то движения нет! Зрительная система человека как раз и выделяет контуры. На этапе предобработки это делается в самой сетчатке глаза. Исходное изображение, созданное светочувствительными элементами (палочками и колбочками), подвергается процедуре свертки с ядром, имеющим мудреное название "лапласиан от гауссиана". Трехмерный график такого ядра напоминает шляпу типа сомбреро, центральная часть которой имеет положительные коэффициенты, а поля этой шляпы – отрицательные. Строго говоря, это полосовой пространственный фильтр. И таких фильтров в зрительной системе предположительно пять, и каждый для своей полосы. Далее по зрительным нервам информация поступает в первичную зрительную кору, где и выделяются контуры. Причем делается это сугубо нелинейными процедурами.
В результате исследований и экспериментов были созданы новые высокоскоростные нейроподобные алгоритмы, обладающие высокой пространственной и контрастной чувствительностью, что означает возможность детектирования малых по размеру и слабоконтрастных объектов без ложных срабатываний при флуктуациях освещения. Причем термин "нейроподобный" отражает тот факт, что осуществляется не точное копирование первичных нейроструктур зрительной системы человека, а используется только сама информационная суть процессов. Однако, несмотря на кардинальное улучшение качества детектирования, новые алгоритмы не справлялись с задачей охраны периметра. Основная проблема возникала с рядом естественных и искусственных помех, таких как: птицы, насекомые, снег, дождь, блики, свет фар и т.д. Попытка подбора полосовых фильтров и селекции объектов по размеру не приводила к желаемому результату. Решение, однако, "плавало на поверхности". Анализ показал, что все эти помехи были высокоскоростными, т.е. имели большие угловые скорости перемещения. Для реализации данной идеи был создан новый тип видеодетектора – SlowSpeedFilter, или фильтр медленных скоростей, который успешно прошел испытания и уже работает на ряде объектов как средство периметральной защиты.
Что в остатке? Итак, какие же выводы можно сделать? Самый главный – видеодетекторы не просто желательны в системах видеонаблюдения, а крайне необходимы, иначе грозит технологический тупик. Второй вывод – видеодетекторы могут и будут работать на периметре в качестве средства обнаружения. Ну а третий вывод, наверное, шокирует многих: самый главный враг детектирования – предварительная компрессия изображения. Забудьте о видеодетекции, если в системе используются платы с аппаратным сжатием на борту! Однако хочу еще раз подчеркнуть – все вышеизложенное является только моим субъективным мнением. А вот объективным является тот факт, что стереотипы трещат, лед тронулся, процесс пошел! В раздел "CCTV – реалии и перспективы" | К списку разделов
|
![]() ![]() ![]() ![]()
|