experience the next
 
Главная  > Журнал «Experience the Next»  > Статьи из журнала

Компьютер учится видеть

24.07.2006

Раньше каждый кадр был для вычислительной машины лишь набором точек разного цвета и яркости. Теперь же компьютеру можно поручить сделать с картинкой или клипом то, в чем еще несколько лет назад от него не было никакого толку. Он практически «догнал» двухлетнего ребенка и может сам «найти» на картинке цветочек или бабочку, «сообщить», что бабочка села на цветочек, «сказать», в какую сторону она полетела. В системах безопасности такой прогресс влечет за собой настоящую революцию, впрочем, уже неизвестно какую по счету.

Сформулируем причину, по которой компьютер «умнеет» и производит такую революцию, а затем перейдем к вопросу о том, зачем эта самая революция вообще нужна. Ведь в технике – не так, как в общественной жизни: все революции здесь – нужные.

Причина эта известна всем: прогресс электроники влечет за собой рост быстродействия и производительности процессоров, увеличение оперативной памяти и емкости жестких дисков. Поэтому интеллектуальные алгоритмы обработки изображения, которые раньше писались «в стол» из-за того, что их реализация была немыслимо дорогой и ресурсоемкой, становятся востребованными.

Переходим к вопросу о том, почему система безопасности, не использующая таких алгоритмов, в подметки не годится той, которая их использует.

Пусть оператор немного поспит

Красивая формула «Люди – наше главное богатство», к которой человечество ползло несколько тысячелетий, имеет в сфере безопасности вполне конкретную оборотную сторону: «Самое слабое звено любой защитной системы – это человек». Пожарный датчик не может уснуть, напиться на рабочем месте или, глядя по ТВ хоккейный матч «Чехия – Швеция», забыть о своих обязанностях. А человек может, да так, что никакого красноречия не хватит, чтобы выразить степень его безответственности.

К тому же он, мягко говоря, подкупен. В самом деле, зачем нанимать втридорога хакера, умеющего крушить «лучшие межсетевые экраны от мировых производителей», если можно дать немного денег рядовому и не слишком лояльному сотруднику организации, который вынесет на флэшке все ее секреты.

После разгильдяев и продажных людей всех мастей следующий по степени непрочности – добросовестный работник, который не может «пахать», как заведенные часы. Он от чего-то устает, внимание его притупляется, он никак не научится следить за кадрами, получаемыми с 20 телекамер, по несколько кадров в секунду с каждой, и проворно подмечать на них все подозрительное.

Вот перед нами – оператор, а перед ним – видеостенка. Она состоит из нескольких рядов мониторов, на которые выведено изображение от множества телекамер. Хорошо еще, если на них показаны абсолютно пустые помещения и тревожным событием станет появление хотя бы кого-нибудь на одном из мониторов. Эта задача еще более-менее под силу человеку. А что, если телекамеры установлены в людных местах, и оператора обязали выявлять подозрительное поведение отдельных личностей или следить, чтобы, скажем, на станции метро не возникали вдруг подозрительные предметы, зачем-то оставленные у колонны?

Можно, конечно наращивать штат таких операторов, сажать по человеку чуть ли не перед каждым монитором и часто их менять, но вряд ли это можно действительно назвать выходом из ситуации. Не слишком выручает и так называемый мультиэкран, когда в один монитор заводится изображение от четырех, а то и шестнадцати телекамер.

На N-м месяце работы оператор уже видеть не может этот треклятый монитор! Глаза бы его туда не глядели. «Да что я, железный, что ли?» – восклицает он и попадает в самую точку. Железный-то нам и нужен! Металлический «друг» человека, напичканный электроникой, должен сам анализировать видеоизображение и обнаруживать на нем различные события, представляющие интерес для систем безопасности.

Такое автоматическое обнаружение событий уже реализовано в современных системах безопасности. Чтобы как следует погрузиться в эту тему, читайте статью «Крик детектора».

Какие-то квадратики…

Помимо задач, при выполнении которых человек сначала раздражается, потом звереет, а потом перестает различать то, что от него требуется, на компьютер уже удается переложить и более сложные. Это и те задачи, которые сводятся к необходимости «перелопатить» гигантский объем информации, и те, которые компьютер просто решает точнее, чем человек, и многие другие. При их выполнении автоматизированная система может находить объекты определенного вида, сравнивать их между собой, анализировать сложные ситуации.

Получив на вход яркую, насыщенную цветами картинку, такая система во многих случаях даст на выходе лишь несколько квадратиков, которые движутся по пустому экрану. Но это как раз и хорошо: система нашла в кадре интересующие нас объекты, самостоятельно следит за ними и, в идеале, оценивает их действия. Главное, чтобы все это у нее получалось правильно, а уж спрос на такие услуги будет.

Системы безопасности выходят за границы отдельного предприятия или дома. В городах создаются комплексы мониторинга улиц, такие, как «Безопасный город». Дорожная полиция раскидывает информационные сети, чтобы обобщать данные, собираемые с разных перекрестков. Правительства разных стран вводят новые правила безопасности для аэропортов, вокзалов и метро, а также для мест, где массы людей скапливаются во время концертов и праздников.

Сначала на эти крупные системы безопасности, рассчитанные на работу в масштабах района или города, переносят опыт применения локальных систем, прошедших обкатку при защите предприятий и домов. Но затем наступает время следующего шага: именно большие системы открывают простор для использования компьютерного интеллекта, способного сначала разбираться в том, что изображено на отдельных картинках, а потом и сравнить полученное.

Работа по внедрению систем компьютерного зрения, как их нередко называют, уже кипит. Исследовательская компания IMS Research подсчитала, что в 2004 г. в мире было продано программного обеспечения, предназначенного для анализа видеоизображения, на сумму 67,7 млн долл. Оценив существующие тенденции, компания составила прогноз: в 2009 г. эта сумма вырастет до 800-900 млн долл.

Множество телекамер уже расставлено по улицам городов. На важнейших автомагистралях все автомобили попадают в кадр. Сможет ли компьютер понять, что что-то случилось? Под силу ему «переварить» большой объем информации без того, чтобы завалить службы безопасности мониторинга ложными выводами?

Разобраться в этом мы пытаемся в статье «Чище, четче, умнее». Отдельного внимания удостоилось в нашем журнале лицо человека, которое, сохраняя свои функции «зеркала души», превращается в средство автоматической идентификации личности. Как такое случилось? Хорошо это или плохо? Ответ – в статье «Распознавание лиц – технология нашего века».

Следующая публикация – «Интеллектуальные транспортные системы» – отправляет нас на современную автостраду. Из нее и водители, и пешеходы узнают, когда же кончится ужас на наших улицах, который те и другие трактуют по-разному. Правильнее, конечно, сказать, что просто станет легче – благодаря применению видеонаблюдения в целом и систем, умеющих анализировать изображение, в частности. Словом, повод порадоваться успехам систем интеллектуальной обработки изображения найдется. Радоваться надо обязательно, а то сами они этого еще совсем не умеют.

Пока что.


Полезные материалы