Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр

Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр Аналитика

Что это значит?

Начинайте ролик с самого важного и интересного. Не нужно подводить к теме 2 минуты. 

Если в ролике вы будете нырять в бассейн, который кишит пираньями – покажите этот момент сразу. Сделайте 5-10 секундный тизер из последней части ролика. И лишь после этого вы начнете вступление, где расскажете, как вам пришла в голову эта идея, где вы взяли столько рыбы и тд

В нашем случае познавательных видео с фактами я вообще отказалась от вступлений. Видео называется «Что едят на завтрак в разных странах мира?» Ок. Мы сразу начинаем с первой страны. Время- ценный ресурс. Зрители хотят получить ту информацию, из-за которой они кликнули на превью.

Следующая вкладка Reach или просмотры. И в первую очередь нас интересует показатель СTR (Click through rate). Переводя на русский – насколько эффективная ваша превью картинка. В каком проценте случаев зрители кликали на ролик, когда он попадал к ним в рекомендации или на главную страницу?

И это тот показатель в аналитике, который сложно переоценить. Вы  можете сделать прекрасное интересное видео и его никто не посмотрит. Просто потому, что ваша превью картинка – плохая, неинтересная, не интригующая, непонятная. 

Вот для примера 2 превью картинки. На какую вам хочется кликнуть больше?

Даже если вы сами не можете определиться, вам на помощь придет Ютуб. С первых же минут, когда видео опубликовано в Аналитике, появляются первые данные, в том числе и по эффективности превью.

Если просмотры уже в первые минуты ниже, в среднем, чем у других роликов на канале, то скорее всего дело в превью. Именно поэтому многие блогеры перед выкладкой ролика готовят 2 или 3 варианта превью картинки. Их можно поменять несколько раз и посмотреть, на что кликают больше, у какой картинки процент CTR выше.

Видео «Что едят на завтрак в разных странах мира?» Поначалу собирало просмотры в среднем хуже, чем другие ролики на канале. 

И если внимательно посмотреть на график, то можно заметить, что превью (номер 1), которое изначально стояло на видео обладало кликабельностью в 2%. Через пару дней мы изменили превью на вариант номер 2 и кликабельность выросла до 4-5%. И только после этого видео стало активно набирать просмотры и в итоге собрало больше миллиона, что является показателем выше среднего для канала.

Законы кликабельного превью просты.

1. Оно долго быть понятным. 

Большинство зрителей потребляет Ютуб контент на телефоне (метрика девайсов, с которых идут просмотры также есть в аналитике, но о ней в другой раз). Некоторые авторы почему то считают, что их превью будут смотреть исключительно на огромном плазменном экране. Поэтому они размещают там маленький шрифт или много маленьких объектов, которые на телефоне просто смешиваются в кашу.

Итог – зрители не кликают. 

2. Понимайте своего зрителя.

У нас, как и большинства крупных каналов, превью картинки делают дизайнеры. Однако, дизайнеру нужно четко формулировать ТЗ. Иначе вы получаете ситуацию, когда у половины Ютуб каналов – примерно одинаковая стилистика ярких разноцветных превью, сделанных в фотошоп, обязательно с контурным светом.

Идеальным отличительным фактором является лицо автора. Если у вас его нет – ищите другие выходы. Шрифт, цвет, аватар – все что угодно. 

3. Превью картинка должна интриговать и заинтересовывать. В этом вся ее суть. 

«Кликбейт» или введение в заблуждение зрителей – не пройдет. Размещая на превью завлекательную картинку, которая не соответствует содержанию, вы не добавите просмотров. Люди, возможно, будут кликать активнее, но продолжительность просмотра будет низкой, и алгоритмы не будут рекомендовать ролик. Кроме того, ложные картинки – это нарушение правил платформы.

И, конечно же, правило номер один в создании успешного видео – знать интересы своей аудитории. Будь у вас тысяча подписчиков или миллион – алгоритм Ютуб работает по похожей схеме. Сначала распространяет ролик среди вашей аудитории в рекомендациях или уведомлениях. Затем, в зависимости от интереса и активности аудитории, начинает выдавать его новым зрителям.

Все эти правила я вывела на основании личного опыта. Канал MOGOL TV я продюсирую уже 7 лет. За это время сделано множество ошибок в производстве и продвижении роликов. Однако, все они стали тем фундаментом, который позволил построить канал на 5 миллионов подписчиков без вложений.

Ютуб Аналитика  – огромная тема. Существует «миллион» метрик – как для каждого отдельного ролика, так и для канала в целом. Я показала лишь верхушку Айсберга. Но это те знания, за которые я готова была дорого заплатить 7 лет назад. 

Если верить в теорию о правом и левом полушарии мозга, то сегодня для успеха на Ютуб необходимо использовать оба. 

Творите и анализируйте. Затем снова творите и снова анализируйте. Только так делаются Ютуб проекты с миллионами подписчиков. 

2022: на рынке видеоаналитики слишком много маркетинга

Научные исследования в области компьютерного зрения и искусственного интеллекта ведутся в России с 2000-х годов на базе исследовательских центров и нескольких крупных университетов.

В России до недавних пор алгоритмы видеоаналитики применялись в основном для детектирования событий, подсчёта посетителей, распознавания опасных предметов и идентификации лиц с целью обеспечения безопасности на различных объектах: охраняемых территориях, транспорте (аэропорты, железнодорожный транспорт, распознавание автомобильных номеров для ГИБДД), а также на государственных объектах.

Современные разработки в области видеоаналитики способны решать большой спектр коммерческих задач. Алгоритмы могут осуществлять сбор и анализ важной маркетинговой информации в режиме реального времени (подсчет людей и транспорта, анализ очередей, мониторинг активности людей в отдельных зонах).

Кузнецов Виталий, Управляющий партнёр Office Anatomy: На рынке машинного зрения или видеоаналитики слишком много маркетинга от разработчиков, мало опыта у интеграторов и завышенные ожидания от новинки со стороны заказчика. В результате, разработчик нахваливает новоиспеченный, но еще далекий до идеала продукт, интегратор продает его клиенту, а заказчик, подогретый картинками из голливудских блокбастеров с эффектными сценами распознавания лиц и обнаружения преступников, получает в остатке одно разочарование. Все слишком заинтересованы получить революционный продукт, который бесповоротно изменит рынок систем безопасности.

2020: рост объема рынка на 14,2% до 11,1 млрд рублей

Информационное-аналитическое агентство TelecomDaily 8 июля 2021 года представило результаты исследования о состоянии российского рынка видеоаналитики (ВА).

Согласно исследованию, объем рынка ВА в РФ по итогам 2020 года составил 11,1 млрд рублей, что на 1,4 млрд (14,2%) больше, чем в 2022-м году. Самым быстрорастущем сегментом названа облачная ВА с объемом рынка в 1,9 млрд. по итогам 2020 г.

Первое место на рынке облачной ВА по результатам 2020-го года стал оператор облачной платформы – Ivideon с долей рынка 21,9%. За ним следует платформа от телеком-оператора «Ростелеком» (15,5%). Замыкает тройку лидеров «Синезис» (6,7%).

Основные сферы применения технологий видеоаналитики на базе ИИ в 2021 году это – ритейл (15%), производство, транспорт и логистика (по 13%) и ТЭК (10%). По прогнозу к 2028-му году динамика рынка облачной ВА достигнет 25,9 млрд рублей, опережая рынок видеонаблюдения в целом на 10–12%.

Более 97% выручки рынка облачной ВА приходится на сегмент b2b. На b2g приходится 1,2%, на b2b2c – 1,3%. Невысокая доля госсектора объясняется тем, что данные с видеокамер пишутся преимущественно в центры обработки данных госзаказчиков, а не в облако оператора услуги.

Вступление в силу закона ФЗ-152 привело к необходимости сертификации собственной системы, которая требует немало времени и затрат для обеспечения необходимой безопасности, именно поэтому компании все чаще пользуются «облаками» операторов, сертифицированными по ФЗ-152.

2022: будущее – за облачной моделью использования видеоаналитики

7 февраля 2022 года компания IDC сообщила, что при поддержке Ivideon подготовила отчет о развитии технологий видеонаблюдения и аналитики и их востребованности среди российских компаний. Исследование показало, что cloud-сервисы, рынок которых в 2020 году вырос на 29,9%, в будущем дадут видеоаналитике новые возможности для развития.

Дополнительный анализ:  Бухгалтерская отчетность и фин. анализ Нижнекамскнефтехим за 2011-2020 гг. (ИНН 1651000010)

Для надежного принятия решений бизнесу требуется больше потоков информации. Несмотря на то, что видеонаблюдение ежедневно генерирует терабайты данных, бизнес не использует видеоданные на 100%. Обрабатывать массивы таких данных вручную энергозатратно и неэффективно: согласно исследованию IDC, проведенному в апреле 2021 года, 90% видеоданных не используется компаниями в силу нехватки ресурсов или инструментов для их извлечения.

На помощь приходит видеоаналитика, которая демонстрирует уверенный рост. Аналитические алгоритмы упрощают работу с такими данными и делают их полезными для бизнеса. Благодаря аналитике, видеокамеры могут использоваться не только для обеспечения безопасности, но и для распознавания лиц, подсчета объектов и сбора статистики. Ожидается, что компании будут все чаще внедрять такие решения для улучшения клиентского сервиса.

На увеличение спроса на видеоаналитические решения в дальнейшем также будет влиять рост мирового рынка программного обеспечения, который, по данным IDC, в период с 2020–2025 гг. будет расти в среднем на 15,5%. Способствовать активному внедрению видеотехнологий будет и развитие гибридных сетей, а также продвинутая аналитика, использующая большие данные и машинное обучение.

При этом будущее видеотехнологий за облачной архитектурой, которая обладает рядом плюсов перед хранением данных в собственных ЦОД компаний. Облачные сервисы — наиболее быстрорастущий сегмент как российского ИТ-рынка, так и глобального. По данным IDC, в 2020 году отечественный рынок cloud-сервисов вырос на 29,9%.

Почему будущее именно за облачной моделью использования видеоаналитики:

Для эффективного использования технологий видеонаблюдения и аналитики бизнес-организациям IDC рекомендует:

  • Заранее ставить четкие цели для применения видеоаналитики. Это поможет выстроить ожидания и избежать невыполняемых планов.
  • По возможности избегать сложных решений под ключ. Заказные решения требуют больше инвестиций и постоянной поддержки инфраструктуры. Зачастую готовые решения аналитики можно адаптировать под запрос, не создавая новых сценариев.
  • Использовать платформенные решения, которые обеспечивают бизнесу масштабируемость и легко настраиваемый сбор данных.
  • Отдавать предпочтения облаку для хранения и анализа данных. Это сэкономит расходы на технические ресурсы и позволит не перегружать сеть.
Грамотный клиентский сервис и операционная эффективность являются основными факторами успеха бизнеса, а иногда и факторами его выживания. Поэтому компании нуждаются в инструментах, которые позволят лучше узнать свою целевую аудиторию и улучшить бизнес-процессы ее обслуживания. Одним из таких инструментов стала видеоаналитика. Камеры, оснащенные видеоаналитическими модулями, не только обеспечивают безопасность на объекте, но и считают посетителей, анализируют их настроение и помогают управлять метриками бизнеса, влияющими на объём продаж. И это только ряд задач. При этом компаниям уже не нужно вкладываться в большое количество оборудования, ПО и лицензии, монтаж и обслуживание всего этого. Для работы такого сервиса нужна камера и доступ в интернет. Это дает менеджерам возможность управлять всеми процессами удаленно через единое окно, – отметил CEO Ivideon Андрей Юдников.

Vizorlabs

Компания VizorLabs – один из ведущих российских поставщиков систем видеоаналитики для промышленного применения, резидент Технопарка «Сколково». Компания разрабатывает технологии распознавания и автоматической обработки фото и видеоизображений с помощью нейросетей.

Платформенное решение видеоаналитики VizorLabs – это программно-аппаратный комплекс с искусственным интеллектом для контроля технологических процессов; учета и контроля качества продукции; мониторинга персонала; контроля промышленной безопасности; дефектоскопии и телеметрии.

Комплекс состоит из системы компьютерного зрения, медиасервера для обработки и хранения изображений, а также модулей интерфейса пользователя, модуля формирований отчетности и оповещений, и модуля обучения нейросетей.

Подсистема компьютерного зрения представляет собой каскад нейросетей (детекторов), для решения специфических задач: детектирование движения, детектирование людей и предметов, подсчет объектов, определение положения объектов относительно друг друга и др.

Всего в библиотеке VizorLabs более 75 готовых к применению детекторов, специально разработанных для типовых промышленных процессов. Решение VizorLabs также отличает уникальная функция распознавания действий и возможность самостоятельного обучения нейросетей силами заказчика.

Технологии VizorLabs обеспечивают точность детектирования объектов от 95% во всех ракурсах, при угле наклона камеры относительно пола до 70 градусов, на расстоянии до 25 м, на видеопотоке разрешением от 640*480 пикселей. Возможна одновременная обработка видеопотока от 1000 камер.

Решение реализуются в серверной и в облачной, или SaaS-версии.
На базе платформенного решения видеоаналитики реализованы такие отраслевые продукты, как автоматическая система контроля соблюдения техники безопасности VizorLabs Health &

Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео

Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр
Тайваньская компания 42Ark и американский производитель «умных» кормушек CatFi Box используют камеры видеонаблюдения для распознавания кошачьего лика

Немецкий электротехник Вальтер Брух в 1941 году установил CCTV-систему (Сlosed Circuit Television — система телевидения замкнутого контура) на полигоне, где испытывали ракеты «Фау-2». Это первый известный в истории случай использования видеонаблюдения на практике. Оператор должен был неотлучно сидеть перед монитором. Так продолжалось до 1951 года, пока не появились первые VTR (VideoTape Recorder) устройства, записывающие изображение на магнитную ленту.

Запись на носитель не избавила оператора от необходимости участвовать в процессе. Опознание лиц, определение местоположения объектов, даже детекция движения – все эти функции выполнял человек, сидящий перед монитором в режиме реального времени или изучающий постфактум архив видео.

Колесо прогресса катится дальше. Видеонаблюдение получило видеоаналитку, полностью изменившую процесс работы с системой. Помните историю про кота и нейросеть глубокого обучения? Да, это тоже часть видеоаналитики, но крохотная. Сегодня расскажем о технологиях, которые кардинально меняют мир CCTV-систем.

Детекция очередей и бета-тест
Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр
Первая IP-камера в мире Neteye 200, созданная в 1996 году компанией Axis

Видеонаблюдение зарождалось как охранная замкнутая система, предназначенная только для решения вопросов безопасности. Ограничения аналогового видеонаблюдения не позволяли использовать оборудование как-то иначе. Интеграция видеонаблюдения с цифровыми системами открыла возможность автоматизировано получать различные данные, анализируя последовательность изображений.

Важность трудно переоценить: в обычном случае после 12 минут непрерывного наблюдения оператор начинает пропускать до 45% событий. И до 95% потенциально тревожных событий будет пропущено уже после 22 минут непрерывного наблюдения (по результатам исследования IMS Research, 2002).

Появились сложные алгоритмы анализа видео: подсчет посетителей, подсчет конверсии, статистика кассовых операций и многое другое. В этой системе исчезает оператор наблюдения – мы оставляем компьютеру возможность «смотреть» и делать выводы.

Самой простой пример умного видеонаблюдения – детекция движения. Не так важно есть ли встроенный детектор в самой камере – если вы установите на компьютер, к примеру, софт Ivideon Server, то детекор движения будет использоваться программный. Один детектор способен заменить сразу несколько операторов видеонаблюдения. А уже в 2000-е начали появляться первые системы видеоаналитики, способные распознавать объекты и события в кадре.

У Ivideon сейчас в разработке несколько модулей видеоаналитики – с тех пор, как мы выпустили OpenAPI, дело пошло быстрее за счет интеграции с партнерами. Часть проектов пока в закрытом тестировании, но кое-что уже готово. Это, во-первых, интеграция с кассами для контроля за кассовыми операциями (пока на базе iiko и Штрих-М). Во-вторых, разработан детекор очередей.

У нас был счетчик Ivideon Counter, определявший количество клиентов в зале. Аналитика позволила уйти от специального оборудования в сторону облачных вычислений. Теперь нам не нужна специфическая камера – подойдет любая камера видеонаблюдения с разрешением 1080p . Сейчас мы хотим не просто считать людей, а определять очереди. Поэтому готовы любому магазину, ТЦ или офису, где ходят и стоят люди, образуя очереди, предоставить бесплатную камеру для теста детекции очереди. Напишите нам, чтобы принять участие в проекте.

Кроме того, Ivideon работает с технологиями распознавания лиц.

Кто и как распознает
Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр
Технология DeepFace проходит проверку Facebook на примере распознавания эмоционального лица Сильвестра Сталлоне

Над решениями в этой области работают Apple, Facebook, Google, Intel, Microsoft и другие технологические гиганты. Комплексы видеонаблюдения с автоматическим распознаванием лиц пассажиров установлены в 22 аэропортах США. В Австралии занимаются разработкой биометрической системы распознавания лиц и отпечатков пальцев в рамках программы, призванной автоматизировать паспортный и таможенный контроль.

Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр

Крупнейшая китайская интернет-компания Baidu провела успешный эксперимент по отказу от билетов с помощью технологии распознавания лиц с точностью 99,77%, при длительности съемки и распознавания – 0,6 секунды. На входах в парк установлены стенды с планшетами и специальные рамки, которые ведут съемку. Когда турист приходит в парк впервые, система его фотографирует, чтобы в дальнейшем использовать функцию распознавания лиц по фото. Новые снимки сравниваются с фото из базы данных – так система определяет, есть ли у человека право на посещение.

Дополнительный анализ:  Стажировка 2021 | Москва | стажер бизнес-аналитик

Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр

В Китае с технологиями вообще все очень хорошо. В 2022 году Alipay, оператор платформы онлайн-платежей, входящий в состав холдинга Alibaba, ввел в действие систему верификации платежей на базе Face , облачной платформы распознавания лиц, созданной китайским стартапом Megvii. Система получила название Smile to Pay — она дает возможность пользователям Alipay платить за онлайн-покупки путем съемки селфи (Alipay определяет владельца по улыбке). UBER в Китае стал применять систему распознавания лиц водителей на базе Face , чтобы противостоять мошенничеству, краже персональных данных и обеспечить дополнительную безопасность пассажиров.

Но интереснее посмотреть не на зарубежные решения, а на сервисы, созданные в России. Эти технологии находятся гораздо ближе к конечному пользователю (если он из нашей страны), с ними можно познакомиться, в перспективе объединиться для использования в собственном продукте. Компаний, занимающихся распознаванием лиц, вокруг немало. Вспомним несколько, остающихся на слуху.

Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр

Компания «Вокорд», основанная еще в 1999 году, в программе FaceControl 3D работает с синхронными изображениями со стереокамер, строит 3D-модель лица в кадре и автоматически ищет совпадение полученной модели с моделями в имеющейся базе данных. В 2022 году «Вокорд» стал использовать собственный математический алгоритм распознавания лиц, в основе которого лежат сверточные нейронные сети, благодаря чему их алгоритмы теперь работают с любой камерой видеонаблюдения. В компании утверждают, что могут распознавать лица (в размере 128х128 пикселей) людей, следующих в потоке. В конце 2022 года алгоритм Vocord DeepVo1 показал лучшие результаты в мировом тестировании идентификации, правильно распознав 75,127% лиц.

Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр

Компания VisionLabs, основанная в 2022 году, победила в крупнейшем в России и Восточной Европе конкурсе технологических компаний GoTech, вошла в список финалистов европейской программы «Challenge UP!», призванной ускорить вывод на рынок решений и сервисов на базе концепции интернета вещей, привлекла многомиллионные инвестиции и уже внедряет свои продукты в коммерческий сектор. Недавно банк «Открытие» запустил систему распознавания лиц от VisionLabs с целью оптимизации обслуживания и времени ожидания клиентов в очереди. Ну и стоит прочитать замечательную историю, как специалисты из КРОК с помощью VisionLabs кота ловили.

VisionLabs, показавшая один из лучших результатов по распознаванию и уровню ошибок, также работает с нейронными сетями, выявляющими специфические черты каждого лица, такие как разрез глаз, форма носа, рельеф ушной раковины и т.д. Их система Luna позволяет найти все эти особенности лица по фото в архивах. Другое решение компании, Face Is, распознав лицо клиента в магазине, находит его профиль в CRM-системе, узнает из нее историю покупок и интересы покупателя, и отправляет на телефон уведомление с персональным предложением о скидке на его любимую категорию товаров.

Стартап Skillaz, занимающийся автоматизацией процесса найма сотрудников, и VisionLabs собираются в конце 2022 года представить систему компьютерного распознавания, которая будет оценивать поведение соискателей при найме. Проанализировав полученные данные, система будет делать выводы о профессиональных качествах человека и пригодности к должности. Полные характеристики системы «машинного найма» компании не раскрывают. Известно лишь, что будет оцениваться коммуникабельность кандидата, исходя из его ответов на определенный набор вопросов, задаваемых системой online-интервью. Нейросеть будет искать взаимосвязь поведения кандидата на картинке с камеры видеонаблюдения и степень выраженности у него той или иной компетенции.

Сетка, представляющая собой доктора Лайтмана и Шерлока Холмса в одном лице, будет учитывать мимику кандидата, его жестикуляции, а также физиогномику. Тут стоит заметить, что метод определения типа личности человека, его душевных качеств, исходя из анализа внешних черт лица и его выражения, в современной психологической науке считается классическим примером псевдонауки. Как с этим противоречием справятся в новом продукте пока неясно.

Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр
Слайд из презентации NTechLab, угнетающий Салмана Радаева

NTechLab начинали с приложения, которое определяло породу собак по фотографии. Позже они написали алгоритм FaceN, с которым осенью 2022 года приняли участие в международном конкурсе The MegaFace Benchmark. NTechLab одержала победу в двух номинациях из четырех, обойдя и команду Google (через год в этом же конкурсе победит «Вокорд», а NTechLab сместится на 4-ю позицию). Успех позволил им быстро реализовать сервис FindFace, ищущий людей по фотографиям во ВКонтакте. Но это не единственный способ применения технологии. На фестивале Alfa Future People, организованном «Альфа-Банком», с помощью FindFace посетители могли найти свои фотографии среди сотен других, отправив селфи чат-боту.

Кроме того, NTechLab показали систему, способную в режиме реального времени распознавать пол, возраст и эмоции, используя изображение с видеокамеры. Система способна оценить реакцию аудитории в режиме реального времени, благодаря чему можно определить эмоции, которые испытывают посетители во время презентаций или трансляций рекламных сообщений. Все проекты NTechLab строятся на самообучающихся нейронных сетях.

Путь Ivideon к видеоаналитике
Видеоаналитика: распознавание лиц, детектор очередей, поиск объектов на видео / Хабр

Распознавание лиц – одна из самых сложных задач в области видеоаналитики. С одной стороны, вроде все понятно и давно используется. С другой стороны, решения идентификации в толпе людей все еще стоят очень дорого и не дают абсолютной точности.
В 2022 году в Ivideon начали работу с алгоритмами видеоанализа. В тот год мы выпустили приложения для iOS и Android, вышли на зарубежные рынки, запустили децентрализованные сети CDN с серверами в США, Нидерландах, Германии, Кореи, России, Украине, Казахстане и стали единственным международным сервисом видеонаблюдения, работающим одинаково хорошо во всем мире. В общем, казалось, что сделать свою аналитику с блэк-джеком и распознаванием будет просто и быстро… мы были молоды, трава казалась зеленее, а воздух – сладким и томительным.

[На тот момент мы рассматривали классические алгоритмы. Для начала нужно детектировать и локализовать лица на изображении: используем каскады Хаара, поиск регионов с текстурой, похожей на кожу и т.п. Допустим, нам надо найти первое попавшееся лицо и сопровождать только его в видеопотоке. Тут можно воспользоваться алгоритмом Лукаса-Канаде. Находим алгоритмом лицо и далее определяем в нём характерные точки. Сопровождаем точки с помощью алгоритма Лукаса-Канаде; после их пропадания считаем, что лицо исчезло из поля зрения. Получив характерные признаки лица, мы сможем сравнить его с признаками, заложенными в базе данных.

Для сглаживания траектории движения объекта (лица), а также для предсказания его положения на следующем кадре используем фильтр Кальмана. Тут необходимо отметить, что фильтр Кальмана предназначен для линейных моделей движения. Для нелинейного же используется алгоритм Particle Filter (как вариант Particle Filter алгоритм Mean Shift).

Можно также использовать алгоритмы вычитания фона: библиотека с примерами реализации алгоритмов по вычитанию фона статья по реализации легкого алгоритма вычитания фона ViBe. Кроме того, не стоит забывать один из самых распространенных методов Виолы-Джонса, реализованный в библиотеке компьютерного зрения OpenCV.]

Простое распознавание лиц – хорошо, но недостаточно. Нужно еще обеспечить устойчивое слежение за несколькими объектами в кадре даже в случае их совместного пересечения или временного «пропадания» за препятствием. Считать любое количество объектов, пересекающих определенную зону и учитывать направления пересечения. Знать, когда появляется и исчезает предмет/объект в кадре – навести мышкой на грязную чашку на столе и найти момент в видеоархиве, когда она там появилась и кто её оставил. В процессе слежения объект может измениться достаточно сильно (с точки зрения преобразований). Но от кадра к кадру эти изменения будут такими, что можно будет идентифицировать объект.

Кроме того, мы хотели сделать универсальное облачное решение, доступное для всех – из самых требовательных пользователей. Решение должно было быть гибким и масштабируемым, поскольку мы сами не могли знать, за чем хочет следить и что хочет считать пользователь. Вполне возможно, что кто-нибудь предполагал бы сделать на базе Ivideon трансляцию тараканьих бегов с автоматическим определением победителя.

Только спустя пять лет мы приступил к тестированию отдельных компонентов видеоаналитики – подробнее об этих проектах расскажем в новых статьях.

P.S. Итак, мы ищем добровольцев для тестов детектора очередей. А также пользователей системы ШТРИХ-М для теста новой системы контроля кассовых операций. Пишите на почту или в комментариях.

Влияние федерального закона фз152 о персональных данных на рынок видеоаналитики

По мнению большинства опрошенных компаний, из определения, установленного Федеральным законом 152 «О персональных данных», материалы с изображениями граждан, полученные в результате видеосъёмки в публичных местах и на охраняемой территории не являются биометрическими персональными данными.

Дополнительный анализ:  Статистика и аналитика на YouTube любого канала: просмотр данных

Роскомнадзор рекомендует оснащать места, находящиеся под видеонаблюдением, предупредительными надписями или графическим изображением. Если данное условие будет выполнено, то отдельного согласия граждан на проведение съёмки не требуется. Среди примеров использования такого режима видеоаналитики можно указать контроль качества обслуживания клиентов, обеспечение сохранности имущества, контроль рабочего места и т.п. Более того, скрытое видеонаблюдение запрещено законом.

Опрошенные компании отмечают, что согласно закону видео не является носителем персональных данных, с точки зрения закона, на записи присутствует изображение некоего человека, и не более. Такие записи можно хранить без ограничений. Но если используются система распознавания лиц, присваивающая изображениям определенные идентификаторы, то закон ФЗ152 вступает в силу, а её пользователь становится оператором персональных данных.

Следовательно, инфраструктура хранения такой организации должна соответствовать требованиям ФЗ-152. Но сертификация собственной системы хранения – процесс весьма затяжной и затратный, поэтому во многих случаях дешевле и проще арендовать необходимые ресурсы в облаке, уже сертифицированном для хранения персональных данных.

Некоторые компании, однако, считают, что ФЗ152 оказывает существенное регулирующее влияние, определяя и несколько ограничивая применение систем видеоаналитики. Для активного развития рынка необходимо разработать отдельный пакет требований к системам видеоаналитики и чётко определить, что попадает под действие указанного закона, а что носит рекомендательный характер.

Ряд компаний также считает, что Закон о персональных данных тормозит некоторые их проекты по внедрению распознавания лиц вследствие того, что часть заказчиков сомневается в возможности применения распознавания лиц без нарушения ФЗ-152. Однако, на большинство проектов этот закон сильно не влияет, но в целом немного тормозит рынок.

Ооо «вокорд софтлаб»

Решения видеоаналитики VOCORD продвигаются на международный рынок (Индия, ближневосточные страны и государства Персидского залива). В настоящий момент, по данным Фонда Сколково, доля VOCORD на российском рынке составляет 10%.
Решения VOCORD[17]:

  • VOCORD Traffic: Распознавание номеров и фиксация нарушений ПДД. Интеллектуальная система контроля дорожного движения, работает в автоматическом режиме 24/7 в любых погодных условиях. Многофункциональная интеллектуальная система контроля дорожного движения с высокой достоверностью распознавания номеров и фиксацией более 15 видов нарушений ПДД.
  • VOCORD Tahion: Видеонаблюдение и видеоаналитика. Программно-аппаратный комплекс для создания систем видеонаблюдения и видеоаналитики любых масштаба и формата. Интеллектуальное видеонаблюдение VOCORD Tahion успешно используется в 70 проектах класса «Безопасный город». На аварийно-опасных участках дорог и сложных развязках, где помогает собирать важную информацию для управления транспортными потоками. На автомагистралях и федеральных трассах, где подает тревожные сигналы диспетчеру в случае запрещенных инцидентов и контролирует обстановку на пунктах оплаты. На заводах, складах, в гипермаркетах и офисах, где распознает объекты и действия, помогая бизнесу решать различные задачи. Архитектура VOCORD позволяет выбирать функционал, гибко настраивая систему под нужные цели.
  • VOCORD ParkingControl: Умные парковки. Система для автоматизации пропускного режима на базе распознавания автомобильных номеров и контроля въезда/выезда транспортных средств. Позволяет ускорить работу охранника на контрольно-пропускном пункте или полностью автоматизировать пропускной режим, минимизировав риски человеческого фактора. Система протоколирует все действия в зоне контроля, позволяет добавлять новые разрешения в режиме реального времени, ведёт учёт несанкционированных действий, а также выгружает статистику по транспорту на объекте в гибкие отчёты. На случай возникновения спорных ситуаций система архивирует видеозапись по заданным параметрам.

Ооо «центр 2м»

Система промышленной видеоаналитики CenterVision компании Центр 2М использует нейронные сети для распознавания объектов. Применение этой технологии позволяет распознавать объекты с точностью до 98%. Отслеживает производственный процесс в режиме реального времени, передаёт автоматическое оповещение в ситуационный центр, готовит отчёты по всем фактам нарушения правил безопасности.

Преимущества системы[16]:

  • Снижение уровня ошибок на производстве. Точность распознавания нейросети до 98% сводит вероятность ошибки к абсолютному минимуму;
  • Моментальное уведомление о нарушении. Время отклика в 2,4 секунды позволяет системе моментально узнавать о нарушениях техники безопасности;
  • Низкое влияние погодных условий. Обнаружение объектов с большого расстояния независимо от дождя, снега или тумана снижает зависимость от погодных условий;
  • Охват больших территорий малыми ресурсами. Распознавание малых объектов с большого расстояния (50-70м) даёт возможность контроля меньшим количеством видеокамер.

Центр 2М внедряет современные системы видеоаналитики с индивидуальной настройкой для заказчика: на производстве, государственных объектах, в учебных заведениях, гостиницах, банках, магазинах.

В зависимости от специфики объекта Центр2М предлагает несколько комплексных решений для обеспечения безопасности на производстве. Запатентованные технологии помогут увеличить процент распознаваемых объектов до 98%. Успешно реализованная схема совместной работы человека и машинного зрения уже применяется на режимных предприятиях и сложных промышленных объектах.

Перспективы инновационных технологий на рынке решений видеоаналитики в россии

Результаты опроса показали, что инновационные технологии, такие как анализ Больших Данных, искусственный интеллект, нейросети, машинное/глубокое обучение будут являться главный фактором роста рынка решений видеоаналитики в России.

Например, Марина Иванченко из «Центр 2М» рассказала аналитикам TAdviser, что согласно ежегодному рейтингу Gartner, 4 места из 10 топовых технологий 2022 года занимают тренды в сфере видео. Это такие тренды как:

  • дополненная аналитика (augmented analytics);
  • многоканальное взаимодействие (immersive experience);
  • умные пространства (smart spaces);
  • цифровая этика и безопасность персональных данных (digital ethics and privacy).

Своим существованием эти тренды обязаны новой реальности цифрового мира. Вокруг нас стало слишком много данных, и человечеству нужно научиться работать с этим массивом информации.

Технология автоматизированной видеоаналитики помогает решить проблему обработки данных. Ещё 5-10 лет назад реализовать такие решения в промышленном масштабе было невозможно. Каждый проект требовал несколько сотен человеко-лет и целого арсенала суперкомпьютеров.

Сейчас вычислительные мощности поднялись на качественно новый уровень. Компания «Центр 2М» располагает решениями, способными обрабатывать все виды данных с помощью искусственного интеллекта на основе свёрточных нейронных сетей.

Видеоаналитика нового уровня не просто отвечает запросам новой среды. Инновационные решения становятся обязательным инструментом в бизнес-сфере. Конкуренция в корпоративной среде растёт, и обладание даже самыми современными средствами производства уже не гарантирует стабильность.

Нужны новые системы оперативного ситуационного анализа, которые помогут более качественно управлять бизнесом: например, осуществлять мониторинг базовой инфраструктуры или работать над повышением эффективности систем производственной безопасности и принятием диагностических решений.

Компания Макроскоп отмечает, что большое значение будет иметь синергия решений. По мнению Макроскоп, будет появляться всё больше комплексных решений, в которых одна система управления видеонаблюдением VMS будет выполнять роль операционной системы для ситуативного использования возможных решений.

По мнению компании X-Com, новые технологии позволяют непрерывно совершенствовать аналитические алгоритмы и открывают качественно новые возможности применения данных решений, повышающие возврат инвестиций в них. Например, в ритейле они позволяют определить демографический состав посетителей торговых точек, выявить частоту визитов и состав продуктовой корзины различных групп покупателей, оптимизировать выкладку товаров, планировать и организовывать таргетированные маркет-активности, выстроить эффективную омниканальную коммуникацию с аудиторией.

Анализ настроения посетителей на входе в магазин, в торговом зале и на выходе позволяет выявлять и устранять недостатки бизнес-процессов (в т.ч., возникающие лишь в определенное время), поддерживая таким образом лояльность клиентов. Службам безопасности эти технологии помогут выявлять потенциально опасное поведение покупателей и предотвращать правонарушения.

В компании Tevian считают, что сейчас почти вся видеоаналитика в настоящее время основана на нейросетях с глубоким обучением. Без этих решений работают только самые простые и быстрые методы (часть методов по охране периметра и т.п.).

В компании NVIDIA прогнозируют, наиболее перспективными направлениями развития систем видеоаналитики в ближайшее время будут следующие:

  • улучшение качества и скорости распознавания лица, что даёт возможность прохода через пункт контроля без остановки, без необходимости смотреть строго в камеру;
  • liveness check (невозможность использования фото или маски вместо живого лица);
  • распознавание в условиях плохой видимости (съемка в темноте, в дождь/снег/туман), и ситуациях, когда лицо частично закрыто очками, шарфом, головным убором и т.д.),
  • распознавание эмоций;
  • распознавание по силуэту, одежде и походке, в том числе и со спины;
  • распознавание оружия, возможность использования геотегов и любой дополнительной информации для исключения возможности подлога;
  • распознавание поведенческих сценариев (человеку нужна помощь, проблемы со здоровьем, насилие, и т.д.) в связке с автоматическим оповещением соответствующих служб.

Робототехника

  • Искусственный интеллект (ИИ, Artificial intelligence, AI)
  • Обзор: Искусственный интеллект 2022
  • Искусственный интеллект (рынок России)
  • Искусственный интеллект (мировой рынок)
  • Искусственный интеллект (рынок Украины)
  • В банках, медицине, радиологии, ритейле, ВПК, производственной сфере, образовании, Автопилот, транспорте, логистике, спорте, СМИ и литература, видео (DeepFake, FakeApp), музыке
Оцените статью
Аналитик-эксперт
Добавить комментарий

Adblock
detector