Добрый День Уважаемые Коллеги. Сегодня у нас в гостях Михаил Погребняк – Генеральный Директор iT компании “Визуальные Поисковые Технологии” (https://vptai.ru/), занимающейся алгоритмами распознавания “бардака” на полках торговых сетей. Как вы знаете, мы очень скурпулёзно подходим к вопросу размещения рекламно-ориентированного содержания, еженедельно отсеивая примерно 3-5 предложений, не проходящих качественно-смысловой фильтр. Данная же тема оказалась нам интересной, поскольку мы раз в 2 года сталкиваемся с ней внутри торговых сетей. Все известные нам попытки внедрения данной технологии за последние 20+ лет были неудачными. Михаил показался нам интересным и профессиональным собеседником, и мы решили сделать полноценное интервью.

Михаил, расскажите с какого года вы плотно в теме, насколько большой рынок по данной услуге, и как много компаний её предоставляют?

Наша компания существует на рынке с 2018 года, но распознаванием объектов на фотографиях и видео мы начали заниматься больше 10 лет назад. Технология интересна и достаточно востребованна. Мы видим, что на рынке есть динамика роста, есть мировые лидеры, например, Trax Retail, и всё больше торговых сетей интересуются этой технологией, чтобы увеличить эффективность своих внутренних процессов. На рынке довольно много компаний, которые предлагают услуги в этой области. Есть те, что предлагают только распознавание (в том числе, мы). Есть те, которые предлагают интеллектуальные полки, роботов и дронов, перемещающихся по торговому залу.
Российские цифры предотвращения потерь в области мерчендайзинга с помощью Image recognition крайне неточны по причине плохого качества классификации потерь и их надёжности во времени. Можно в целом прикинуть размер поляны, на которой данная технология может быть развёрнута. Выручка Топ-10 FMCG ритейлеров в 2022 году составила 7 826 млрд рублей. В среднем ритейлеры теряют 3% от оборота, что равно 234.7 млрд рублей в год. Потенциал довольно большой.

Давайте вкратце объясним на простом языке, что можно делать при помощи вашей системы?

Наша система осуществляет анализ товаров, которые находятся на полке. Если в традиционной модели люди пальцем считали количество банок, бутылок, коробок, и глазами сверяли офисную планограмму с реальностью, считали на калькуляторе или бумажке долю полки, то теперь все это заменяет система, построенная на техническом зрении. С помощью нейронных сетей она автоматически распознаёт, считает, классифицирует объекты и вычисляет ошибки. Фактически мы говорим, что делаем все то же самое, что и человек, но делаем быстрее, и зачастую, значительно точнее.

Как система считывает данные с полки? По фото? Происходит ли “вытягивание” параметров из ERP/СRM?

Система принимает на вход фотографию стеллажа с товарами из торгового зала магазина, а на выходе отдаёт полную информацию по состоянию полки: какие SKU и в каком количестве, на каких местах, соответствие ценников самим товарам. Если ERP-система клиента позволяет получить целевые данные об идеальной выкладке (т.е. какие именно SKU должны стоять на полке, в каком количестве, с какими ценами и на каких местах), то сервис сравнит результаты, и выдаст список ошибок. Также, сервис хранит данные о предыдущих визитах в данную торговую точку и автоматически может сравнить текущее состояние полки с предыдущим по всем базовым метрикам. Из ERP заказчика мы берем данные о товаре: артикул, геометрические размеры, и т.д. Клиент также может самостоятельно загружать мастер-данные товаров.

Как торговые сети приходят к осознанию необходимости данной услуги?

Производитель хочет экономить на ФОТ мерчендайзеров, а также иметь точные данные, которые описывают его ситуацию на полке. Использование технологии, о которой мы говорим, позволяет в 2-4 раза увеличить скорость обработки полки, то есть сократить время нахождения мерчендайзера в торговой сети. Таким образом, при использовании технологии один специалист может сделать в 3-4 раза больший объем количества визитов в ТТ, чем когда он считает все руками. Это практически сразу отражается на ФОТ. Уменьшить количество мерчендайзеров вдвое, например, с 500 до 250 – это существенная экономия в деньгах. Система также позволяет снизить количество “фрода” – т.е. подделок, некачественных фотографий, фейков, которые недобросовестные мерчендайзеры делают, чтобы схалтурить, обмануть, что становится сразу заметно, и позволяет выставить штраф мерчендайзинговому агентству. У магазина задача ещё интереснее – он просто должен понимать, что у него творится на полках. Что происходит с товарами, зачем положили кефир в кофе, почему на полках пересортица, на каких полках товар уходит быстрее, на каких медленнее. Всю эту информацию можно получить, используя технологию распознавания товаров. Плюс, можно получить ситуацию, в которой мерчендайзеры буду оказывать гораздо меньшее влияние на магазины, чем они оказывали до этого. Понимание того, что находится на полках в ежедневном режиме позволяет магазину создавать цифровые двойники полок, к которым будут обращаться сами производители, чтобы понимать, насколько хорошо продаются их товары, и вносить корректировки.

Не дешевле ли ритейлерам вернуть сокращенный ими ранее персонал вместо дорогой цифровой системы?

Это глубокий вопрос, потому что система работает с качеством, предположим, 94% и 24 часа в сутки. Человек же показывает максимум своей точности в течение 20 минут – после количество ошибок начинает возрастать. Второй момент: мы сократили персонал, предположим, вдвое за счёт увеличения качества и эффективности – персонал можно перебросить на другие задачи более высокого порядка. Ну и называть систему “дорогой”, вероятно, не совсем корректно: мы говорим о том, что использование системы дешевле, чем привлечение людей к мерчактивностям, примерно в 10 раз. Есть подсчеты, которые говорят, что стоимость одного мерчендайзера составляет не 136 р./час (если считать соотношение заработной платы мерчандайзера к количеству рабочих часов за месяц при заработной плате 23 000 р./мес. на руки), а 401 р./час (с учетом расходов на передвижение, фактического времени пребывания в ТТ, зарплаты супервизора и так далее).

Учтены ли в стоимости вашей системы следующие процессы?:

Наведение порядка с мастер данными в ERP-системе клиента? – Мы запрашиваем у клиента список товаров в категориях + их внутренние ID в системе клиента, чтобы облегчить процесс интеграции и обмена данными. Чистка мастер-данных не входит в наши умения.

Прокладка “толстого” интернета или вай-фая по магазинам? И нужен ли он? – Все зависит от деталей. Если есть хороший 4G, то Wi-Fi не нужен. Если устойчивой связи нет, то Wi-Fi, конечно, необходим – и не только для нашей системы, но и для обеспечения нормальной работоспособности других процессов в ТТ.

Сопряжение с системой  ERP заказчика? – Мы как сервис – это REST API. То есть к нам можно приходить из любой ERP-системы. Обычно это делают IT-службы заказчика. Мы можем помочь на уровне консультаций со своей стороны.

Доработка освещения, чтобы фото в магазине вообще получались? – Это прекрасная сказочная история. Если бы для улучшения работы сторонней ИТ-системы руководство точки было готово вносить изменения в схему освещения ТТ (Торговой Точки)!!! Но в нашей практике такого не было и, скорее всего, никогда не будет. Вообще, основная проблема для нас – это даже не свет, а блики на стеклянных дверцах холодильников. В целом, для улучшения качества фотографий проводится обучение сотрудников, как делать правильные фото. Есть отдельный подробный документ – буклет, где по шагам описано, как избежать ошибок при фотографировании и как делать снимки, которые помогут системе лучше распознавать товары на стеллажах. Как ни удивительно, в документе есть пункт, который кажется забавным: «Нажмите на экран, чтобы навести на резкость». Этот момент всякий раз приходится проговаривать, так как он, как показала практика, не всегда оказывается очевиден. Но, в целом, если мы говорим о торговых сетях крупного масштаба (речь не о штучных магазинчиках на цокольных этажах), то стационарного освещения в большинстве случаев достаточно, чтобы сделать фотографии, пригодные для распознавания товаров.

Отладка, тестирование и обслуживание? – Старт работы с каждым клиентом мы начинаем с пилотного проекта, который предназначен именно для того, чтобы собрать пул ошибок и их исправить. Объём, сроки и бюджет такого проекта обсуждается с каждым заказчиком персонально под его конкретные задачи. Мы заинтересованы не меньше клиента в том, чтобы он мог «пощупать» сервис в реальных условиях.

Написание внутренних инструкций и обучение персонала? – Конечно же, обучение персонала играет огромную роль в том, приживётся ли вообще сервис у клиента. Человек так устроен, что изначально пытается противиться всему новому и ищет всевозможные изъяны и недостатки. Но если постоянно и с уважением прорабатывать все вопросы, которые возникают у сотрудников, сервис приживается и приносит ожидаемые плоды. Поэтому мы стараемся не только писать всевозможные инструкции по эксплуатации, но и устраивать очные (онлайн) встречи с персоналом клиента.

Сравнивали ли вы затраты на обслуживание и ремонт системы на длинном пробеге в сравнение с зарплатой какой-нибудь супервайзера? Мы, например, достоверно знаем, что окупаемость и обслуживание кассового аппарата самообслуживания выходит дороже, чем обычная касса с кассиром.

Может звучит немного по-злому, но давайте сравним зарплату 100 мерчандайзеров и их налоговую нагрузку. Согласно Яндексу, средняя предлагаемая зарплата мерчандайзера в Москве не превышает 35 тыс. рублей, а в Петербурге — 30 тыс. рублей. Возьмем 30 тысяч. Налоговая нагрузка составит еще примерно 15 тысяч рублей. Итого, 45 тыс. за 1 человека в месяц. За 100 мерчандайзеров ФОТ составит 4 500 000 рублей. Использование технологии распознавания полок уменьшает минимум в два раза время на проведение мерчандайзинга. Т.е. команду можно сократить до 50 человек, а фонд ФОТ до 2 250 000 рублей в месяц. Из оборудования мерчандайзеру нужен только мобильный телефон. Все остальное происходит на оборудовании поставщика сервиса, с которым заключен договор с четкими метриками SLA (уровня доступности сервиса). Таким образом, получается, что за год экономия на персонале составит 27 миллионов рублей. Далее, потери со стороны сети от “дырок на полке” при наличии товара в подсобке. В зависимости от СКЮ можно терять от миллионов до десятки миллионов товарооборота в месяц только на одном товаре. Имидж от бардака на полках получить крайне сложно. У нас же всё работает в облаке. Его стоимость от 30 тыс руб. в месяц. Наше только программное обеспечение. Также есть клиент-менеджер, который обслуживает около 5 проектов. Его заработная плата составляет 100 000 р., т.е. на 1 проект 20 тыс руб./месяц.

Очень интересный вопрос: как выиграть тендер в крупную федеральную сетку, кому и какой процент от общей суммы контракта надо занести? (Можно без фамилий, просто обозначить уровень должности)

У нас нет такого опыта. Мы против коррупции и за честную игру в тендерах и никому ничего не заносим. Может, это старомодно, конечно. Ну и уголовно наказуемо. Мы, действительно, никогда не сталкивались с этим и «занести» никому не предлагали. Клиенты к нам приходят по-разному: кто-то через тендерный процесс и отдел закупок, кто-то без тендера. У нас есть все требуемые документы для тендерных процедур, и мы следуем инструкциям клиента. Когда-то мы выигрываем; когда-то все улетает, как в черную дыру, и мы не получаем обратной связи. Поскольку нам лично никто не намекал и не просил – мы не можем говорить о коррупционной составляющей. Она, наверное, есть, но это наши догадки, опытом не подкрепленные.

Давайте немного о технической стороне. Последний раз, когда мы занимались данной темой как работники торговой сети, проект умер на том, что единственный провод в магазине, по которому можно было что-то запустить дополнительно, был занят пожарной сигнализацией, а ставить вай-фай было дорого. Вы с такими мелочами на местах сталкиваетесь?

Да, безусловно, такие проблемы существуют. Это все является инфраструктурной частью проекта: провода, пожарная сигнализация и остальное. Такие моменты, наверное, даже есть у многих в квартире, когда выясняется, что к розетке невозможно подключить какое-нибудь из устройств, поскольку не хватает мощности. Здесь можно говорить только о том, что все проекты, которые делаются, должны быть технически правильно продуманы. И вопрос поддержки и технической готовности является одной из частей успеха – или, наоборот, неудачи. Поэтому перед тем, как что-то делать, по-хорошему, необходимо убедиться, что в розетке есть электричество, к ней подходит необходимая мощность, что пожарная сигнализация работает, и так далее. Все это входит в совокупную стоимость проекта и является тем, что называется total cost of ownership (совокупная стоимость владения) Но, с одной стороны, эта проблема существенная, и она присутствует, с другой – любая компания, которая пользуется услугами интегратора, эти проблемы знает и умеет решать.

Какое оборудование вам нужно в магазине кроме телефона в руках у мониторщика?Используются ли видеокамеры?

Как уже упоминалось выше, сервис на вход получает фотографию стеллажа. Эта фотография может быть сделана разными способами, самый простой – это руками мерчендайзера или сотрудника торгового зала просто на телефон или планшет. Дальше фотография должна быть отправлена на обработку в сервис. Обычно мы работаем в схеме, когда сам сервис крутится на нашей стороне (специально выделенных серверах). При такой схеме в магазине ничего, кроме телефона с выходом в интернет в руках мониторщика и не нужно. Есть другая история, когда фотографии получаются с видеокамер, установленных в магазине. Но тогда стоит помнить, что и решаемые задачи могут быть другими. Например, постоянный мониторинг товаров с высокой оборачиваемостью. Тогда, конечно, обязательным оборудованием становятся камеры, что важно – правильно настроенные.

Обмен данными происходит в режиме реального времени или «по-ночам»? Какие протоколы используются?

Когда мы говорим про сервис – это не учётная система, потому что она занимается только анализом информации и обратной передачи ключевых параметров заказчику. Мы считаем, что нет необходимости плотного встраивания в саму ERP. Сервис может работать как в режиме реального времени, так и “периодически”. ShelfMatch – это набор функций. Он вызывается через REST API (интерфейс программного взаимодействия). Любая учетная, складская или иная, система, которая эксплуатируется ритейлером, может быть интегрирована с сервисом либо напрямую, либо через шину данных. Сервис хранит внутри себя в базе данных (MySQL) результаты всех распознаваний полок. Это доступно через API. Также есть хранилище фотографий, которые хранятся в сервисе. В зависимости от объемов и количества фотографий требования к серверам могут быть разными. Базово нужно железо для распознавания: карта NVIDIA (1080, 3080, 3090, 4080, a100…). Главный ресурс – память карты. Нужно от 12Gb. Требования к процессору и памяти более спокойны. Обычно это 32Gb RAM и 6/8/12-ядерный процессор. Такой сервер может обрабатывать 50-60 тысяч фотографий в день. Добавление еще одной карты удваивает это количество.

Прям как ферма для майнинга!)))

Какие данные нужны вашей системе для работы? Размеры и фото товара, остатки в магазине?

Чтобы настроить систему, нам нужен список товаров, фотографии полок в магазине с этими товарами, чтобы мы сделали обучающую выборку и обучили нейронные сети. Чем больше аналитической информации хочет получать клиент от сервиса, тем по большему количеству справочников ERP-системы клиента нам нужно будет интегрировать наши системы. Но, как правило, интеграция – это одна из самых простых частей настройки сервиса. Самая сложная и длительная – это обучение нейронной сети, для которой, по сути, нужны только фотографии и список товаров. Основное требование к фото – максимальное разрешение камеры. Обычно мы просим клиента предоставить нам максимально возможный набор свежих фото, например, за последний месяц (квартал), чтобы мы могли выбрать то, что нам подойдёт для обучения и тестирования нейронных сетей. Второй вариант – если у клиента по любым причинам нет пригодных фотографий и он не может их сделать оперативно, мы сами делаем фото. Наши сотрудники обходят несколько точек и фотографируют стеллажи.

Как распознаётся товар, по каким параметрам?

Видеокамера или камера смартфона, планшета – делает снимок полки. Он попадает в сервис ShelfMatch. Там обученные нейронные сети сначала выделяют товар (коробки, бутылки и т.д.) на фотоснимке, а потом каждый из выделенных товаров классифицируют, то есть определяют, что именно это за коробочка или бутылочка. Чтобы это все работало, нейронные сети необходимо обучить на товарах, которые они (нейросети) потом будут распознавать. Так что это довольно непростой и трудоемкий процесс, с одной стороны, а, с другой, – мы научились его делать.

ShelfMatch – это ваш собственный продукт или сторонний западный сервис?

ShelfMatch – это наш собственный продукт и собственная разработка.

Что происходит, если товар повернулся боком, упал, плохое освещение, поставщик наклеил на товар “обичайку” (праздничную наклейку к Новому Году или 8-му Марта)?

Для этого мы проводим обучение на большом количестве фотографий «с полей»: из разных точек, с разных ракурсов. Все происходит так: мы даем задание всем нашим сотрудникам посетить не менее 3 точек выбранной торговой сети и сфотографировать стеллажи с выкладкой товаров клиента. Это дает нам вариативность фотографий, которая «учит» систему различать товары с различным освещением, стоящие под углом, повернутые не той стороной и так далее, т.е. учит алгоритмы машинного зрения понимать, что, несмотря на разность внешнего вида, это одно и то же SKU. Бывают случаи, когда клиент, наоборот, хочет, чтобы сервис определял только фронтальный фейс товара, а все остальные стороны считал ошибкой. Это тоже достигается за счет соответствующего обучения нейронных сетей. В случае с сезонными наклейками ситуации бывают разными: иногда наклейка не влияет существенно на упаковку, и тогда сервис справляется без переобучения. А иногда требуется, конечно, дообучиться. Всегда в процессе эксплуатации мы просим клиента сообщать нам об изменениях упаковок товара заранее настолько, насколько это возможно.

Что делать, если поставщики очень часто меняют товар или их размеры, и отдел мерчендайзинга в торговой сети не успевает заносить актуальные данные?

Обычно с поставщиками есть коммуникации, когда они согласуют смену этикеток, либо оповещают об этом заранее. Нам необходимо 1-2 дня, чтобы оперативно отреагировать. Мы могли бы еще быстрее, но обычно все упирается в регламенты и бизнес-процессы магазина и поставщика. Если мы говорим про смену дизайна упаковки, либо мы получаем от заказчика информацию о смене фейсов заранее, и тогда быстро добавляем в обучение новые фейсы или товары, – либо система начинает ошибаться (если товару она не обучена). В этом случае возможно в ручном режиме пометить «ошибочные» товары правильными ID и сформировать задачу на разметку и добавление товаров в обучающую выборку.

А может ли ваша система проверять не только фактическое наличие товара на полке, но его правильное месторасположение в соответствии с планограммой?

Да, конечно. Обычно мы получаем списки планограмм и загружаем их в наш сервис. Если планограмм нет, мы можем сделать их сами – на основе фотографий полок. Но идеальный для нас случай, когда заказчик использует систему планограммирования, а мы забираем из нее планограммы, привязанные к конкретным стеллажам в конкретных торговых точках.

А товар с наличием правильного ценника под ним может проверять?

Да, мы умеем распознавать ценники, понимаем, как распознавать цену на них, как распознавать акционность, цену по акции и все, что с этим связано. Мы можем соотнести ценник с товаром по геометрическому принципу: то есть если ценник находится под товаром, мы делаем вывод, что он имеет отношение к товару. К сожалению, поскольку фотографии делаются со значительного расстояния, 2-2,5 метра, то прочитать и распознать, что написано на ценнике, мы, скорее всего, не можем или не можем быть уверены в том, что распознали это правильно. Поэтому соотносим ценник и товар по геометрическому признаку: вот товар, а если под ним ценник, делаем вывод, что ценник относится к товару. Если в магазине есть система, которая по коду товара возвращает его цену, и это оформлено как программный сервис, то мы можем подключиться к этому сервису и выяснить, является ли цена на данный товар верной. Ну и в случае, если цена неверна, выставить предупреждение и сообщить о нем наверх.

Что делать, если ценника нет, он старый, или вне поля зрения фотоаппарата?

Все зависит от настроек. Если ценник старый, и его значение cверяется со значением в ERP, то будет алерт (тревога). Если ценника нет, а он должен быть – тоже будет alert. К кому он придет, мерчендайзеру ли, супервизору, или в главный офис, зависит от того, как будет задано настройками системы.

Не выходит ли, в итоге, так, что система все время выдает тревогу, что ничего не совпадает, и ее просто отключают или игнорируют по причине нехватки обычного персонала для решения проблем? Либо проблема «живет» центральном офисе, но она не решается.

Здесь, возможно, стоит ограничить сферы влияния: на что я как создатель сервиса могу повлиять, а что находится за пределами моего круга. Сервис решает конкретную задачу: распознавание товаров на полках, создание отчета и отправка оповещения. Это инструмент, который позволяет клиенту решать конкретную проблему. Но аудит бизнес-процессов – все же не наша компетенция. Грубо говоря, мы даем интеллектуальную удочку, обучаем рыбака и помогаем эту удочку обслуживать. Но состояние реки, улов и то, как рыбак будет готовить рыбу – это ответственность того, кто использует удочку. С нашей стороны показателем эффективности может являться время жизни клиента. Очевидно, что если сервис не приносит эффекта, то от него отказываются, а если он приносит результат, то им пользуются. У нас lifetime клиента долгий, от 3 лет. Система же информирования (алертов) может быть настроена настолько жёстко, насколько на клиент готов выделить на это административный ресурс. Могут приходить уведомления только одному сотруднику, могут группе (сотрудникам 2-3 уровней по вертикальной иерархии), может быть алерт с «обратной связью», когда после исправления сотрудник должен сделать повторную фотографию стеллажа с исправлениями.

Какие основные проблемы у сетей после запуска такой системы?

Чаще всего основная проблема – это качество фотографий. 80% проблем, да и времени, тратится именно на то, чтобы научить персонал и убедить его в том, что они могут делать хорошие фотографии. Хотя никакой сложности в этом реально нет. В самом процессе запуска стандартно в самом начале бывают проблемы из-за предоставления нужной информации со стороны клиентов. Периодически сложности возникают из-за «грязных» данных (неверные ID товара, задвоение данных). Бывает сложность нахождения нужных людей на стороне клиента, которые могут ответить на наши вопросы и предоставить необходимые данные. После запуска системы в течение 1-2 месяцев обычно большинство проблем решается. Безусловно, существует какой-то фоновый уровень проблем, которые возникают в процессе эксплуатации, но их количество до сего часа не было чрезмерным: в среднем, единицы в месяц.

Если ли подтвержденные данные со стороны сетей об эффективности системы в цифрах на 1 магазин (рост продаж, падение списаний)?

Да, какие-то данные нам раскрывают. Например, что по результатам внедрения за год у одного у крупнейших дистрибьюторов алкоголя время аудита ТТ сократилось на 50%. Рост точности аналитических данных (метрики KPI) после ручной проверки составил 24%. Снижение затрат на персонал составило 24%. После внедрения системы распознавания ценников время аудита сократилось на 30%.

Если вдруг система заработает стабильно и начнёт применяться повсеместно, не жалко ли вам людей, которые будут уволены после её внедрения?

Частично мы ответили на этот вопрос выше. Специалиста не обязательно увольнять. Можно перевести его компетенции на задачи более высокого порядка. Кроме того, как мы уже сказали, такой автоматизированный сервис аудита полки сотруднику, который заинтересован в результате, будет только помогать. Так, один клиент рассказывал, что его сотрудник для подсчета фейсингов на полке пользовался «правилом 5 пальцев» (человек сам такое придумал!): прикладывал к выкладке растопыренную ладонь и так считал количество SKU. Это мило, но неудобно и трудозатратно, есть риск сбиться и начать считать сначала всю выкладку. Гораздо проще сделать хорошее фото и через секунду получить полную аналитику по стеллажу. С точки зрения морали и нравственности – мы платим налоги в фонд социального страхования, они поддержат уволенных, случись такое, в трудный час.

В Китае на многих предприятиях ручной сортировки не ставят автоматы, а доплачивают деньги за содержание ручного труда. Видимо, там что-то подозревают)

Но при этом в США на складах компании Amazon работают роботы (не без нюансов, нужно заметить), а владелец компании Джеф Безос – один из богатейших людей в мире. Вопрос использования ИИ, роботов и, вместе с этим, сохранения рабочих мест вкупе с обеспечением безопасности труда – действительно важный вопрос. Но это тема отдельной беседы.

Согласны.

Спасибо Михаил за обстоятельную беседу. Желаем побольше понимающих клиентов и удачи с развитием бизнеса.

involved@top-retail.net – от самого простого до самого сложного