Почему подсчёт металлопроката на фото нельзя решить простым CV: инженерный эксперимент
В задачах строительного контроля и складского учёта регулярно возникает практическая проблема: необходимо автоматически определить количество элементов в пачке металлопроката (трубы, профили, швеллеры) по фотографии.

На практике это до сих пор часто выполняется вручную — с типичными ошибками: — перекрытие элементов в пачке — сложное освещение на площадке — различие типов профилей — человеческий фактор при массовом пересчёте
Была проверена базовая идея: можно ли обойтись без нейросетей и решить задачу классическими методами компьютерного зрения.
Использован упрощённый CV-конвейер:
-
локальное размытие изображения (11×1 и 1×11)
-
сравнение пикселей с локальным средним уровнем
-
выделение областей повышенной интенсивности
-
формирование бинарной маски потенциальных торцов
Метод не требует обучения модели и работает на CPU.
Результаты
Метод действительно даёт первичный сигнал, но имеет существенные ограничения:
-
быстро отсекает явно пустые или нерелевантные области
-
не разделяет плотные пачки профилей
-
чувствителен к освещению и теням
-
даёт ложные срабатывания на посторонние объекты
Вывод
Классические методы CV могут использоваться только как предварительный фильтр.
Для практической задачи подсчёта металлопроката требуется: — детекция объектов (YOLO-подходы) — либо сегментация с учётом перекрытий — адаптация под разные типы профилей
Если у вас есть похожие задачи на производстве или складе — интересно обсудить реальные условия: — типы проката — качество фото — сценарии учёта
P.S. Код базового эксперимента — это около 20 строк на OpenCV. Если нужен код — дайте знать в комментариях, выложу полный сниппет с фильтрацией. Но спойлер: для реальной работы его недостаточно.