Методи розпізнавання та обробки зображень за модифікованою YOLOv5-v1

Вантажиться...
Ескіз
Дата
2023
Автори
Мельниченко, О.
Назва журналу
Номер ISSN
Назва тому
Видавець
Information Technology: Computer Science, Software Engineering and Cyber Security
Анотація
У поданій роботі запропоновано новий підхід згідно глибокого навчання до виявлення, розпізнавання, обробки зображень та обчислення кількості об’єктів, зокрема на прикладі обробки зображень яблук. Відому модель YOLOv5 було взято за основу через її високу точність та швидкість часу обробки даних. YOLOv5 було модифіковано, відповідно до вимог завдання виявлення яблук у робочому середовищі фруктового саду. Запропонований підхід складається із двох етапів: виявлення яблук і обчислення їхньої кількості. На етапі виявлення нова модель YOLOv5-v1 була навчена на створеному вручну наборі даних із зображень яблук для виявлення ознак, які відрізняють яблука від зовнішнього фону. Модель містить нові рівні для модуля BottleneckCSP-v4, замінюючи модуль BottleneckCSP в оригінальній магістральній архітектурі YOLOv5. На етапі обрахування модуль SENet інтегрується в розширену магістральну мережу, щоб краще ідентифікувати ознаки плодів середнього та великого розміру в різних умовах. Початковий розмір прив’язувального блоку початкової мережі було скориговано, щоб запобігти помилковій ідентифікації малих об’єктів на фоні зображення та, таким чином, підвищити точність обчислення кількості. Ефективність підходу було оцінено в результаті проведених обчислювальних експериментів із набором даних зображень яблук. Експериментальні результати на тестовому наборі даних продемонстрували, що вдосконалена модель може ефективно розпізнавати та обчислювати фрукти, зняті відеокамерою безпілотного літального апарату, із показниками recall, precision, mAP та F1 92,13 %, 84,59 %, 87,94 % та 89,02 %. відповідно. Запропонований підхід також було порівняно з іншими сучасними методами, такими як YOLOv5, YOLOv3, YOLOv4 та EfficientDet-D0, і встановлено, що запропонована модель перевершила аналоги за точністю та швидкістю. Середня швидкість розпізнавання запропонованої мережі склала 0,015 секунди на 1 кадр відеоряду (66,7 кадрів/с), що у 2,53, 1,13 та 3,53 рази вище, ніж у мережах EfficientDet-D0, YOLOv4 і YOLOv3, відповідно. Отримані результати мають декілька потенційних застосувань у садівництві, де їх можна використовувати для моніторингу посівів, оцінювання врожайності та контролю якості продукції. Подальші дослідження, також, можуть бути проведені для включення додаткових ознак, таких як форма фрукта, використовуючи більший набір даних для навчання моделі.
Опис
Ключові слова
обробка зображень, виявлення об'єктів, врожайність яблук, YOLOv5, глибоке навчання
Бібліографічний опис
Мельниченко О. Методи розпізнавання та обробки зображень за модифікованою YOLOv5-v1. Information Technology: Computer Science, Software Engineering and Cyber Security. 2023. Вип. 1. С. 74–84. DOI: https://doi.org/10.32782/IT/2023-1-10