Порівняння методів виявлення об’єктів в комп’ютерному зорі

Цивадиць, П.; Скрипник, Т.; Вознюк, Л.; Tsivadits, P.; Skrypnyk, T.; Vozniuk, L.

Порівняння методів виявлення об’єктів в комп’ютерному зорі

dc.contributor.author	Цивадиць, П.
dc.contributor.author	Скрипник, Т.
dc.contributor.author	Вознюк, Л.
dc.contributor.author	Tsivadits, P.
dc.contributor.author	Skrypnyk, T.
dc.contributor.author	Vozniuk, L.
dc.date.accessioned	2024-06-12T20:10:10Z
dc.date.available	2024-06-12T20:10:10Z
dc.date.issued	2024
dc.description.abstract	Виявлення об’єктів є фундаментальним завданням комп’ютерного зору, із застосуваннями, починаючи від автономного водіння до систем спостереження. У цій статті представлено повне порівняння різних методів виявлення об’єктів. Оцінені методи включають традиційні методи, такі як логістична регресія та SVM, а також найсучасніші архітектури глибокого навчання, такі як YOLO (You Only Look Once), SSD (Single Shot MultiBox Detector), FPN (Feature Pyramid Network). , RetinaNet. YOLO надає пріоритет швидкості обробки в реальному часі, що робить його ідеальним для додатків, які потребують швидкого виявлення, наприклад, для безпілотних автомобілів. Однак такий наголос на швидкості може знизити точність порівняно з іншими методами. SSD забезпечує переконливий баланс між швидкістю та точністю, досягаючи швидшої обробки, ніж деякі методи, зберігаючи хороші можливості виявлення. FPN вирішує проблему виявлення об’єктів у різних масштабах на зображенні. Використовуючи функцію Feature Pyramid Network, він може ефективно аналізувати як малі, так і великі об’єкти в одній структурі. З іншого боку, RetinaNet зосереджується на підвищенні точності шляхом впровадження функції фокальних втрат, яка пом’якшує проблему дисбалансу класів, поширену перешкоду в задачах виявлення об’єктів, де певні класи значно перевершують інші. Для класифікації об’єктів YOLO використовує функцію втрат крос-ентропії. Ця функція вимірює різницю між прогнозованим розподілом ймовірностей класу об’єкта та фактичним розподілом класу. Мінімізація цих втрат під час навчання спрямовує модель на більш точні прогнози класу. В роботі проведено аналіз існуючих методів виявлення об'єктів та проведено експеримент із моделлю YOLOv5, навченою на наборі даних COCO.
dc.description.abstract	Object detection is a fundamental task in computer vision, with applications ranging from autonomous driving to surveillance systems. This article presents a comprehensive comparison of various object detection methods. The methods evaluated include traditional methods such as logistic regression and SVM, as well as state-of-the-art deep learning architectures such as YOLO (You Only Look Once), SSD (Single Shot MultiBox Detector), FPN (Feature Pyramid Network), RetinaNet. YOLO prioritizes real-time processing speed, making it ideal for applications demanding swift detection, such as self-driving cars. However, this emphasis on speed might compromise accuracy when compared to other methods. SSD offers a compelling balance between speed and accuracy, achieving faster processing than some methods while maintaining good detection capabilities. FPN solves the problem of detecting objects at different scales in an image. Using the Feature Pyramid Network function, it can effectively analyze both small and large objects in the same structure. RetinaNet, on the other hand, focuses on improving accuracy by introducing a focal loss function that mitigates the class imbalance problem, a common obstacle in object detection tasks where certain classes significantly outperform others. For object classification, YOLO utilizes the cross-entropy loss function. This function measures the difference between the predicted probability distribution of an object's class and the actual class distribution. Minimizing this loss during training guides the model to make more accurate class predictions. The paper analyzes the existing object detection methods and conducts an experiment with the YOLOv5 model trained on the COCO dataset.
dc.identifier.citation	Цивадиць П. Порівняння методів виявлення об’єктів в комп’ютерному зорі / П. Цивадиць, Т. Скрипник, Л. Вознюк // Вісник Хмельницького національного університету. Технічні науки. – 2024. – № 2. – С. 265-268.
dc.identifier.uri	https://elar.khmnu.edu.ua/handle/123456789/16081
dc.language.iso	uk
dc.publisher	Хмельницький національний університет
dc.subject	комп’ютерний зір
dc.subject	виявлення об’єктів
dc.subject	архітектури глибокого навчання
dc.subject	computer vision
dc.subject	object detection
dc.subject	deep learning architecture
dc.subject.udc	004.056
dc.title	Порівняння методів виявлення об’єктів в комп’ютерному зорі
dc.title.alternative	Comparison of object detection methods in computer vision
dc.type	Стаття

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: (333) VKNU-TS-2024-N2-41.pdf
Розмір:: 622.6 KB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 4.26 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Вісник ХНУ. Технічні науки - 2024 рік