Згорткова нейронна мережа з проективно-iнварiантним пулiнгом

dc.contributor.authorБедратюк, Ганна
dc.contributor.authorBedratyuk, Anna
dc.date.accessioned2025-04-08T06:30:31Z
dc.date.available2025-04-08T06:30:31Z
dc.date.issued2025
dc.description.abstractВ статті розглядається проблема класифікації зображень, до яких застосовані проективні перетворення, та пропонується архітектура згорткової нейронної мережі (CNN), що включає проективно-інваріантний пулінговий шар. На відміну від класичних афінних перетворень, для яких існують відомі еквіваріантні перетворення (контрольовані згорткові нейронні мережі, гармонійні H-Nets тощо), задача знаходження проективної еквіваріантності залишається відкритою. В статті зроблено крок у напрямку розв’язання цієї проблеми і запропоновано реалізацію проективно-інваріантного пулінгу. Порівняно із звичайною CNN, ми демонструємо, що додавання такого пулінгу покращує робастність нашої мережі до проективних викривлень. Експерименти проводяться на наборах зображень proMNIST і rotoMNIST, згенерованих із стандартного набору MNIST відповідними перетвореннями.
dc.description.abstractThis paper addresses the challenging problem of image classification under projective transformations and presents a novel approach by incorporating a projective invariant pooling layer into a convolutional neural network (CNN) architecture. While classical affine transformations have been extensively studied, with well-established equivariant architectures such as steerable convolutional neural networks and harmonic H-Nets, achieving projective equivariance remains an open problem in the field of deep learning. To bridge this gap, we introduce a method that extends CNNs by integrating a specialized pooling layer designed to be invariant to projective distortions. This enhancement allows the network to maintain performance and robustness when faced with significant geometric transformations that would otherwise degrade classification accuracy. Our proposed pooling mechanism ensures that the feature extraction process remains stable despite changes in perspective, making it particularly useful for applications involving images captured from varying viewpoints. To validate our approach, we conduct extensive experiments on the proMNIST and rotoMNIST datasets, which we generate by applying projective and rotational transformations to the standard MNIST dataset. Through comparative analysis with conventional CNN architectures, we demonstrate that our method significantly improves classification robustness under projective distortions. The results highlight the potential of incorporating projective invariance into deep learning models, paving the way for further advancements in geometric deep learning and practical applications in fields such as remote sensing, medical imaging, and autonomous navigation.
dc.identifier.citationБедратюк Г. Згорткова нейронна мережа з проективно-iнварiантним пулiнгом / Г. Бедратюк // Вимірювальна та обчислювальна техніка в технологічних процесах. – 2025. – № 1. – С. 201-209.
dc.identifier.urihttps://elar.khmnu.edu.ua/handle/123456789/18258
dc.language.isouk
dc.publisherХмельницький національний університет
dc.subjectзгорткові нейронні мережі
dc.subjectпроективні перетворення
dc.subjectінваріантний пулінг
dc.subjectробастність
dc.subjectаугментації зображень
dc.subjectconvolutional neural networks
dc.subjectprojective transformations
dc.subjectinvariant pooling
dc.subjectrobustness
dc.subjectimage augmentations
dc.subject.udc004.05
dc.titleЗгорткова нейронна мережа з проективно-iнварiантним пулiнгом
dc.title.alternativeConvolutional neural network with projective invariant pooling
dc.typeСтаття
Файли
Контейнер файлів
Зараз показуємо 1 - 1 з 1
Назва:
VOTTP_5_2025+201-209.pdf
Розмір:
654.72 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Назва:
license.txt
Розмір:
4.26 KB
Формат:
Item-specific license agreed upon to submission
Опис:
Зібрання