Згорткова нейронна мережа з проективно-iнварiантним пулiнгом

Вантажиться...
Ескіз
Дата
2025
Назва журналу
Номер ISSN
Назва тому
Видавець
Хмельницький національний університет
Анотація
В статті розглядається проблема класифікації зображень, до яких застосовані проективні перетворення, та пропонується архітектура згорткової нейронної мережі (CNN), що включає проективно-інваріантний пулінговий шар. На відміну від класичних афінних перетворень, для яких існують відомі еквіваріантні перетворення (контрольовані згорткові нейронні мережі, гармонійні H-Nets тощо), задача знаходження проективної еквіваріантності залишається відкритою. В статті зроблено крок у напрямку розв’язання цієї проблеми і запропоновано реалізацію проективно-інваріантного пулінгу. Порівняно із звичайною CNN, ми демонструємо, що додавання такого пулінгу покращує робастність нашої мережі до проективних викривлень. Експерименти проводяться на наборах зображень proMNIST і rotoMNIST, згенерованих із стандартного набору MNIST відповідними перетвореннями.
This paper addresses the challenging problem of image classification under projective transformations and presents a novel approach by incorporating a projective invariant pooling layer into a convolutional neural network (CNN) architecture. While classical affine transformations have been extensively studied, with well-established equivariant architectures such as steerable convolutional neural networks and harmonic H-Nets, achieving projective equivariance remains an open problem in the field of deep learning. To bridge this gap, we introduce a method that extends CNNs by integrating a specialized pooling layer designed to be invariant to projective distortions. This enhancement allows the network to maintain performance and robustness when faced with significant geometric transformations that would otherwise degrade classification accuracy. Our proposed pooling mechanism ensures that the feature extraction process remains stable despite changes in perspective, making it particularly useful for applications involving images captured from varying viewpoints. To validate our approach, we conduct extensive experiments on the proMNIST and rotoMNIST datasets, which we generate by applying projective and rotational transformations to the standard MNIST dataset. Through comparative analysis with conventional CNN architectures, we demonstrate that our method significantly improves classification robustness under projective distortions. The results highlight the potential of incorporating projective invariance into deep learning models, paving the way for further advancements in geometric deep learning and practical applications in fields such as remote sensing, medical imaging, and autonomous navigation.
Опис
Ключові слова
згорткові нейронні мережі, проективні перетворення, інваріантний пулінг, робастність, аугментації зображень, convolutional neural networks, projective transformations, invariant pooling, robustness, image augmentations
Бібліографічний опис
Бедратюк Г. Згорткова нейронна мережа з проективно-iнварiантним пулiнгом / Г. Бедратюк // Вимірювальна та обчислювальна техніка в технологічних процесах. – 2025. – № 1. – С. 201-209.
Зібрання