05.00.00 Технические науки
КОМПЛЕКСНЫЕ АЛГОРИТМЫ КЛАССИФИКАЦИИ ВИЗУАЛЬНЫХ ОБЪЕКТОВ НА БАЗЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ
- Категория: 05.00.00 Технические науки
- Создано: 18.06.2021, 14:03
- Просмотров: 689
Мостовщиков Д.Н., Могилатов Р.К., Бабкин О.В.
Email: MostovshchikovАдрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.
Мостовщиков Дмитрий Николаевич – старший системный архитектор,
Li9, Inc., г. Феникс;
Могилатов Роман Константинович - технический руководитель,
Python SoftServe Inc., г. Роли;
Бабкин Олег Вячеславович – старший системный архитектор,
Li9, Inc., г. Феникс,
Соединенные Штаты Америки
Аннотация: проведен анализ современных подходов, применяемых при построении программных и нейросетевых алгоритмов выделения и классификации визуальных объектов в массивах графических данных. Указана необходимость комплексного подхода при организации систем машинного анализа изображения. Предложена комплексная схема машинного анализа, которая включает себе этапы предварительной обработки входных данных (операции восстановления изображения, настройки параметров, сегментации) и работы с визуальными объектами (выделение визуального объекта, определение признаков, классификация). Методика оптимизации алгоритмов машинного анализа базируется на математическом моделировании процессов регистрации и обработки изображения, а также построении целевых функций путем формализации требований, указанных при постановке конкретной задачи по работе с графическими данными. Таким образом, в рамках исследования, проблема оптимизации решается через определения глобальных экстремумов целевых функций, которые являются показателями эффективности выделения и классификации визуальных объектов.
Ключевые слова: графические данные, машинный анализ, визуальный объект, программные алгоритмы, нейросетевые алгоритмы, предварительная обработка изображения, целевые функции.
COMPLEX ALGORITHMS FOR THE CLASSIFICATION OF VISUAL OBJECTS BASED ON MACHINE LEARNING METHODS
Mostovshchikov D.N., Mogylatov R.K., Babkin O.V.
Mostovshchikov Dmitrii Nikolaevich – Senior Systems Architect
LI9, INC., PHOENIX;
Mogylatov Roman Kostyantynovych – Technical Leader,
PYTHON SOFTSERVE INC., RALEIGH;
Babkin Oleg Vyacheslavovich – Senior Systems Architect,
LI9 INC., PHOENIX,
UNITED STATES OF AMERICA
Abstract: the analysis of modern approaches used in the construction of software and neural network algorithms for the selection and classification of visual objects in graphical data arrays is carried out. The need for an integrated approach to the organization of systems for machine image analysis is indicated. A complex scheme of machine analysis is proposed, which includes the stages of preliminary processing of input data (image restoration operations, setting parameters, segmentation) and working with visual objects (highlighting a visual object, determining features, classification). The optimization technique for machine analysis algorithms is based on mathematical modeling of the registration and image processing processes, as well as the construction of target functions by formalizing the requirements specified in the formulation of a specific task for working with graphic data. Thus, within the framework of the study, the optimization problem is solved through the determination of the global extrema of the objective functions, which are indicators of the efficiency of the selection and classification of visual objects.
Keywords: graphic data, machine analysis, visual object, software algorithms, neural network algorithms, image preprocessing, objective functions.
Список литературы / References
- Zou J., Li Z. & Hong D. (2019). Super-Resolution Reconstruction of Images Based on Microarray Camera. Computers, Materials & Continua, 60 (1), 163-177. doi: 10.32604/cmc.2019.05795.
- Rowcliffe J.M., Carbone С., Jansen P.A., Kays R., Kranstauber В. (2011). Quantifying the sensitivity of camera traps: an adapted distance sampling approach. Methods in Ecology and Evolution. 2 (5). 464–476. doi: 10.1111/j.2041-210x.2011.00094.
- Bonneau J. (2020). Financial cryptography and data security: 24th international conference, Fc 2020, Kota Kinabalu, Malaysia, February 10-14, 2020: revised selected papers.
- Bracciali A., Clark J., Pintore F., Rønne P.B. & Sala M. (2020). Financial Cryptography and Data Security Fc 2019 International Workshops, Voting and Wtsc, St. Kitts, St. Kitts and Nevis, February 18-22, 2019, Revised Selected Papers. Springer International Publishing.
- Metheny M. (2013). Security and Privacy in Public Cloud Computing. Federal Cloud Computing, 71-102. doi:10.1016/b978-1-59-749737-4.00004-6.
- Cheng P. & Qu H. (2014). Design and Realization Based on Cloud Stack Hybrid Cloud Computing Platform. Advanced Materials Research, 989-994, 2297-2300.
- Seelamantula C.S. & Blu T. (2015). Image denoising in multiplicative noise. 2015 IEEE International Conference on Image Processing (ICIP). doi:10.1109/icip.2015.7351056.
- Hou J., Tian J. & Liu J. (2005). Spatial image filtering based on wavelet thresholding denoising. MIPPR 2005: Image Analysis Techniques. doi:10.1117/12.652332.
- Zhang C., Liu W. & Xing W. (2018). Color image enhancement based on local spatial homomorphic filtering and gradient domain variance guided image filtering. Journal of Electronic Imaging, 27(06), 1. doi:10.1117/1.jei.27.6.063026.
- Huang C. & Nguyen M. (2019). X-Ray Enhancement Based on Component Attenuation, Contrast Adjustment, and Image Fusion. IEEE Transactions on Image Processing, 28(1), 127-141. doi:10.1109/tip.2018.2865637.
- Petro A. & Sbert C. (2013). Selective Contrast Adjustment by Poisson Equation. Image Processing On Line, 3, 208-222. doi:10.5201/ipol.2013.41.
- Karim T. & Tasneem T. (2014). Analytical Adjustment of Image Contrast. International Journal of Computer Applications, 98(20), 44-49. doi:10.5120/17303-7794.
- Bajla I., Soukup D. & Stolc S. (2011). Occluded Image Object Recognition using Localized Nonnegative Matrix Factorization Methods. Object Recognition. doi:10.5772/14124.
- Han S. & Vasconcelos N. (2006). Image Compression using Object-Based Regions of Interest. 2006 International Conference on Image Processing. doi:10.1109/icip.2006.313095.
- Adam B., Zaman F., Yassin I., Abidin H. & Rizman Z. (2018). Performance evaluation of faster R-CNN on GPU for object detection. Journal of Fundamental and Applied Sciences, 9 (3S), 909.
- Shiga M., Muto S. (2019). Non-negative Matrix Factorization and Its Extensions for Spectral Image Data Analysis. E-Journal of Surface Science and Nanotechnology. 17 (1). 148-154. doi:10.1380/ejssnt.2019.148.
- Azawi N., Gauch J. (2019). Ransac Based Motion Compensated Restoration for Colonoscopy Images. Signal & Image Processing: An International Journal. 10 (4). 9-16. doi:10.5121/sipij.2019.10402.
- Viola Р. and Jones M.J. «Robust real-time face detection», International Journal of Computer Vision. Vol. 57, № 2, 2004. Р 137–154.
- Wang X., Ma H. & Chen X. (2016). Salient object detection via fast R-CNN and low-level cues. 2016 IEEE International Conference on Image Processing (ICIP).
- Alorf A.A. (2016). Performance evaluation of the PCA versus improved PCA (IPCA) in image compression, and in face detection and recognition. 2016 Future Technologies Conference (FTC). doi:10.1109/ftc.2016.7821659.
- Gnouma M., Ladjailia A., Ejbali R., Zaied M. (2018). Stacked sparse autoencoder and history of binary motion image for human activity recognition. Multimedia Tools and Applications, 78 (2), 2157-2179. doi:10.1007/s11042-018-6273-1.
- Qi X., Silvestrov S., Nazir T. (2017). Data classification with support vector machine and generalized support vector machine. doi:10.1063/1.4972718.
- Ren Y., Tang L. (2019). A nonconvex and nonsmooth anisotropic total variation model for image noise and blur removal. Multimedia Tools and Applications, 79 (1-2), 1445-1473. doi:10.1007/s11042-019-08179-8.
- Vincent L. & Heijmans H. (2018). Graph Morphology in Image Analysis. Mathematical Morphology in Image Processing, 170-203. doi:10.1201/9781482277234-6.
- Roerdink J.B. (2018). Mathematical Morphology with Noncommutative Symmetry Groups. Mathematical Morphology in Image Processing, 205-254. doi:10.1201/9781482277234-7.
- Liu K., Lu B., Wei Y. (2013). Better image texture recognition based on SVM classification. MIPPR 2013: Pattern Recognition and Computer Vision. doi:10.1117/12.2031539.
- Budiman A., Fanany M.I. & Basaruddin C. (2014). Stacked Denoising Autoencoder for feature representation learning in pose-based action recognition. 2014 IEEE 3rd Global Conference on Consumer Electronics (GCCE). doi:10.1109/gcce.2014.7031302.
- Liang J., & Liu R. (2015). Stacked denoising autoencoder and dropout together to prevent overfitting in deep neural network. 2015 8th International Congress on Image and Signal Processing (CISP). doi:10.1109/cisp.2015.7407967.
- Menezes J., Poojary N. (2019). Hyperspectral image Data Classification with Refined Spectral-Spatial features based on Stacked Autoencoder approach. Recent Patents on Engineering, 13. doi: 10.2174/187221211366619091114 1616.
- Sercu T. & Goel V. (2016). Advances in Very Deep Convolutional Neural Networks for LVCSR. Interspeech 2016. doi:10.21437/interspeech.2016-1033.
- Zhang Z., Gong C., Liu R. (2017). Face Detection Based on Method Combined RVM and SVM. Computer Science and Artificial Intell doi:10.1142/9789813220294_0058.
- Ganakwar D.G., Kadam V.K. (2019). Face Detection Using Boosted Cascade of Simple Feature. 2019 International Conference on Recent Advances in Energy-efficient Computing and Communication (ICRAECC). doi:10.1109/icraecc43874.2019.8994977.
Ссылка для цитирования данной статьи
Тип лицензии на данную статью – CC BY 4.0. Это значит, что Вы можете свободно цитировать данную статью на любом носителе и в любом формате при указании авторства. | ||
Мостовщиков Д.Н., Могилатов Р.К., Бабкин О.В. КОМПЛЕКСНЫЕ АЛГОРИТМЫ КЛАССИФИКАЦИИ ВИЗУАЛЬНЫХ ОБЪЕКТОВ НА БАЗЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ // Проблемы современной науки и образования № 6 (163), 2021. - С. {см. журнал}. |
Поделитесь данной статьей, повысьте свой научный статус в социальных сетях
Tweet |