Russian Chinese (Simplified) English German

Публикация научных работ

Publication of scientific papers foto Журнал «Проблемы современной науки и образования» выходит ежемесячно, 15 числа (уточняется в месяц выхода). Следующий номер журнала № 09(142), сентябрь 2019 г. Выйдет - 16.09.2019 г. Статьи принимаются до 15.09.2019 г.

Если Вы хотите напечататься в ближайшем номере, не откладывайте отправку заявки. Потратьте одну минуту, заполните и отправьте заявку в Редакцию.

linecolor




05.00.00 Технические науки

ГЛУБОКИЙ АНАЛИЗ ДАННЫХ ПРИ РАБОТЕ С ПРИБЛИЖЕННЫМИ МНОЖЕСТВАМИ

Вишняков А.С., Макаров А.Е., Уткин А.В., Зажогин С.Д., Бобров А.В.

Email: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

 Вишняков Александр Сергеевич – ведущий инженер,

системный интегратор «Крастком»;

Макаров Анатолий Евгеньевич – архитектор решений,

Российская телекоммуникационная компания «Ростелеком»,

г. Москва;

Уткин Александр Владимирович – старший инженер,

Международный системный интегратор «EPAM Systems», г. Минск, Республика Беларусь;

Зажогин Станислав Дмитриевич - старший разработчик,

 Международный IT интегратор «Hospitality & Retail Systems»;

Бобров Андрей Владимирович – руководитель группы,

группа технической поддержки,

 Компания SharxDC LLC,

г. Москва

Аннотация: в статье проводится детальный анализ данных, которые исследуются с использованием теории приближенных множеств, в плане нахождения разнообразных свойств объектов на основе исследования связей между их атрибутами. Рассматриваются популярные научные работы в рамках тематики данной статьи.

Приводится описание работы основных современных технологий Data Mining на основе использования концепции шаблонов, которые способны отыскать многофункциональные взаимоотношения в исследуемых данных. Аргументируется то, что использование основных методов Data Mining играет главную роль во время глубокого анализа данных при работе с приближенными множествами, поскольку позволяет решать задачи разной природы происхождения.

В статье подробно анализируются основные этапы протокола CRISP-DM, который позволяет разработать предсказательные модели, последние, в свою очередь, способны решить большой круг задач, которые возникают при построении бизнеса. Исследованы основные шесть этапов, где основным является третий этап, на котором подготавливаются данные, которые должны соответствовать формату поставленной задачи за различными качественными свойствами.

Осуществляется обзор подходов к обобщению и приводится сравнительный анализ по поводу их применения при работе с реальными массивами данных. Для визуализации уровней, извлекаемых из данных знаний, предложен рис. 1, а также на рис. 2. приведены основные дисциплины, которые входят в систему Data Mininсg.

Ключевые слова: машинное обучение, глубокий анализ, массив, данные, модель, бизнес-процесс, шаблон, математическая статистика, выборка, алгоритм, система анализа.

DEEP DATA ANALYSIS WHEN WORKING WITH APPROXIMATE SETS

Vishniakov A.S., Makarov A.E., Utkin A.V., Zazhogin S.D., Bobrov A.V.

Vishniakov Alexandr Sergeevich – Lead System Engineer,

SYSTEM INTEGRATOR «KRASTCOM»;

Makarov Anatoly Evgenevich – Solutions Architect,

ROSTELECOM INFORMATION TECHNOLOGY,

MOSCOW;

Utkin Alexander Vladimirovich – Senior Engineer,

INTERNATIONAL SYSTEM INTEGRATOR EPAM SYSTEMS, MINSK, REPUBLIC OF BELARUS;

Zazhogin Stanislav Dmitrievich – Senior Software Engineer,

International IT Integrator Hospitality & Retail Systems;

Bobrov Andrei Vladimirovich – Team leader,

TECHNICAL SUPPORT GROUP,

SHARXDC LLC,

MOSCOW

Abstract: The article provides a detailed analysis of the data that are studied using the theory of approximate sets, in terms of finding the various properties of objects based on the study of the relationships between their attributes. Considered popular scientific work in the framework of this article.

Describes the work of the main modern Data Mining technologies based on the use of the concept of templates that are able to find multifunctional relationships in the studied data. It is argued that the use of basic methods of Data Mining plays a major role during in-depth data analysis when working with approximate sets, because it allows solving problems of different origin.

The article analyzes in detail the main stages of the CRISP-DM protocol, which allows you to develop predictive models, the latter, in turn, are able to solve a wide range of tasks that arise when building a business. The basic six stages are investigated, where the main is the third stage on which the data are prepared, which should correspond to the format of the task for different qualitative properties.

A review of approaches to generalization is carried out and a comparative analysis is given about their use when working with real data arrays. To visualize the levels of knowledge extracted from these data, Figure 1 is proposed, as well as Figure 2. Shows the main disciplines that are part of the Data MinInc system.

Keywords: machine learning, in-depth analysis, array, data, model, business process, template, mathematical statistics, sampling, algorithm, analysis system.

Список литературы / References

  1. Базы данных. Интеллектуальная обработка информации / В. Корнеев, А. Гареев, С.В. Васютин, В.В. Райх. М.: Нолидж, 2001. 653 с.
  2. Вагин В.Н. Знание в интеллектуальных системах // Новости искусственного интеллекта, 2002. № 6 (54). [Электронный ресурс]. Режим доступа: http://www.raai.org/about/persons/vagin/pages/vagin_zn.doc/ (дата обращения: 10.06.2019); Финн В.К. Об интеллектуальном анализе данных // Новости искусственного интеллекта, 2004. № 3.
  3. Куликов А.В., Фомина М.В. Разработка алгоритма обобщения понятий с использованием подхода, основанного на теории приближенных множеств / Труды шестой международной конференции по технологии программирования на основе знаний // Под ред. В. Стефанюка и К. Каджири. IOS Press, 2004. С. 261–268 (на англ. яз.).
  4. Прикладная статистика: Классификация и снижение размерности / С.А. Айвазян, В.М. Бухштабер, И.С. Юнюков, Л.Д. Мешалкин. М.: Финансы и статистика, 2003. 483 с.
  5. Lan A.S. et al. Mathematical languageprocessing: Automatic grading and feedback for open response mathematical questions // Proceedings of the Second (2015) ACM Conference on Learning@ Scale. ACM, 2015. С. 167–176.
  6. Parsaye К.A Characterization of Data Mining Technologies and Processes // The Journal of Data Warehousing, 1998. № 1.

Ссылка для цитирования данной статьи

Publication-of-scientific-papers-copyright    

Вишняков А.С., Макаров А.Е., Уткин А.В., Зажогин С.Д., Бобров А.В. ГЛУБОКИЙ АНАЛИЗ ДАННЫХ ПРИ РАБОТЕ С ПРИБЛИЖЕННЫМИ МНОЖЕСТВАМИ // Проблемы современной науки и образования  № 6(139), 2019. - С. {см. журнал}.

Publication of scientific papers 2

Поделитесь данной статьей в социальных сетях

        
  
  

Старый сайт

oldsite Старая версия сайта >>>

Импакт-фактор российских научных журналов
 
  Рейтинг@Mail.ru
 

Контакты

  • Адрес: 153008, Россия, г. Иваново, ул. Лежневская, д. 55, 4 этаж. Время работы: с 10-00 до 18-00. Кроме выходных.
  • Tel: +7(910)690-15-09
  • Fax: +7(910)690-15-09
  • Email: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
  • Website: http://www.ipi1.ru/
  • Вконтакте: http://vk.com/scienceproblems
Вы здесь: Главная Статьи 05.00.00 Технические науки ГЛУБОКИЙ АНАЛИЗ ДАННЫХ ПРИ РАБОТЕ С ПРИБЛИЖЕННЫМИ МНОЖЕСТВАМИ