Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

DEVELOPMENT OF SOFTWARE TOOLS FEATURE FOR TESTING METALLURGICAL ENTERPRISE INFORMATION SYSTEM

Chiryshev Yu.V. 1 Aksenov K.A. 1 Sysoletin E.G. 1 Belan S.B. 2 Pereskokov S.A. 2
1 Ural Federal University named after the first President of Russia B.N. Yeltsin
2 I-Teco
This paper presents the development of software tools that are used for testing metallurgical enterprise information system. These tools have been developed feature for data collection and initial loading into a data warehouse. Authors of a study made some principles based upon ETL processes that use for software development. The proposed approach is implemented in the event sequence assembly subsystem of the metallurgical information system. The technique and results of loading data into the target metallurgical enterprise information system are described. Examples of simulations models of metal industry process optimization and improvement are provided based on multi agent resources conversion process approach.
ETL processes
automated information system
data warehouse
operation testing
metal industry
software reliability
big data

Одной из задач, решаемых на этапе подготовки автоматизированной информационной системы (АИС) к вводу в действие, является обеспечение качественных и количественных показателей функционирования АИС согласно техническому заданию (ТЗ). При разработке промышленных систем проверка на работоспособность и соответствие ТЗ осуществляется на этапах предварительных испытаний и опытной эксплуатации. В процессе испытаний учитывается широкий круг требований, обеспечивающих единый критерий качества системы и влияющих, в конечном счете, на работу системы в реальных условиях промышленной эксплуатации [2]. Разумеется, для каждой системы требования будут различными, так как должна учитываться специфика конкретного предприятия и функциональность самой АИС. Несмотря на это, можно выделить несколько основных требований, общих для всех систем:

1) хранение и использование информации;

2) выполнение заданных функций системы;

3) интеграция и организация информационных потоков системы;

4) надежность и применимость системы.

Поскольку основной функцией любой АИС является хранение и работа с огромными объемами данных в течение довольно длительного периода времени, то необходимой основой для проведения таких испытаний являются инструментальные средства, позволяющие осуществить сбор и наполнение хранилища данных АИС.

В данной работе рассмотрена архитектура и принцип работы автоматизированной системы восстановления последовательности событий (АС ВПС), произошедших в ходе выпуска единиц металлургической продукции – это программный комплекс, который разработан и используется как инструмент, облегчающий процесс подготовки и проведения опытной эксплуатации АИС «Автоматизированная система выпуска металлургической продукции (АС ВМП)» [1, 5–6, 8–9]. Источниками данных АС ВПС являются наборы технологических дампов металлургического предприятия. Информационное обеспечение представляет собой реляционную базу данных Sybase.

Загрузка данных как ETL-процесс

Основной целью разработки АС ВПС является решение задачи по первичному наполнению хранилища данных АС ВМП сразу после развёртывания системы с целью дальнейшей аналитической обработки и комплексного тестирования системы. В первичное наполнение включается нормативно-справочная информация, заранее известные объекты и ресурсы, а также информация о процессах и параметрах, связанных с выпуском металлургической продукции. К первой группе относятся справочники параметров, единиц измерения и ресурсы, соответствующие структуре предприятия, такие как подразделения, агрегаты, процессы на агрегатах [3]. Эта информация требует редкой актуализации или вовсе не требует таковой. Ко второй группе относятся данные, соответствующие процессам деятельности предприятия, к ним относится информация о технологических, логистических и организационных процессах, а также значения параметров, определяющих состояния и условия протекания процессов, характеристики исходного сырья и готового продукта.

Анализ производственных процессов и структуры исходных данных металлургического предприятия [1, 3–4] показал, что извлечение данных и перенос их в хранилище данных (ХД) AC ВМП с целью дальнейшей аналитической обработки связаны с рядом проблем, основными из которых являются нижеследующие:

– исходные данные не соответствуют формату данных, допустимому для загрузки в ХД;

– данные в ряде таблиц являются «грязными» (содержат ошибки, которые мешают их корректному переносу (пропуски данных или наличие фиктивных значений));

– объем базы данных велик, что влечет накладные расходы на поиск, проверку и сортировку содержимого базы и, соответственно, на процесс импорта данных в целом.

Поэтому для переноса исходных данных из дампов предприятия в ХД АС ВМП следует использовать специальный инструмент, который обеспечивает последовательное извлечение данных и преобразование их в единый формат, поддерживаемый ХД. Очевидно, что поскольку ХД системы построено на определенной для металлургического предприятия модели данных, а интерфейс загрузки/выгрузки данных является событийным [3], то и процесс импорта должен разрабатываться с учетом всех особенностей используемой модели.

В данной работе задача импорта рассматривается с точки зрения процесса консолидации данных. Консолидация – это комплекс методов и процедур, направленных на извлечение данных из различных источников, обеспечение необходимого уровня их информативности и качества, преобразование в единый формат, в котором они могут быть загружены в хранилище данных или аналитическую систему. Комплекс программных средств, основанный на консолидации данных, имеет обобщенное название ETL (extraction, transformation, loading – извлечение, преобразование, загрузка [4]). Сам процесс переноса данных и связанные с ним действия называются ETL-процессом, а соответствующие программные средства – ETL-системами.

Независимо от особенностей построения и функционирования ETL-система обеспечивает выполнение трех основных этапов процесса переноса данных (ETL-процесса):

1) извлечение данных, на этом этапе данные извлекаются из одного или нескольких источников и подготавливаются к преобразованию;

2) преобразование данных, производятся преобразование форматов и кодировки данных, а также их обобщение и очистка;

3) загрузка данных, осуществляется запись преобразованных данных в систему хранения.

Существует несколько подходов к реализации процессов ETL. Общепринятый подход состоит в извлечении данных из систем источников, размещении их в промежуточной области дисковой памяти, выполнении в этой промежуточной области процедур преобразования и очистки данных, а затем загрузки данных в ХД [4].

Размещение извлеченных данных в промежуточной области означает запись данных в БД или файлы дисковой подсистемы. Альтернативным подходом к реализации процесса ETL является выполнение преобразований в оперативной памяти и непосредственную загрузку в ХД [4].

Преобразование данных в оперативной памяти выполняется быстрее, чем при размещении их предварительно на диске. Однако применение такого подхода лимитируется размером порции загружаемых данных. Если размер порции загружаемых данных достаточно большой, то необходимо использовать промежуточную область.

Архитектура подсистемы восстановления последовательности событий

На рис. 1 представлена функциональная структура системы и ее взаимодействие с внешними системами.

pic_58.tif

Рис. 1. Структура АС ПВС

Подсистема восстановления последовательности построена по ETL-архитектуре. Ядром подсистемы является набор импортеров (программных пакетов), обеспечивающих формирование одностороннего потока данных из сервера баз данных металлургического предприятия в модуль обмена данными с автоматизированными системами предприятия (ОДАСП). В архитектуре выделены следующие компоненты:

Модуль взаимодействия с сервером металлургического предприятия. Выгрузка информации из БД осуществляется посредством механизма JDBC. Этот механизм представляет собой набор классов, написанных на языке Java и обеспечивающих связь АС ВПС с СУБД металлургического предприятия посредством выполнения SQL-запросов. Для стыковки реляционной модели данных с объектно-ориентированным представлением данных используется механизм «мапинга», обеспечивающий преобразование табличных данных в объектное представление [4]. Соответственно любой импортер может читать данные из дампов металлургического предприятия и работать с ними как с обычными объектами.

Модуль преобразования данных. Основной задачей, решаемой на данном этапе, является процесс преобразования данных к виду, соответствующему структуре данных ОДАСП. Независимо от характера выгружаемых данных из базы металлургического предприятия, будь то данные о процессах, единицах продукции или параметрах, в конечном счете, каждым импортером формируются «события» [3]. Перед формированием исходных данных в пакеты событий происходит три стадии обработки:

1. Временное согласование данных. Данный шаг предполагает выстраивание данных в хронологическом порядке – от прошлого к настоящему, который соответствует последовательности технологических процессов получения чугуна, стали, проката и т.д. Такое упорядочивание необходимо для выстраивания генеалогии единиц продукции в том порядке, в котором они формировались в ходе металлургических переделов [3].

2. Исправление и очистка данных. Данный шаг связан с тем, что при переносе информации в ХД приходится сталкиваться с потоками «грязных» данных, которые могут стать причиной некорректных результатов анализа в дальнейшем.

3. Поиск дубликатов. На данном этапе решается задача согласования загружаемых данных с данными, которые уже загружены в ОДАСП. Такая проверка необходима, чтобы при многократном запуске процедуры импорта контролировать те данные, которые на данный момент уже загружены в хранилище.

Интерфейсный модуль взаимодействия. Функцией данного модуля является обеспечение взаимодействия АС ВПС с сервером ОДАСП. Интерфейсный модуль осуществляет формирование требуемого запроса к серверу – «события» в терминах ОДАСП, его кодирование и отправку с использованием протоколов HTTP, SocketIO и UDP.

Загрузка данных проводится с помощью автоматических сценариев, эмулирующих работу смежных информационных систем предприятия. Сценарии написаны на языке высокого уровня Java и соответствуют конверторным процессам и процессам переработки металла сталеплавильного и прокатного передела металлургического предприятия. В основе эмуляции заложены следующие принципы:

1) главной составной частью процесса загрузки данных является сценарий (последовательность технологических действий по выпуску металлургической продукции);

2) сценарий соответствует стадии переработки металла в рамках одного цеха или агрегата металлургического предприятия;

3) сценарий состоит из нескольких шагов.

Каждый шаг соответствует определенной технологической операции: выплавка, доводка, вакуумирование, разливка стали, порезка слябов т. д.

Поскольку перемещение огромного массива данных из источников в модуль ОДАСП является достаточно медленным процессом, важно учитывать его производительность. Для повышения производительности загрузки данных в АС ВПС реализованы классы, обеспечивающие многопоточный режим работы сценариев. Сценарии позволяют загружать либо все данные, хранящиеся в БД, либо выборочные, например, определенную марку стали или данные за некоторый промежуток времени. Такой выбор глубины выгрузки исторических данных и их состав обеспечивает компромисс между объемом выгружаемых данных и их ценностью с точки зрения дальнейшего анализа. Состав импортируемых данных, а также величина временного интервала определяются в соответствии с пользовательскими настройками.

В целом процесс импорта включает две фазы: этап первичной загрузки данных и этап потоковой загрузки данных. Первый этап предназначен для начального импорта данных о структуре предприятия. Он позволяет занести начальную структуру (список цехов, агрегатов в каждом цехе) для корректного запуска сценариев импорта данных. После загрузки структуры предприятия происходит процедура регистрации справочников параметров. Обе процедуры выполняются автоматически. Второй этап – основной режим работы, связанный с непосредственным выполнением сценариев по импорту данных.

Результаты исследований и их обсуждение

Загрузка данных осуществлялась с нескольких рабочих станций, на которых были установлены компоненты АС ВПС. Поскольку каждый сценарий импорта является лишь частью полного цикла выпуска продукции и эмулирует стадии получения и переработки металла только в рамках одного передела предприятия, каждая станция выполняла загрузку данных за определенный временной интервал. В качестве временного отрезка был выбран один год работы металлургического предприятия. Такое решение позволило в отведенные для загрузки сроки (720 часов) и без привлечения большого количества единиц вычислительных средств импортировать в целевую систему исторических данных в общем объеме 1,5 ТБ, что эквивалентно объему данных, сгенерированному информационными системами металлургического предприятия за три года работы. На рис. 2 приведен количественный состав загруженных данных (плавок) с процентным отношением марок стали для конвертерного и электросталеплавильного производства.

pic_59.tif pic_60.tif

а б

Рис. 2. Диаграмма плавок: а – электросталеплавильного производства; б – кислородно-конвертерного производства

Кроме данных о выплавке при проведении экспериментов загружались данные о следующих стадиях получения и переработки металла: производство сортовой и слябовой заготовки для дальнейшего передела в сортовой и листовой прокат; производство горячекатаного и холоднокатаного проката; производство горячеоцинкованного проката и проката с полимерным покрытием.

Заключение

Разработка и эксплуатация автоматизированной системы восстановления последовательности событий показала полную приемлемость системы для нужд проведения предварительных испытаний и опытной эксплуатации АС ВМП. На основе данных, загруженных средствами АС ВПС, был реализован и апробирован ряд решений, в первую очередь имитационных моделей [1, 5–7, 10], направленных на оптимизацию технологических и логистических процессов металлургического предприятия. Кроме этого, применение данного средства позволило получить статистические характеристики для подтверждения качественных и количественных показателей надежности АС ВМП.

Работа выполнена в рамках договора № 02.G25.31.0055 (проект 2012-218-03-167) при финансовой поддержке работ Министерством образования и науки Российской Федерации.