Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

COMPRESSION WITH LOSSES OF MULTISPEСTRAL IMAGES THAT ARE BASED ON ARTIFICIAL NEURAL NETWORK

Shishkin O.G. 1
1 Ailamazyan Program Systems Institute of Russian Academy of Sciences
With the connection of the continuous growth in the amount of data requiring fast transmission with constant transmission band of standard radio communication channels, the problem of speeding up this process is sharply raised, which is traditionally solved by improving the methods of information compression. For the purposes of studying the Earth from space, it is of interest to compress images with losses or with limited losses. Presently, there is a number of compression schemes with losses, each of which has its advantages and disadvantages. The urgency of the compression problem is also connected with the problem of compact storage of remote sensing data of the Earth, since graphic data, especially raster image files, occupy a rather large amount of memory. Nowadays tendency in this area is the creation of electronic libraries of Earth remote sensing information within the framework of the development of Earth exploration programs from outer space. These national information systems use satellite data streams to solve a variety of tasks. They have concentrated huge arrays of geospatial data received from satellites, which creates serious problems in the organization of storage and access. The paper presents the method and the results of losses of compression and reconstruction of multispectral imagery using artificial neural networks to increase message rate in remote sensing systems. An analytical review of methods of data compression based on artificial neural networks is conducted. Experimental studies confirming the quality targets have been carried out.
lossy data compression
recirculation neural networks
compression
decompression
multispectral images
data volume
compression ratio

Неизменный подъем размеров информации в системах дистанционного зондирования Земли усложняет оперативность обработки данных, возникает сложность ускорения данного процесса, которая решается за счет совершенствования способов сжатия информации. Решение предоставленной трудности гарантирует: сокращение больших потоков цифровых данных; расширение полосы пропускания каналов; наращивание размеров памяти выходных регистрирующих устройств; увеличение эффективности в управлении сложными объектами с помощью оперативному получению важных сведений из сжатых данных. Актуальность задачи сжатия связана и с задачей малогабаритного сбережения данных ДЗЗ, потому что графические данные, тем более файлы растровых изображений, занимают довольно огромный размер памяти. Направленность данного алгоритма направлена на создание электронных библиотек обработки информации ДЗЗ в рамках становления программ изучения Земли из космоса. Эти национальные информационные системы используют множество спутниковых данных для заключения всевозможных задач.

Цель исследования: тестирование нейросетевого алгоритма сжатия с потерями с помощью рециркуляционных нейронных сетей. Проведение аналитического обзора работ по сжатию и восстановлению данных для систем дистанционного зондирования Земли.

Материалы и методы исследования

Есть достаточная численность всевозможных алгоритмов сжатия, той или другой степени, которые отвечают разным конструктивным притязаниям предоставленной области, в которой они используются. К примеру, JPEG отлично подходит для компрессии различных фото, близких к реальности картин; RLE эффективен при компрессии схематичных рисунков, содержащих блоки пикселей 1-го и такого же цвета; для сжатия изображений «в векторе» как правило применяется метод Хаффмана. Все эти методы не универсальны, так как разработаны для компрессии изображений конкретного семейства. Сложившимся образом создание современных алгоритмов, технологий и средств сжатия изображений на сегодняшний день считается важной задачей.

Рассмотрим некоторые работы в области сжатия данных на основе нейросетевых методов. В статье [1] описан подход к сжатию полноцветных изображений с использованием многослойного персептрона. Уточняется зависимость характеристик сжатия от числа слоев и количества нейронов в них, приводятся итоги изучения свойства сжатия и ориентируется лучшая конструкция нейронной сети для заключения задачи сжатия. Предлагаемая автоматическая система, которая разрешает оператору задавать каждую численность нейронных сеток для сжатия данных, отыскать коэффициент, позволяющий опознать скорость изучения сети, квалифицировать подборку и структуру, способна компетентно решать установленные задачи. В структуре системы совершен способ оборотного распространения ошибки. В предлагаемую систему входит оценка издержки свойства данных, графический интерфейс для оператора. Впоследствии изучения нейросети предлагаемая система дает абсолютный доклад о процедуре изучения. Описывается информация о числе и продолжительности серий изучения, в том числе итоговое пиковое отношение сигнала к шуму и среднеквадратичная аномалия.

В работе [2] рассмотренные абстрактные обоснования и способности использования исследованных в работе алгоритмов сжатия изображений для заключения задач, связанных с представлением данных, нахождением доминирующих взаимосвязей между частями случайных полей и настоящих изображений, построением алгоритмов стеганографического скрытия информации. Особенностью исследованных алгоритмов считается их инвариантность к форме фрагментов изображений и обобщение на случай использования гетероассоциативных сжимающих преобразований. Показано, собственно, что использование аппарата искусственного происхождения нейронных сеток для реализации гетероассоциативных сжимающих преобразований дает определённые выдающиеся качества с точки зрения уменьшения времени выполнения процедуры сжатия при наличии раньше обученного преобразователя.

В работе [3] рассматривается метод компрессии данных на базе нейронной сети «Gaussian ART», осуществляющей операцию векторного квантования. Приводятся итоги моделирования предлагаемого метода в среде Matlab, которые признают эффективность применения предоставленного способа.

Процесс компрессии информации состоит из следующих шагов:

− преобразование массива пикселей в массив значений пространственной частоты;

− кластеризация;

− кодирование последовательностей путем принятия решения по каждой выборке;

− кодирование последовательности действий.

Предлагаемый метод компрессии информации включает следующие шаги:

− разбиение изображения или картинки на блоки разных размеров;

− DCT-преобразование к каждому блоку;

− преобразование блока в вектор;

− обучение искусственной нейронной сети;

− считывание нейронов;

− сжатие данных.

В работе [4] проведено изучение фрактального способа сжатия изображений. В разработанном способе фрактального сжатия применяются стеганографические функции, когда в данные (сжатые) изображения имеется возможность внедрять любую информацию, при восстановлении рисунки из ужатых данных качество рисунка не изменяется или же практически не изменяется. Система сжатия произведена из метода встраивания и метода извлечения требуемого сообщения. При размещении сообщения не слишком заметно изменяет изначальную графическую информацию. Программа работает с изображениями, имеющими надлежащие свойства (ограничения): а) формат – лишь только BMP; б) глубина цвета – лишь только 24 бита; в) численность пикселей и величина изображения (минимальный размер) – 32*32 пикселя (3 кб); величина практически сжатого изображения (максимальный размер) – 3100*3100 пикселей (27,4 Мб). Система работает с любыми черно-белыми, так и с цветными картинками, в том числе с разными формами изображений. В интерфейс предлагаемой программы входит:

− качество восстановления;

− количество операций восстановления данных;

− образцы библиотек.

В работе [5] предложен нейросетевой метод сжатия информации. Разработанная программа способна моделировать обучение нейронной сети для сжатия и восстановления графической информации. На вход такой нейросети подается числовой массив, представляющий относительные яркости пикселей изображения. Размерность входного поля составляет 50×50 пикселей. Всего на рецепторном поле требуется 2500 пикселей. Для снижения числа обучаемых весов входное поле было разбито на две части, нижнюю и верхнюю, причем за сжатие каждой области отвечала собственная нейросетевая воронка. При считывании яркости пикселей двумерный массив яркостей преобразовывается в одномерный, который в то же время масштабируется для вхождения в требуемый диапазон значений. В процессе обучения нейронной сети можно наблюдать постепенное нарастающее сходство восстанавливаемого и исходного изображений. Для эксперимента было взято изображение на ткани, нанесенное в печатном цехе. Предложены различные способы понижения размерности пространства поиска оптимальных весовых коэффициентов при помощи разбиения скрытого слоя нейронной сети на несколько меньших слоев. Показано, что при понижении размерности задачи нейросетевая воронка успешно заменяет метод главных компонент, содержащий такие затратные и трудно поддающиеся распараллеливанию операции, как отыскание собственных чисел и собственных векторов матриц.

Чаще всего используются для решения компрессии и декомпрессии данных многослойные персептроны (архитектура «бутылочное горлышко»), которая реализована в разработанной системе [6]. Предлагаемая система способна работать в режиме реального времени. В разработанной системе задается любое количество скрытых слоев и допускается настроить количество искусственных нейронов в любом слое. Процесс компрессии информации состоит из следующих шагов:

− разбиение изображения или картинки на блоки разных размеров;

− каждый блок-фрагмент состоит из определенного количества пикселей;

− значения каждого пикселя подаются на вход нейросети;

− преобразование вектора сжатых данных;

− постоянная величина – коэффициент сжатия.

Нейросеть распределяется на 2 части: на компрессию изображения и на декомпрессию изображения, собственно, что разрешает применить нейросеть во всевозможных приложениях. Для определения параметров весов нейросети в данной системе используется генератор случайных чисел. Метод наискорейшего спуска и способ оборотного распространения ошибки применяется для изучения искусственного происхождения нейронной сети. Не обращая внимания на большое число дефектов (высокая продолжительность розыска направленности минимизации весов и т.д.), программа достаточно хорошо подходит для решения требуемой задачи.

В работе [7] решаются задачи компрессии-декомпрессии изображения. Нейронные сети обучались по методу обратного распространения ошибки метод вычисления градиента, который используется при обновлении весов многослойного перцептрона. Этот итеративный оптимизационный метод действует по принципу градиентного спуска, который применяется для минимизации функции промаха работы искусственного происхождения нейронной сети (скрытый слой содержит наименьшую размерность, входной и выходной слои имеют однообразные размерности, равные размерности сжимаемых данных). Коэффициент сжатия метода определяет cоотношение размерностей входного и укрытого слоёв. На вход нейросеть получает образец входных данных, на выходе нейросеть выдает те же данные, поданные на вход. Создано некоторое количество всевозможных искусственного происхождения нейронных сеток со надлежащими топологиями: 64-32-64, 64-16-64, 16-8-16, 16-4-16. По итогам по компрессии и декомпрессии изображений зарекомендовала нейросеть с топологией 16-4-16 (в среднем 3 с на сжатие и 3,5 с на восстановление).

Результаты исследования и их обсуждение

В настоящей работе для сжатия и восстановления изображений использовались рециркуляционные нейронные сети. Исходное изображение размерностью n×n требуется разделить на множество блоков размерности p×q, где p, q < n, при этом число таких блоков k = n2/(p×q). Все прямоугольники полностью накрывают исходное изображение и не выходят за его границы, при этом допускается перекрытие прямоугольников. Число нейронов первого слоя рециркуляционной сети соответствует размерности окна. На вход нейронной сети подаются фрагменты исходного изображения, получаемые в результате сканирования скользящим окном.

Среднеквадратические ошибки для каждого прямоугольника складываются в суммарную ошибку. В качестве теста при проведении тестирования использовались растровые изображения дистанционного зондирования Земли (рисунок).

hih1a.tif hih1b.tif

Пример обрабатываемых данных

Допускается использование как полноцветных, так и черно-белых изображений. Результаты работы нейросетевого алгоритма сжатия с потерями изображений размером 100x100 пикселей представлены в таблице. Для сравнения двух изображений используется индекс структурного сходства (SSIM, Structure Similarity) [8–10].

Результаты работы нейросетевого алгоритма

Входные данные

Параметры компрессии и результаты сжатия

Восстановленные данные

hihT1.tif

Размер: (49,1 МБ)

Размер блока: 8x8;

Количество нейронов: 8;

Размер сжатого изображения: 6,15МБ;

Степень компрессии: 7;

SSIM: 0,89 %

hihT2.tif

Размер: (49,1 МБ)

hihT3.tif

Размер: 12,3 МБ

Размер блока: 8x8;

Количество нейронов: 6;

Размер сжатого изображения: 1,15 МБ;

Степень компрессии: 10;

SSIM: 0,88 %

hihT4.tif

Размер: 12,3 МБ

hihT5.tif

Размер: 7,67 МБ

Размер блока: 8x8;

Количество нейронов: 8;

Размер сжатого изображения: 2,04 МБ;

Степень компрессии: 7;

SSIM: 0,81 %.

hihT6.tif

Размер: 7,84 МБ

hihT7.tif

Размер: 15,8 МБ

Размер блока: 8x8;

Количество нейронов: 8;

Размер сжатого изображения: 2,9 МБ;

Степень компрессии: 7;

SSIM: 0,83 %.

hihT8.tif

Размер: 15,9 МБ

Тестирование проводилось на персональном компьютере с процессором Intel Core i3-8300.

Заключение

В работе приведены результаты тестирования нейросетевого алгоритма сжатия с потерями. Показано, что рециркуляционные нейронные сети эффективно сжимают и восстанавливают информацию. Проделанный обзор работ свидетельствует о том, что создание новых технологий и средств сжатия изображений по сей день является актуальной задачей. В дальнейших исследованиях автор настоящей работы планирует применить некоторые из рассмотренных методов для решения сжатия и восстановления данных в системах дистанционного зондирования Земли.

Работа выполнена в рамках Программы фундаментальных исследований Президиума РАН № I.2.56 «Фундаментальные основы прорывных технологий в интересах национальной безопасности» (проект «Разработка и исследование методов и технологии высокопроизводительного сжатия целевой информации, передаваемой по каналам космической связи в интересах национальной безопасности Российской Федерации») и проектов РФФИ № 16-07-00096-а «Методы решения навигационных и траекторных задач в бортовых системах интеллектуального управления автономных летательных аппаратов на основе оптимизации конвейерных, разрядных и параллельных вычислений» и № 18-29-03011-мк «Исследование и разработка новых методов и технологий для задач интеллектуального анализа и оптимизации обработки больших потоков данных дистанционного зондирования Земли».