Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

FEATURES OF TIME-DOMAIN NMR SIGNAL RECOGNITION

Rannev E.V. 1
1 JSC SKB «Chromatec», Yoshkar-Ola
The article deals with linear and nonlinear approaches to solving the problem of distinguishing time-domain nuclear magnetic resonance signal. Within the linear approach, a model of the correlation receiver to distinguish the NMR signals, which is optimal for the special case of simple hypotheses, is considered. Within the nonlinear approach is modeled and unsubstantiated the architecture of the neural network-type three-layer perceptron. The importance of the effect of the redundancy of input data on the quality of recognition and learning is shown. Proposed a method for dimension reduction of data based on the discrete cosine transform and Hartley transform.
NMR
correlation receiver
neural networks

Согласно перечню методов неразрушающего контроля, классифицированных по характеру взаимодействия физических полей или веществ с контролируемым объектом, метод ядерного магнитного резонанса (ЯМР) можно отнести к методам свободных колебаний, заключающихся в обнаружении свободных колебаний, возбужденных в образце и регистрации их параметров.

Под обнаружением сигнала понимают анализ принятого колебания, завершающийся вынесением решения о наличии или отсутствии в нем некоторой полезной составляющей - сигнала. Различение M сигналов определяется как анализ принятого колебания, заканчивающийся принятием решения о том, какой именно из M сигналов, принадлежащих указанному заранее множеству, присутствует в колебании [2].

Рассматривая регистрируемый сигнал ЯМР F(t) как реализацию случайного процесса, имеющего распределение W(F), определим присутствие в нем полезного сигнала как принадлежность W(F) одному из M непересекающихся классов Wi (где f). Предположение о том что, f, называется гипотезой Hi. В случае M > 2 проверка гипотезы Hi является многоальтернативной. В общем случае полезный сигнал ЯМР si(t), определенный на временном интервале [0, T], задается в виде линейной комбинации сигналов известной формы (базисных функций), выбранных на основании экспертных оценок, и описывается формулой:

а (1)

В данном случае класс Wi будет содержать более одного распределения, а значит, соответствующая гипотеза Hi является сложной параметрической. Использование линейных корреляционных методов в таком случае не является целесообразным, поскольку построенный для решения данного обширного класса задач обнаружитель окажется слишком сложным [2]. Таким образом, использование корреляционного приемника для различения сигналов ЯМР низкого разрешения является приемлемым лишь для узкого класса частных случаев, когда гипотеза Hi является простой, а класс Wi содержит одно и только одно распределение.

В задачах, сводимых к проверке простых гипотез, например, различения детерминированных сигналов, целесообразно использование критерия минимума среднего риска - критерий Байеса. Однако, поскольку система различения сигналов ЯМР рандомизирована, то априорную вероятность pi присутствия в реализации F(t) сигнала si(t), показывающую, насколько часто при длительной эксплуатации исследуемой системы можно ожидать появления si(t) в y(t), определить затруднительно. Следовательно, возникают сложности в определении вероятностей ошибок первого рода pik = P(Hk|Hi) и рисков от перепутывания сигналов Пik, а значит критерий Байеса, предписывающий добиваться минимума математического ожидания среднего риска, использовать нецелесообразно. Кроме того, вероятность ошибки второго рода - пропуска сигнала pпс в рассматриваемом частном случае различения сигналов ЯМР равна нулю.

В случае отсутствия априорной информации, критерий Байеса сводится к условию минимальности апостериорного среднего риска или максимума апостериорной вероятности P(Hi |F(t)), т.е. вероятности наличия i-го сигнала в F(t), с учетом всех сведений, которые можно извлечь из наблюдаемой реализации.

Вычисление функции правдоподобия W(F(t)|Hi) не требует задания априорных вероятностей, а также вычисления апостериорных средних рисков. Для случая различения M детерминированных сигналов на фоне аддитивного белого шума:

а

где а - энергия i-го сигнала;

а - корреляционный интеграл принятой реализации и i-го сигнала;

а - коэффициент, зависящий только от принятой реализации F(t), а значит, не влияющий на вычисление функции правдоподобия и апостериорных вероятностей i-х сигналов.

Таким образом, в случае различения M детерминированных сигналов одинаковой энергии, в реализации F(t) присутствует тот сигнал si(t), корреляционный интеграл которого максимален [2].

На основании данных выводов построим модель корреляционного приемника, являющегося оптимальным для данного класса частных случаев. С точки зрения теории ЯМР, этот класс задач довольно велик, в частности к нему относится задача определения таких важных характеристик анализируемых веществ, как времена спин-спиновой и спин-решеточной релаксаций.

Сигнал ЯМР si(t) задается в виде:

а

Приемник состоит из детектора, N корреляторов по числу гипотез и решающего блока. Детектор из непрерывного потока информации формирует дискретную выборку на заданном временном интервале, представляющую собой аддитивную смесь полезного сигнала и белого шума. Этот сигнал поступает на вход каждого из корреляторов, в которых вычисляется корреляционный интеграл для i-х гипотез. Значения интегралов поступают в решающий блок, который выбирает гипотезу, обеспечивающую максимум корреляционного интеграла (рисунок).

pic

Структура корреляционного приемника для различения сигналов ЯМР

Все вышеприведенное справедливо в том случае, когда аддитивный шум соответствует нормальному закону распределения.

Произведен анализ шума датчика ЯМР низкого разрешения на соответствие нормальному закону распределения. Эмпирическое распределение, представляющее собой 2000 отсчетов естественного шума датчика ЯМР, задано в виде последовательности равноотносящих значений и соответствующих им абсолютных частот: x1..M, m1..M, где M - число различных возможных значений случайной величины. Абсолютная частота в данном случае для всех i будет равна 1.

Для проверки нулевой гипотезы при заданном уровне значимости α = 0,95 используем критерий Пирсона:

f

где f - теоретическая относительная частота.

По имеющейся выборке определим выборочное среднее значение m и выборочную дисперсию s2.

m = 1

s2 = 187581,3.

Далее определим значения f:

f

где f объем выборки; h = 0,001 - разность между двумя соседними возможными значениями случайной величины; f ‒ нормированное i-е выборочное значение; φ(ui) ‒ плотность вероятности стандартного гауссовского распределения.

По результатам расчетов, получили значение χ2 = 1629,142.

Нулевая гипотеза считается подтвержденной, если критерий χ2 удовлетворяет условию: f где α - статистическая значимость (достоверность); n - количество степеней свободы.

Квантиль распределения хи-квадрат рассчитан с помощью аппроксимации Корниша-Фишера:

f

где

f   2  f

f

f

b

α = 0,95

Квантиль распределения для достоверности α = 0,95 и количества степеней свободы n = M - 3 = 1997:

f.

По результатам проведенного эксперимента, можно сделать вывод, что гипотеза о нормальности распределения подтверждена, и шум датчика ЯМР можно считать нормальным, а значит, использование выбеливающего фильтра в составе корреляционного приемника не требуется.

Как было сказано выше, в общем случае, описываемом формулой (1), когда в регистрируемой реализации находится более одного полезного сигнала, использование линейного корреляционного приемника нецелесообразно, а значит, следует обратиться к системам, реализующим нелинейную обработку данных. Данному условию удовлетворяют системы, основанные на математическом аппарате искусственных нейронных сетей.

В качестве базовой модели был выбран трехслойный персептрон с одним скрытым слоем. Теоретическое обоснование данного выбора основано на теореме Колмогорова и следствий из нее.

Согласно теореме Колмогорова, любая непрерывная функция многих переменных, заданная на замкнутом ограниченном множестве, может быть представлена в виде суперпозиции конечного числа функций одной переменной [3]:

333

где gj и hij - непрерывные функции, причем не зависят от функции F.

В работе [5] был предложен вариант теоремы Колмогорова, имеющий большее практическое значение:

334

В терминах теории нейросетей эту теорему можно сформулировать следующим образом: любую непрерывную функцию нескольких переменных можно с любой точностью реализовать с помощью трехслойного персептрона с достаточным количеством нейронов в скрытом слое [7].

Для проверки данной гипотезы в программном пакете STATISTICA Neural Networks были смоделированы несколько сетей с архитектурой типа трехслойный персептрон, обучавшихся и тестировавшихся на выборке, составленной из реальных сигналов ЯМР низкого разрешения от триглицеридных смесей, зарегистрированных на промышленном ЯМР-анализаторе. Эксперимент показал, что при подаче на вход всех отсчетов сигнала - 2000 точек - сеть оказалась неспособна к обучению для распознавания с приемлемой корреляцией. Повторный эксперимент, в котором использовался уменьшенный входной вектор, составленный из первых 200 точек тех же сигналов, показал, что многослойный персептрон способен обучиться с контрольной ошибкой ≤ 0,003 и коэффициентом корреляции ≥ 0,99.

Для ЯМР-анализаторов низкого разрешения характерна регистрация достаточно большого числа точек - порядка 103...104. Такое количество входов нейронной сети требует существенных вычислительных затрат, поскольку каждый дополнительный входной элемент усложняет сеть, добавляя в ее структуру дополнительные связи, а также, как видно из эксперимента, описанного выше, снижает эффективность обучения сети.

Избыточность входных данных является серьезной проблемой и можно существенно улучшить качество работы и обучения сети, исключив ненужные или малоинформативные переменные на этапе предварительной обработки сигнала либо преобразовать исходный набор данных в новый, включающий в себя меньшее количество переменных, но при этом содержащий максимальное количество информации, заложенной в исходных данных [4].

Традиционно в ЯМР-спектроскопии для анализа отклика спиновых систем используется преобразование Фурье [6]. Однако в других областях в последнее время для обработки информации с успехом начали использовать преобразование Хартли [1], обладающее преимуществами при обработке больших последовательностей вещественных одномерных и двумерных данных.

335

В отличие от преобразования Фурье, отображающего вещественные функции в комплексную область, преобразование Хартли, равно как и косинус-преобразование, осуществляет прямое и обратное преобразование только в вещественной области. Обработка вещественных данных не требует операции с комплексными величинами, поэтому реализация преобразования Хартли требует примерно в два раза меньше машинного времени, чем преобразования Фурье.

Применение дискретного косинус-преобразования (ДКП) и преобразования Хартли к сигналу, регистрируемому на ЯМР-релаксометре, позволяет уменьшить его размерность за счет свертки сигнала и концентрации данных в узкой частотной области. Это становится возможным из-за малых флуктуаций сигнала и медленного изменения его амплитуды, что означает высокую степень корреляции отсчетов между собой. ДКП и преобразование Хартли трансформируют информацию о величинах отсчетов в информацию о скорости изменения этих величин, что напрямую связано со скоростями релаксации протонов в исследуемом образце.

Для проверки эффективности применения тригонометрических преобразований для реорганизации входных данных нейронных сетей с целью улучшения качества распознавания, в пакете STATISTICA Neural Networks было смоделировано обучение сетей архитектуры трехслойный персептрон на наборах данных, использовавшихся в экспериментах, описанных выше. Эти сигналы были обработаны с помощью дискретного преобразования Хартли (ДПХ), дальнейший анализ преобразованных векторов показал, что информацию содержат лишь < 200 отсчетов, сконцентрированных в центральной области, остальные же являются незначащими и подлежат исключению. Полученные после ДПХ и сокращения размерности вектора были поданы на вход смоделированных сетей. Результаты моделирования показали, что большинство сетей смогли обучиться с контрольной ошибкой ≤ 0,003 и коэффициентом корреляции ≥ 0,99.

В результате проведенных исследований было показано, что:

1. Использование корреляционного приемника для задачи различения сигналов ЯМР низкого разрешения целесообразно лишь для узкого класса задач.

2. Искусственные нейронные сети архитектуры типа многослойный персептрон способны решать поставленную задачу с высокой степенью корреляции, однако затруднение вызывает большой объем подаваемых на вход данных, для чего необходимо разработать методы уменьшения размерности сигналов без потери их информативности.

3. С помощью разработанного метода понижения размерности дискретным косинус-преобразованием и преобразованием Хартли возможно существенно сократить объем входных данных без потери качества распознавания.

Рецензенты:

Леухин А.Н., д.ф.-м.н., профессор ГОУ ВПО «Марийский государственный технический университет», г. Йошкар-Ола;

Сидоркина И.Г., д.т.н., профессор ГОУ ВПО «Марийский государственный технический университет», г. Йошкар-Ола.

Работа поступила в редакцию 11.07.2011.