Более десяти последних лет отечественная система высшего профессионального образования находится на этапе внедрения компетентностного подхода. По всей вероятности, большинству участников образовательного процесса пришло понимание сути этого подхода. Однако окончательное внедрение компетентностного подхода произойдет еще не скоро. Естественно, что автоматизация хотя бы некоторых процессов создания компетентностной модели и выбора дисциплин учебного плана в какой-то мере будет способствовать решению этой проблемы.
В данной статье рассматривается задача поиска дисциплин, соответствующих заданной компетенции. Решение осуществляется на основе применения латентно-семантического анализа и нечетких нейронных сетей.
Методика решения задачи
Для того чтобы система имела понятие о сути компетенции, построим для каждой компетенции ее иерархическую структуру. На первом уровне компетенция разбивается на составляющие, которые на следующем уровне снова декомпозируются. Декомпозиция заканчивается на уровне «простых» терминов. Для примера рассмотрим общепрофессиональную компетенцию ОПК-4 «Способность применять в профессиональной деятельности основные методы и средства автоматизации проектирования, производства, испытаний и оценки качества программного обеспечения» по направлению подготовки 02.03.03 «Математическое обеспечение и администрирование информационных систем». В ней можно выделить три составляющие:
1) способность применять в профессиональной деятельности основные методы и средства автоматизации проектирования программного обеспечения;
2) способность применять в профессиональной деятельности основные методы и средства производства программного обеспечения;
3) способность применять в профессиональной деятельности основные методы и средства испытаний и оценки качества программного обеспечения.
Каждая из приведенных составляющих разбивается на компоненты. Например, третья составляющая имеет следующие компоненты:
а) способность применять в профессиональной деятельности основные методы и средства испытаний программного обеспечения:
– способность применять в профессиональной деятельности основные методы испытаний программного обеспечения;
– способность применять в профессиональной деятельности основные средства испытаний программного обеспечения;
б) способность применять в профессиональной деятельности основные методы и средства оценки качества программного обеспечения:
– способность применять в профессиональной деятельности основные методы оценки качества программного обеспечения;
– способность применять в профессиональной деятельности основные средства оценки качества программного обеспечения.
Минимум четырехуровневая иерархия компетенции ОПК-4 имеет форму дерева. Листочки дерева содержат термины (например, «основные методы испытаний программного обеспечения»), по которым можно осуществлять запросы в Wikipedia. Трассировка статей Wikipedia позволяет выделить нужную информацию об объекте поиска (термине, содержащемся в листе дерева). Будем считать, что коллекция статей с найденной информацией по всем терминам листочков составляет содержание компетенции.
С другой стороны, по многим направлениям подготовки в интернете имеются рабочие программы по различным дисциплинам. При формировании коллекции рабочих программ по соответствующему направлению подготовки можно рассмотреть включение дисциплин и по смежным направлениям подготовки. Коллекция текстов с содержанием дисциплин по направлению подготовки создается посредством трассировки выбранных рабочих программ дисциплин.
Сформированные коллекции позволяют провести над ними латентно-семанти?ческий ана?лиз (ЛСА), который определяет взаимосвязь между коллекциями текстов по дисциплинам и текстами с содержанием компетенции, а также между встречающимися в них терминами на основе сопоставления некоторых факторов (тематики) по всем текстам и терминам. В основе метода латентно-семантического анализа лежат принципы факторного анализа, в частности выявление латентных связей изучаемых явлений или объектов [6]. Латентно-семантический анализ позволил получить расстояния дисциплин до центров компетенций [2]. При этом достоверность результатов была недостаточно высокой.
Для уточнения этих результатов в работе предлагается использовать гибридную модель нейронных сетей и нечеткой логики – ANFIS-сеть. Акроним ANFIS (Adaptive Neuro-Fuzzy Inference System) получил свое название от адаптивной нейро-нечеткой системы вывода типа Сугено. Системы, разработанные по нейро-нечеткой технологии ANFIS, обладают хорошей сходимостью, а субтрактивная кластеризация позволяет синтезировать компактное множество нечетких продукций на основе данных обучающей выборки [1, 5].
Посредством нейро-нечеткой технологии ANFIS в работе смоделирована нечеткая система вывода (FIS) с тремя входами, заданными множеством X = {x1, x2, x3} и одним выходом – y. FIS состоит из четырех компонентов (рис. 1).
Фазиффикатор, применяя функцию принадлежности Гаусса, преобразует значение входного сигнала xj ∈X в нечеткое значение . Нечеткий логический вывод отображает нечеткие множества входного пространства Х на нечеткое множество выходного пространства .
Рис. 1. Схема системы нечеткого вывода
Дефаззификатор представляет собой отображение нечеткого множества в точку y* [3]. Таким образом, каждое из m правил определяется выходным нечетким множеством y ⊂ Y, полученным с помощью вычисления правила вида:
если
(*)
то
где – центр нечеткого множества, являющийся центром i-го кластера, найденного при субтрактивной кластеризации.
Множество входов Х составляют:
а) x1 – расстояние дисциплины от центра компетенции;
б) x2 – относительная частота встречаемости терминов определения компетенции в содержании дисциплин;
в) x3 – относительная частота встречаемости терминов текста самой компетенции в содержании дисциплин.
Выход y* – степень принадлежности дисциплины компетенции.
Экспериментальная часть
Для проведения экспериментов выбраны семь общепрофессиональных компетенций ФГОС 3+ по направлению подготовки 02.03.03 «Математическое обеспечение и администрирование информационных систем». Для формирования коллекции текстов по дисциплинам использован перечень дисциплин, представленный в табл. 1.
Для обучения сети по каждой компетенции были сформированы наборы данных. Пример набора для компетенции ОПК-5 «Владение информацией о направлениях развития компьютеров с традиционной (нетрадиционной) архитектурой; о тенденциях развития функций и архитектур проблемно-ориентированных программных систем и комплексов» показан в табл. 1.
Значения x1 получены в результате выполнения латентно-семантического анализа; x2 и x3 – спектрального оценивания лексических единиц текстов; значения y сформированы экспертом. Обучающая выборка составила 88 образцов (от ОПК-5 до ОПК-8), проверочная и тестовая выборки – матрицы по ОПК-9 и ОПК-10 соответственно.
При проведении субтрактивной кластеризации заданы следующие значения параметров: Range of Influence = 0.4; QuashFactor = 0,95; для AcceptRatio и RejectRatio использованы значения по умолчанию. В результате синтезированы шесть правил вида (*), представленные на рис. 2. Также определена структура нейро-нечеткой сети (рис. 3).
Таблица 1
Набор данных по компетенции ОПК-5
№ п/п |
Дисциплина |
x1 |
x2 |
x3 |
yэ |
1 |
Архитектура вычислительных и компьютерных систем |
0,58 |
0,111 |
0,152 |
1,0 |
2 |
Базы данных и СУБД |
0,8 |
0,016 |
0,061 |
0,0 |
3 |
Дискретная математика |
1,04 |
0,016 |
0,000 |
0,0 |
4 |
Информатика |
0,78 |
0,095 |
0,030 |
0,1 |
5 |
Компьютерное моделирование |
0,75 |
0,095 |
0,030 |
0,0 |
6 |
Методы прикладного системного анализа |
0,72 |
0,016 |
0,030 |
0,2 |
7 |
Методы и средства проектирования ПО |
0,82 |
0,032 |
0,030 |
0,0 |
8 |
Метрология, стандартизация и сертификация |
0,93 |
0,111 |
0,000 |
0,0 |
9 |
Объектно-ориентированное программирование |
0,65 |
0,000 |
0,030 |
0,1 |
10 |
Операционные системы |
0,83 |
0,159 |
0,061 |
0,3 |
11 |
Организация ЭВМ и систем |
0,67 |
0,079 |
0,182 |
1,0 |
12 |
Проектирование и архитектура программных систем |
0,83 |
0,032 |
0,212 |
1,0 |
13 |
Рекурсивно-логическое программирование |
0,65 |
0,016 |
0,000 |
0,0 |
14 |
Структуры и алгоритмы обработки данных |
0,76 |
0,095 |
0,000 |
0,0 |
15 |
Системы искусственного интеллекта |
0,75 |
0,016 |
0,061 |
0,2 |
16 |
Система реального времени |
0,73 |
0,016 |
0,030 |
0,2 |
17 |
Теория вероятностей и математическая статистика |
1,04 |
0,016 |
0,000 |
0,1 |
18 |
Теория систем |
0,78 |
0,016 |
0,030 |
0,0 |
19 |
Теория формальных грамматик и автоматов |
0,69 |
0,016 |
0,000 |
0,1 |
20 |
Технология разработки программного обеспечения |
0,77 |
0,000 |
0,061 |
0,3 |
21 |
Функциональное программирование |
0,66 |
0,016 |
0,000 |
0,0 |
22 |
Экономико-правовые основы рынка ПО |
1,06 |
0,032 |
0,000 |
0,0 |
Рис. 2. Множество нечетких продукций
Рис. 3. Нейро-нечеткая сеть
Затем выполнено обучение нейронной сети, ошибки обучения и проверки на пятом шаге составили 0,002 и 0,009 соответственно и больше не изменялись. ANFIS создает систему нечеткого вывода типа Сугено в виде четырехслойной нейронной сети прямого распространения сигнала. На рис. 3 изображена ANFIS-сеть с тремя входами X = {x1, x2, x3} и шестью нечеткими правилами. Согласно рисунку входные сигналы Х (input) соединены с узлами первого слоя (inputmf), в котором расположены термы типа «xi около кластера j».
Каждый входной сигнал xi со своими термами составляют пучок (один столбец шести правил, рис. 2). Соединение xi с термом j есть одна посылка j-го правила. Поэтому выходом этого слоя является степень принадлежности dij значения входа xi j-му терму, вычисленная с помощью функции принадлежности Гаусса. Во втором слое расположены нечеткие продукции, их количество равно количеству кластеров (m), обнаруженных в процессе субтрактивной кластеризации. Посылки, вычисленные в первом слое, поступают в соответствующую нечеткую продукцию (rule, r). В этом слое вычисляется степень выполнения правила dr , которая рассчитывается как t-норма dij и выполняется нормализация степеней выполнения правил r или вычисление относительной степени выполнения правила r:
Третий слой – заключения правил, в узлах которого рассчитывается вклад нечеткого правила в выход сети:
где bi,r – коэффициенты линейной зависимости выходного параметра.
В четвертом слое осуществляется агрегирование результатов всех правил. Этот слой имеет один узел, в котором вычисляется результирующее значение y:
Для обучения ANFIS-сети применен гибридный метод, состоящий из градиентного спуска в виде алгоритма обратного распространения ошибки и метода наименьших квадратов. Алгоритм обратного распространения ошибки настраивает параметры функций принадлежности антецедентов правил. Метод наименьших квадратов применяется для настройки коэффициентов линейной зависимости в заключениях правил.
Каждая итерация процедуры настройки выполняется в два этапа. На первом этапе на входы подается обучающая выборка, и по невязке между желаемым и действительным поведением сети итерационным методом наименьших квадратов находятся оптимальные параметры узлов третьего слоя. На втором этапе остаточная невязка передается с выхода сети на входы, и методом обратного распространения ошибки модифицируются параметры узлов первого слоя. При этом найденные на первом этапе коэффициенты заключений правил не изменяются. Итерационная процедура настройки продолжается, пока невязка превышает заранее установленное значение [5]. Таким образом, обучение завершается настройкой векторов коэффициентов линейной зависимости и параметров функции принадлежности (табл. 2).
Таблица 2
Результирующие данные обучения
Правило Кластер |
Вектор параметров функции Гаусса |
Вектор коэффициентов линейной зависимости |
||
х1 |
х2 |
х3 |
у |
|
1/ cl1 |
[0.1358 0.3795] |
[0.0378 0.0206] |
[0.03544 −0.00193] |
[0.6461 6.024 13.35 −0.1114] |
2/cl2 |
[0.1347 0.6593] |
[0.0314 0.01178] |
[0.03474 0.03078] |
[4.953 −7.413 −2.563 −2.785] |
3/cl3 |
[0.1345 0.8502] |
[0.03073 0.001926] |
[0.03896 0.000531] |
[1.668 −10.04 −10.23 −1.608] |
4/cl4 |
[0.1336 0.8307] |
[0.0331 0.0624] |
[0.0558 0.0695] |
[0.8125 −0.8705 2.218 0.2758] |
5/cl5 |
[0.1316 0.42] |
[0.0311 0.06122] |
[0.03658 0.03686] |
[3.804 2.856 1.039 −2.108] |
6/cl6 |
[0.1336 0.8307] |
[0.02797 0.06264] |
[0.04077 0.02637] |
[0.824 0.3527 4.688 −0.7646] |
Таблица 3
Степени принадлежности дисциплины компетенции ОПК-4
№ п/п |
Наименование дисциплины |
yFIS |
1 |
Методы и средства проектирования ПО |
0,936 |
2 |
Проектирование и архитектура программных систем |
0,758 |
3 |
Технология разработки программного обеспечения |
0,736 |
4 |
Метрология, стандартизация и сертификация |
0,569 |
5 |
Методы прикладного системного анализа |
0,337 |
6 |
Объектно-ориентированное программирование |
0,192 |
7 |
Компьютерное моделирование |
0,167 |
8 |
Теория систем |
0,158 |
9 |
Экономико-правовые основы рынка ПО |
0,130 |
10 |
Функциональное программирование |
0,107 |
11 |
Теория вероятностей и математическая статистика |
0,105 |
12 |
Дискретная математика |
0,103 |
13 |
Информатика |
0,098 |
14 |
Архитектура вычислительных и компьютерных систем |
0,096 |
15 |
Базы данных и СУБД |
0,089 |
16 |
Системы искусственного интеллекта |
0,076 |
17 |
Система реального времени |
0,073 |
18 |
Операционные системы |
0,054 |
19 |
Организация ЭВМ и систем |
0,033 |
20 |
Структуры и алгоритмы обработки данных |
0,032 |
21 |
Рекурсивно-логическое программирование |
0,029 |
22 |
Теория формальных грамматик и автоматов |
0,010 |
Как видно из табл. 2, четвертый и шестой кластеры можно объединить, тогда количество правил будет равно пяти, что незначительно влияет на погрешность вычислений.
Результаты
Для проверки работоспособности были обработаны данные по компетенции ОПК-4 «Способность применять в профессиональной деятельности основные методы и средства автоматизации проектирования, производства, испытаний и оценки качества программного обеспечения», не участвовавшие в создании ANFIS-сети. В табл. 3 данные отсортированы по убыванию вычисленного значения yFIS. Результаты показывают, что первые четыре дисциплины, перечисленные в табл. 3, являются основными для компетенции ОПК-4, т.е. это межпредметная компетенция, и результаты обучения должны быть распределены между этими четырьмя дисциплинами.
Таким образом, данные проведенных экспериментов показали, что предложенный подход можно использовать для уточнения результатов латентно-семантического анализа.
Заключение
В работе исследована часть компетенций, по которым достаточно легко построить их иерархические структуры. Анализ компетенций по направлению подготовки 02.03.03 – «Математическое обеспечение и администрирование информационных систем» показал, что все компетенции условно можно разбить на три группы по отношению к сложности построения иерархической структуры в автоматическом режиме. Первая группа компетенций рассмотрена в данной статье. Построение иерархий для второй и третьей групп пока возможно только в автоматизированном режиме. В дальнейшем требуется провести эксперименты для компетенций всех трех групп компетенций.
Библиографическая ссылка
Найханова Л.В., Дышенов Б.А. ПРИМЕНЕНИЕ НЕЙРО-НЕЧЕТКОЙ СИСТЕМЫ ВЫВОДА ДЛЯ УСТАНОВЛЕНИЯ ДИСЦИПЛИН, СООТВЕТСТВУЮЩИХ КОМПЕТЕНЦИИ ОБРАЗОВАТЕЛЬНОГО СТАНДАРТА // Фундаментальные исследования. – 2016. – № 5-1. – С. 47-52;URL: https://fundamental-research.ru/ru/article/view?id=40248 (дата обращения: 11.09.2024).