Одной из главных целей настоящего исследования является создание единой онтологии компетенций, которая позволила бы сравнивать и сопоставлять между собой требования к компетенциям, как со стороны работодателей, так и со стороны университетов.
Мы придерживаемся парадигмы, что рынок образовательных услуг считается вторичным по отношению к рынку труда, который сам является вторичным по отношению к рынку производства товаров и услуг [1, 2]. Поэтому главным принципом обеспечения возможности сравнения компетенций является, на наш взгляд, приведение в соответствие системы «образовательных» компетенций учебных планов университетов к системе «профессиональных» компетенций работодателя, а не наоборот.
В статье [3] авторами подробно изложена идея информационной системы, описывающей процессы получения компетенций, трудоустройства и управления учебными планами в системе «вуз – студент – работодатель». Для создания такой системы авторы предлагают:
1) связать трудоустройство с процессом получения компетенций через разработку общей онтологии компетенций, объединяющей образовательные и профессиональные компетенции;
2) разработать процесс обратной связи, влияющей на содержание учебных планов вузов на основе мониторинга процессов трудоустройства и получения компетенций.
Большинство профессиональных требований (или, другими словами, компетенций), которые предъявляет работодатель к соискателю работы, находят свое отражение в объявлениях о работе. Таким образом, одним из основных источников информации о компетенциях являются тексты объявлений на требуемые вакансии, которые размещают работодатели в открытом доступе.
В рамках данного подхода мы принимаем допущение, что «скрытая» часть вакансий, которая не публикуются в открытом доступе и реализуется по внутрифирменным каналам, знакомству и т.п., не оказывает существенного влияния на структуру «ядра» компетенций. Поскольку в выбранной нами для рассмотрения IT-отрасли при приеме на работу существует особая специфика, заключающаяся в широком использовании интернет-технологий при поиске работы и высокой эффективности размещения объявлений на специализированных сайтах, популярных в среде IT-специалистов.
Методология исследования основана на одновременном сочетании компетентностного подхода к описанию предметной области и информационного подхода к формализации компетенций различных категорий в виде онтологической модели.
Основными задачами исследования являются разработка системы измерения компетенций для создания многомерной модели компетенций, а также создание алгоритма классификации, с помощью которых неструктурированное множество «профессиональных» компетенций можно было представить в виде онтологии.
Исходные данные и выбор признаков классификации
В качестве первого шага, чтобы приступить к формированию многомерной модели компетенций, были собраны актуальные данные о наиболее востребованных профессиях в IT-сфере. Были проанализированы вакансии наиболее известных мировых работодателей IT-отрасли на таких сайтах поиска работы, как job.com, jobview.monster.com, indeed.com, apple.com, visa.com, hp.com и др.
Исследовались вакансии для ТОР-10 рейтинга наиболее популярных профессий IT-отрасли, регулярно публикуемого на ресурсе jobsearch.about.com. «Here are the top 10 jobs for computer science majors, based on income, employment outlook, and job satisfaction» [4].
Сформированный перечень состоял из следующих профессий, названия которых стали значениями первого параметра измерения OCCUPATION = {Database administrator, Computer hardware engineer, Web developer, Computer network architect, Computer programmer, Computer systems analyst, Information security analysts, Java developer, Project manager, Software engineer}. Для каждой из 10 профессий были рассмотрены вакансии от не менее чем 10 различных работодателей. В результате исследования 100 вакансий был получен общий перечень из 396 уникальных компетенций с указанием количества повторов, если такие наблюдались несколько раз.
Число повторений, представленное параметром COUNT = {1, 2, 3…10}, было выбрано в качестве количественной меры многомерного концептуального представления характеризующей частоту востребованности компетенции.
Сравнительный анализ позволил выявить различные наиболее часто встречающиеся смысловые категории компетенций, которые были выделены в параметр TYPE, представляющий независимое измерение. Параметр TYPE может принимать следующие значения: TYPE = {Knowledge, Skills, Experience}.
Последующий лексический анализ обнаружил, что каждый тип характеризуется некоторым уровнем владения компетенцией. Он описывается показателем LEVEL = {Min, Mid, Max}.
В нашей первой работе [5], посвященной проблеме классификации компетенций, кроме вышеуказанных значений параметра TYPE имелись и другие, TYPE = {Certificat, Degree, Understanding}. В то же время параметр LEVEL принимал 15 различных значений, LEVEL = {None, Basic, General, Possession, Conceptual, Ability, Proficiency, Comfortable, Familiarity, Excellent, Broad, Advanced, Strong, Strength, Expert, Direct}. Основываясь на современных российских образовательных и профессиональных стандартах, нам пришлось пересмотреть параметры классификации и оптимизировать их. Так, показатель TYPE = {Certificat, Degree} вынесен за рамки вышеописанной классификации. Он выделен сейчас как отдельный класс EDU, который характеризуется требованиями к соискателю иметь в наличии диплом о соответствующем образовании. Показатель TYPE = {Understanding} в силу своей похожести объединен с TYPE = {Skills}. Что касается уровней владения компетенцией, все они были также укрупнены исходя из их смысловых значений. Так, LEVEL = {None, Basic, General} теперь соответствует LEVEL = {Min}. LEVEL = {Excellent, Broad, Advanced, Strong, Strength, Expert, Direct} объединен в LEVEL = {Max}. Остальные значения показателя уровня владения отнесены к LEVEL = {Mid}.
Параметры классификации TYPE и LEVEL являются не категориальными, а порядковыми признаками, имеют как лексическое (текстовое), так и соответствующее им целочисленное значение {1, 2, 3}, позволяющее их ранжировать в порядке силы влияния, что важно для последующего анализа онтологии.
Итоговым результатом классификации является параметр «OBJECT», содержащий предметную область компетенции, за вычетом TYPE, LEVEL, грамматик (союзов и предлогов), а также знаков препинания. Например, OBJECT = {Computer Science, Microsoft SQL Server 2008, Communication, Math, , XML, Databases, Java, Linux, etc…}.
Таким образом, предлагаемая система классификации позволяет создать онтологическую модель компетенций в четырех измерениях: «OCCUPATION» – «TYPE» – «LEVEL» – «OBJECT», где количественной мерой является параметр COUNT. Данная система соответствует многомерному концептуальному представлению по Кодду (multi-dimensional conceptual view) [6].
Алгоритм классификации IT-компетенций
Для формирования соответствующей многомерной модели компетенций был разработан алгоритм классификации, с помощью которых неструктурированное множество «профессиональных» компетенций можно было представить в виде онтологии.
Ниже представлен общий алгоритм классификации компетенций.
1. Вызвать процедуру для выбора пользовательского режима разделения/неразделения компетенций, если результат выбора = Ложь, перейти на строку 8.
2. Вызвать алгоритм 1 для разделения компетенции при наличии в ней нескольких типов одновременно.
3. Вызвать алгоритм 2 для разделения компетенции при наличии «,» и «in» или «and».
4. Вызвать алгоритм 3 для разделения компетенции при наличии «with» и «and» или «,» или «or».
5. Вызвать алгоритм 4 для разделения компетенции при наличии «of» и «and» или «,».
6. Вызвать алгоритм 5 для разделения компетенции при наличии «in» и «and» или «or».
7. Конец условия.
8. Вызвать алгоритм 6 для разделения компетенции на отдельные теги (слова).
9. Вызвать алгоритм 7 для определения класса Edu и типа Type компетенций.
10. Вызвать алгоритм 8 для определения уровня владения компетенцией Level.
11. Вызвать алгоритм 9 для определения грамматик Gramm.
12. Вызвать алгоритм 10 для определения предметной области Object.
Важной особенностью предложенного алгоритма является его способность работать в режиме разделения сложных компетенций на простые, когда строка с несколькими компетенциями делится на несколько строк с одной компетенцией в каждой. Такой режим необходим, например, когда в объявлении о работе несколько фактически различных компетенций перечислены в одной строке. Например, компетенция «Experience and knowledge of ETL Development» является сложной, так как совмещает в себе 2 типа компетенций – с одной стороны опыт, с другой – знания. Компетенция «Experience in Microsoft SQL Server 2008, Administration experience» также является сложной, так как в первой ее части до запятой подразумевается непосредственно опыт работы, а во второй части опыт администрирования. Аналогичных примеров в списке компетенций предостаточно.
Возможность алгоритма разделять сложные компетенции на простые повышает корректность результатов его работы. Ниже, в таблице приведены основные метрики качества работы алгоритма в двух режимах – с разделением сложных компетенций на простые и без разделения.
Оценки работы алгоритма классификации
№ |
n |
a |
b |
c |
P |
T |
F |
I |
126 |
119 |
7 |
0 |
1 |
94 % |
97 % |
II |
189 |
175 |
14 |
0 |
1 |
93 % |
96 % |
III |
270 |
225 |
45 |
0 |
1 |
83 % |
91 % |
IV |
483 |
400 |
83 |
0 |
1 |
83 % |
91 % |
В таблице используются следующие обозначения: n – число компетенций; a – правильно распознанные компетенции; b – неправильно распознанные компетенции; c – нераспознанные компетенции; P – полнота распознавания; T – точность распознавания; F – F-метрика.
При этом оценивались два режима работы алгоритма для двух типов выборок – обучающей и контрольной: I – обучающая выборка (без разделения компетенций); II – обучающая выборка (с разделением компетенций); II – контрольная выборка (без разделения компетенций); IV – контрольная выборка (с разделением компетенций).
Из таблицы видно, что качество классификации в режиме без разделения и с разделением компетенций отличаются незначительно. Тем не менее разница между качеством обучающих и контрольных выборок меньше у алгоритма с разделением компетенций. Кроме того, общее число реальных «простых» компетенций после разделения составило 672 компетенции против 396 в начале, то есть выросло более, чем на 58 %!
На основании приведенных оценок результаты работы данного алгоритма можно считать вполне приемлемыми.
Результаты исследования и их обсуждение
В результате работы предложенного алгоритма была получена многомерная модель востребованных компетенций IT-отрасли, которая также может быть представлена в виде онтологии (структурированного перечня).
Для презентации были выбраны результаты классификации работы алгоритма в режиме разделения компетенций на объединенном множестве из обучающей и контрольной выборок, мощность которого составила 575 компетенций (таблица).
На рис. 1 приведена диаграмма структурного распределения различных типов компетенций по рассматриваемым профессиям.
В представленной структуре, несмотря на явное разнообразие по профессиям в среднем, заметна преобладающая роль двух типов «Experience» и «Knowledge» – 46 %. Менее значимым из всех является «Skills» – 8 %.
На рис. 2 показано распределение значений параметра измерения LEVEL (уровней владения компетенциями) по типу компетенций.
Видно, что самый большой процент для всех типов – это начальный уровень владения компетенцией – Min. Максимальная доля уровня Min достигается для компетенции типа «Experience» – 81 %. И наоборот, максимальная доля самого высшего уровня Max –36 % относится к компетенции «Skills».
Рис. 1. Распределение структуры типов компетенций по профессиям IT-сферы
Рис. 2. Распределение структуры уровней владения компетенциями по типу
Рис. 3. Распределение требований к опыту работы по компетенциям
Компетенция типа «Experience» имеет свою особенность, которая присуща только ей – интерпретацию ее уровней будет правильно проводить не по лексическим значениям, а по соответствующим им целочисленным, так как в данном случае они несут смысл лет опыта работы. Более корректное представление компетенции типа «Experience» приведено на рис. 3.
Из рисунка видно, что распределение структуры опыта по годам идет в обратном порядке: около 70 % объявлений не указывает число лет опыта работы, что интерпретируется как минимум 1 год; около 10 % требуют наличие опыта не менее 2 лет; 9 % не менее 3 лет и т.д. Максимальным требованием к опыту работы является значение не менее 10 лет.
Стоит отметить еще одну особенность классификации компетенций – распределение компетенций по классу Edu, с требованиями о наличии соответствующего образования (диплома, сертификата и т.д.) по типам Type. Наличие образования является не менее важным критерием при отборе претендентов на вакантные места. Согласно нашим исследованиям, 83 % всех имеющихся требований о наличии диплома или сертификата относятся к типу Knowledge. Причем 95 % из них встречается при минимальном уровне владения компетенцией, т.е при LEVEL = Min. Остальные 17 % всех требований об образовании принадлежат типу Experience.. В типе Skills такие требования полностью отсутствуют.
Статистический анализ полученной нами модели позволил выявить особенности компетентностной структуры для каждой из 10 профессий, получить количественные характеристики для используемых параметров классификации, а также приобрести новое знание о потребностях работодателей IT-отрасли.
Полученные результаты открывают в будущем потенциальную возможность сравнения компетенций работодателей с компетенциями дисциплин в учебных планах, что является следующим важным этапом проводимой серии исследований.
Библиографическая ссылка
Питухин Е.А., Тулаева А.И., Шабалина И.М. РАЗРАБОТКА СИСТЕМЫ КЛАССИФИКАЦИИ ПРОФЕССИОНАЛЬНЫХ КОМПЕТЕНЦИЙ В IT-СФЕРЕ // Фундаментальные исследования. – 2017. – № 10-2. – С. 250-254;URL: https://fundamental-research.ru/ru/article/view?id=41820 (дата обращения: 27.09.2024).