Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,222

Хашаев З.Х.-M., Плесневич Г.С., Шекшеев Э.М.

Биомедицинские веб-ресурсы в Интернете в настоящее время аннотируются, как правило, в такой форме, которая позволяет пользователю их извлекать по ключевым словам. Для того чтобы поиск ресурсов был результативным, ключевые слова должны быть более или менее релевантными теме поиска. Тем не менее, очень часто машина поиска выдает массу документов, не соответствующих теме поиска. Это связано с тем, что машина поиска использует ключевые слова только синтаксическим образом, не «понимая» смысла темы поиска. Семантический Веб как раз и должен обеспечивать поиск, основанный на таком представлении метаданных, которое было бы понятно как пользователю (человеку), так и компьютеру. Для представления метаданных необходим формализм который имеет машинную интерпретацию и в то же время когнитивно ориентирован в том смысле, что легко понимается пользователями. В наибольшей степени этими требованиями удовлетворяют концептуальные языки, или языки для концептуального моделирования. Заметим, что медицинскую информатику можно рассматривать как идеальные области для проверки на эффективность технологий Семантического веба. Это вызвано, в частности, следующими обстоятельствами. Одними из первых разработок в области биоинформатики были информационные системы, основанные на формальном представлении медицинской терминологии. Наиболее развитой такой системой явилась UMLS (Unified Medical Language System). Целью этой системы является унификация медицинской терминологии, чтобы, в частности, облегчить интеграцию разнородных источников знания, содержащегося в извлекаемых ресурсах Интернета. Важной областью применения Семантического веба является геномика. Работа в этой области требует обращения исследователя к различным базам данных и ресурсам Интернета. Типичным сценарием работы является следующий: биолог получает новые (исходные) ДНК-последовательности и стоит сначала перед задачей выстраивания общей последовательности генов, т.е. идентификации подобных областей, которые могут следствием функциональных и структурных соотношений между исходными последовательностями. Таким образом, имеются определенные требования на выстраивание, которые выражаются в форме правил и ограничений. Некоторые из правил исследователь получает по Интернету и путем некоторых рассуждений. Затем перед исследователем стоит задача нахождения протеинов, продуцируемых выстроенными генами, и взаимодействия этих протеинов. Для этого исследователь обращается к другой базе данных, чтобы вывести необходимые правила и ограничения. Наконец, перед исследователем может стоять задача нахождения метаболических цепей для найденных протеинов. Из приведенного сценария видно, что работа биолога может быть значительно эффективнее, если он получает возможность пользоваться средствами автоматизации поиска релевантной информации. Использование средств Семантического веба также может сделать работу врачей более качественной и эффективной. При установлении диагноза врач по выявленным у пациента симптомов с помощью Семантического веба может устанавливать диагноз, используя процедуры вывода и поиска релевантных прецедентов.