Целью настоящей работы является разработка компьютерной системы прогнозирования кадастровой оценки жилой городской недвижимости. Высокая актуальность создания универсального инструмента, позволяющего проводить рыночную оценку объектов недвижимости с различными характеристиками с высокой степенью точности, обусловлена проводимой налоговой реформой в России, что закреплено рядом документов. С 1 января 2015 года вступила в силу глава 32 Налогового кодекса Российской Федерации «Налог на имущество физических лиц». Согласно ей налоговая база, в соответствии с решениями органов власти субъектов РФ для ряда регионов определяется как кадастровая (приближенная к рыночной) стоимость принадлежащих физическим лицам объектов недвижимости. При этом до 2020 года исчисление налога от кадастровой стоимости объекта недвижимости должно быть внедрено на территории всей Российской Федерации.
В данной работе программная система расчета кадастровой стоимости жилой недвижимости создана с помощью нейронных сетей на базе статистических данных о проводимых сделках на территории г. Перми, что является первым шагом более глобальной задачи создания программной системы массовой оценки недвижимости на всей территории России.
Методика оценки стоимости квартир
В ряде развитых зарубежных стран уже давно существует практика применения искусственных нейронных сетей для массовой оценки объектов недвижимости с целью исчисления налога на имущество [5]. В России же, как справедливо заметили авторы статьи [1], задача создания программных систем массовой оценки недвижимости осложняется тем, что, в отличие от зарубежных стран, у нас отсутствует система обязательного публичного раскрытия информации о сделках с недвижимостью, в связи с чем достоверная информация о сделках с недвижимостью крайне ограничена даже в Москве, а тем более в остальных регионах России. Тем не менее авторы работы [1] сообщают, что они разработали и успешно внедрили нейросетевую программную систему оценки нежилой недвижимости в Департаменте имущества г. Москвы в 2008 году. Свой успех они объясняют применением целого комплекса методик, позволивших на стадии предобработки информации выявить и исключить выбросы, а также использованием нетрадиционной обобщенно-регрессионной нейронной сети, что обеспечило низкую, по их мнению, среднюю относительную погрешность 20,0 %.
Не менее успешной оказалась попытка разработки в 2008 г. программной системы оценки стоимости двухкомнатных квартир в г. Перми [3, с. 10–15]. Классический многослойный персептрон с сигмоидными активационными функциями позволил создать систему, обеспечивающую оценку пермских квартир с максимальной относительной ошибкой 16,4 %. Настоящая работа является прямым продолжением этих исследований.
В результате анализа информационных ресурсов агентств недвижимости, предоставляющих информацию о продаже вторичной жилой недвижимости на территории г. Перми, а также опыта ряда коммерческих компаний, работающих на рынке, были выбраны 14 ключевых параметров объектов жилой недвижимости, представляющих как количественные, так и качественные показатели, наилучшим образом характеризующие объекты исследования: район размещения объекта недвижимости; тип жилого дома; серия жилого дома; этажность здания; расположение квартиры на первом этаже; количество лет эксплуатации здания; площадь объекта недвижимости, кв. м; количество санузлов в помещении; наличие внутренней отделки; наличие подземной парковки у жилого дома; наличие подъёмных лифтов и их количество; наличие консьержа в подъезде, закрытой придомовой территории; степень доступности для общественного транспорта; наличие развитой инфраструктуры в пешей доступности (детский сад, школа, магазин). Выходная переменная является численной и соответствует предполагаемой цене объекта недвижимости в российских рублях.
Среди указанных параметров, характеризующих объект недвижимости, существуют как количественные, так и качественные показатели. И если значения первых заносились в обучающее множество без изменений, то информация о каждом из последних заносилась в закодированном виде согласно таблице.
Способ кодировки качественных параметров нейросетевой модели
Параметр |
Кодировка |
Расшифровка |
Район |
1 |
Ленинский |
2 |
Свердловский |
|
3 |
Дзержинский |
|
4 |
Мотовилихинский |
|
5 |
Индустриальный |
|
6 |
Орджоникидзевский |
|
7 |
Кировский |
|
Тип |
1 |
Кирпичный |
2 |
Панельный |
|
3 |
Монолитно-каркасный |
|
4 |
Другой |
|
Серия |
1 |
Сталинский |
2 |
Хрущёвский |
|
3 |
Брежневский |
|
4 |
Индивидуальный проект |
|
5 |
Полнометражная |
|
6 |
Элитный |
|
7 |
Улучшенной планировки |
|
Крайний этаж |
0 |
Нет |
1 |
Да |
|
Лет в эксплуатации |
1 |
до 5 |
2 |
от 5 до 10 |
|
3 |
от 10 до 25 |
|
4 |
от 25 и более |
|
Отделка |
0 |
Нет |
1 |
Первичная |
|
2 |
Ремонт |
|
Подземная парковка |
0 |
Нет |
1 |
Есть |
|
Лифт |
0 |
Нет |
1 |
Есть |
|
Консьерж |
0 |
Нет |
1 |
Есть |
|
Транспортная доступность |
0 |
Плохая |
1 |
Хорошая |
|
Инфраструктура |
0 |
Слабо развитая |
1 |
Хорошо развитая |
Для обучения нейронной сети было сформировано множество примеров, для чего использовалась статистическая информация о существующих предложениях на рынке вторичной жилой недвижимости города Перми. Сначала было сформировано множество из 400 примеров, которое было подвергнуто чистке с помощью нейросетевой методики выявления и устранения выбросов [2]. Таким образом были обнаружены и удалены выбросы – примеры, сформированные на основании объявлений с чрезмерно завышенной стоимостью квартир. Очищенное множество (380 примеров) было разбито на обучающее, содержащее 340 примеров, и тестирующее, содержащее 40 примеров.
C помощью технологии, сложившейся в Пермской научной школе искусственного интеллекта (www.PermAi.ru) [3, 4], выполнялось проектирование нейронной сети, ее обучение, оптимизация и тестирование, а также эксперименты над нейросетевой математической моделью. Оптимальная структура нейронной сети представляла собой персептрон, имеющий 14 входных нейронов, один скрытый слой с 12 нейронами и один выходной нейрон. В качестве активационных функций использовались функции гиперболического тангенса.
Результаты тестирования нейронной сети и оценка значимости параметров
После оптимизации и обучения нейронной сети ее прогностические свойства проверялись на примерах тестирующего множества, которые в процессе обучения не участвовали. Средняя относительная ошибка тестирования нейронной сети, в том числе определенная по методике многократной перекрестной проверки, не превысила 4 %. Типичный пример сопоставления фактических значений стоимости квартир и стоимостей, рассчитанных нейронной сетью, представлен на рис. 1, из которого видно, что прогнозные значения стоимости квартир достаточно близки к фактическим.
Как видно из гистограммы рис. 2, наиболее значимыми параметрами оказались: площадь объекта недвижимости, тип жилого дома (кирпичный, панельный, монолитно-каркасный), расположение квартиры на первом этаже. Наименее значимым параметром оказался район размещения объекта, что можно объяснить особенностями конфигурации г. Перми. Дело в том, что город Пермь не имеет ярко выраженного центра, сильно вытянут вдоль реки и имеет прямоугольно-линейную схему расположения улиц. Поэтому принадлежность дома к определенному району не определяет его транспортную доступность и удаленность от центра. По-видимому, для других городов с иной организацией транспортной системы, в первую очередь с радиально-кольцевым расположением улиц, район размещения объекта будет иметь большее влияние.
Обсуждая полученные результаты. обратим еще раз внимание, что нейронная сеть обучалась на данных вторичной жилой недвижимости города Перми и потому отражает менталитет и систему ценностей жителей именно этого города. Для других стран распределение значимости параметров, влияющих на стоимость квартир, по-видимому, будет иметь иной вид.
Рис. 1. Типичный результат тестирования нейронной сети: сопоставление прогнозируемых и фактических значений стоимости квартир на примерах, не участвовавших в обучении сети
Рис. 2. Степень влияния входных параметров модели на результат моделирования – стоимость квартир в г. Перми
Заключение
Разработана нейросетевая математическая модель, реализованная в виде компьютерной программы, позволяющей с высокой степенью точности выполнять прогнозирование рыночной стоимости квартир в г. Перми. Проанализирована значимость входных параметров модели.
В дальнейшем предполагается создание программной системы, пригодной для использования на всей территории Российской Федерации, что является актуальным при реализации органами власти налоговой реформы и переходе на кадастровый расчет налога на имущество физических лиц всех объектов жилой недвижимости.
Рецензенты:
Файзрахманов Р.А., д.э.н., профессор, заведующий кафедрой «Информационные технологии и автоматизированные системы», Пермский национальный исследовательский политехнический университет, г. Пермь;
Русаков С.В., д.ф.-м.н., профессор, заведующий кафедрой прикладной математики и информатики, Пермский государственный национальный исследовательский университет, г. Пермь.