Научный журнал
Фундаментальные исследования
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

ПРОГНОЗИРОВАНИЕ ИНТЕНСИВНОСТИ ТРАНСПОРТНОГО ПОТОКА И ОЦЕНКА ПОТРЕБИТЕЛЬСКИХ СВОЙСТВ ДОРОГИ МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ

Шамраева В.В. 1
1 ФГОБУ ВО «Финансовый университет при Правительстве Российской Федерации»
Целью исследования является оценка потребительских свойств линейно протяжённых участков дороги с учётом фактического коэффициента её прочности по международному показателю методами машинного обучения. Предметом исследования является интенсивность транспорта на линейно протяжённом участке автомобильной дороги и состояние его дорожного покрытия. Объектом исследования является участок дороги М-1 «Беларусь», 86-й километр, за временной промежуток с 2014 по 2024 год. Для достижения цели выбраны алгоритмы машинного обучения (линейная регрессия, градиентный бустинг, случайный лес и нейронные сети на основе длительной кратковременной памяти своего рода динамического языка программирования Python в средах разработки от Microsoft (Visual Studio Code) и Google (Colaboratory) в режиме Jupyter Notebook. Построена модель машинного обучения, посредством которой произведена оценка потребительских свойств участка дороги М-1 «Беларусь», 86-й километр, и его потребительских свойств с учётом фактического коэффициента прочности по международному показателю, а также даны рекомендации по планированию мероприятий по поддержанию и ремонту дорожного покрытия этого участка дороги. Построение подобных моделей машинного обучения и их реализация для линейно протяженных участков дорог позволит прогнозировать интенсивность транспортного потока и, как следствие, решать основные задачи содержания дороги – оптимизировать время и средства при планировании и реализации мероприятий на этапе эксплуатации объектов транспортной инфраструктуры, учитывать возможные риски потери качества состояния дороги при её обновлении и проектировании новых элементов.
машинное обучение
анализ данных
диагностика автомобильных дорог
прогнозирование транспортных потоков
1. Апестин В. К. О расхождении проектных и нормативных межремонтных сроков службы дорожных одежд // Наука и техника в дорожной отрасли. 2011. №1. С. 18-20. URL: https://lib.madi.ru/nitdo/ (дата обращения: 15.12.2024).
2. Panthi K.A. A methodological framework for modeling pavement maintenance costs for projects with performance-based contracts // Doctoral dissertations Archive, Miami. 2009. 191 p. DOI: 10.25148/etd.FI09120824.
3. Snaith M.S., Robinson R., Danielson U. Road Maintenance Management: Concepts and Systems // Red Globe Press London. 1998. 312 p. DOI: 10.1007/978-1-349-14676-5.
4. Shamraeva V., Savinov E. INFRA-BIM for business processes’ management in road construction and operation // Architecture and Engineering. 2021. Vol. 6. № 3. P. 19-28. DOI: 10.23968/2500-0055-2021-6-3-19-28.
5. Шамраева В.В. Экономическая эффективность эксплуатации элементов гражданских зданий с учётом остаточного ресурса: вероятностно-статистический подход // Современная наука: актуальные проблемы теории и практики. Серия: Экономика и право. 2020. № 2. С. 61-68. http://www.nauteh-journal.ru/files/acf24b62-4f2e-4733-86b1-1dea04246a20
6. Рекомендации по диагностике и оценке технического состояния автомобильных дорог // Отраслевой дорожный методический документ ОДМ 218.4.039-2018. М.: ФГБУ «ИНФОРМАВТОДОР», 2018.
7. Cano-Ortiz Saúl, Pascual-Muñoz Pablo, Castro-Fresno Daniel. Machine learning algorithms for monitoring pavement performance // Automation in Construction. 2022. Vol. 139. № 104309. DOI: 10.1016/j.autcon.2022.104309.
8. Прогнозирование состояния эксплуатируемых автомобильных дорог Государственной компании «Автодор» // Стандарт Государственной компании «Автодор». СТО АВТОДОР 2.28-2016. 2016.
9. Дороги автомобильные общего пользования. Требования к проведению диагностики и паспортизации // Межгосударственный совет по стандартизации, метрологии и сертификации (МГС): ГОСТ 33388-2015. 2016.
10. Марселино П., де Лурдес Антунес М., Фортунато Э., Гомес М.К. Подход машинного обучения к прогнозированию характеристик дорожного покрытия // Международный журнал по проектированию дорожного покрытия. 2019. № 22 (3). C. 341–354. DOI: 10.1080/10298436.2019.1609673.
11. Ча Й.Дж., Чой В., Бююкёзтюрк О. Обнаружение повреждений трещин на основе глубокого обучения с использованием сверточных нейронных сетей // Компьютерное гражданское и инфраструктурное проектирование. 2017. № 32. C. 361-378. DOI: 10.1111/mice.12263.
12. Шамраева В.В. Математические методы прогнозирования изменения цены акций и их реализация методами машинного обучения // Фундаментальные исследования. 2024. № 11. С. 88-96. DOI: 10.17513/fr.43718.
13. Требования к эксплуатационному состоянию, допустимому по условиям обеспечения безопасности дорожного движения. Методы контроля // Национальный стандарт Российской Федерации: ГОСТ 50597-2017. 2018.
14. Ziari H., Sobhani J., Ayoubinejad J., Hartmann T. Прогнозирование IRI в краткосрочной и долгосрочной перспективе для гибких дорожных покрытий: методы ANN и GMDH // Международный журнал по проектированию дорожных покрытий. 2015. № 17 (9). C. 776–788. DOI: 10.1080/10298436.2015.1019498.

Введение

Транспортная инфраструктура и автомобильный транспорт в социально-экономическом развитии Российской Федерации занимают первостепенное место. Интенсивная эксплуатация, воздействие природных факторов и т.п. влияют на характеристики автомобильных дорог, которые подвергаются износу и разрушению покрытия. Изучением процессов деградации состояния дорожной конструкции занимались многие учёные: cреди отечественных учёных можно выделить В.К. Апестина [1] и др., а среди зарубежных учёных – M. Snaith [2], K. Panthi [3] и др. В своих трудах перечисленные учёные описывали эти процессы, опираясь на два уровня – проектный и сетевой, и два основных показателя состояния дорожной одежды – эксплуатационный (продольная и поперечная ровность; шероховатость покрытия) и структурный (прочность; дефектность покрытия). Дефектность покрытия оценивается международным показателем прочности – International Roughness Index (IRI), и характеризуется средним баллом по визуальной оценке состояния покрытия. Отметим, что проектный уровень ограничен стадией разработки проекта дорожной одежды, а на сетевом уровне рассматриваются состояния дорожной одежды на протяжении всего жизненного срока дорожного объекта [4].

В Государственной компании «Российские автомобильные дороги» фактический уровень транспортно-эксплуатационного состояния дорог оценивают с учётом остаточного ресурса [5] дорожных конструкций, при этом эксплуатируемые участки автомобильных дорог разделяют на три уровня (нормативный, удовлетворительный и неудовлетворительный) сохранности дорожных одежд. В каждом из перечисленных уровней состояние участка автомобильной дороги и дорожной одежды сравнивается с нормативными значениями [6] и вырабатываются стратегии мероприятий по планированию капитального ремонта. Согласно методике ОДМ 218.4.039-2018 [6], сохранность участка автомобильной дороги зависит от фактического показателя прочности IRI – нежесткой дорожной одежды. Этот показатель будет использован в настоящем исследовании при оценке потребительских свойств участка автомобильной дороги на участке М-1 «Беларусь», 86-й километр.

Цель исследования – на основе методов машинного обучения оценить потребительские свойства линейно протяжённых участков дороги с учётом условий эксплуатации дорог и дать общие рекомендации по стратегиям ремонта дорожной сети, опираясь на результаты предсказаний моделей машинного обучения.

Материалы и методы исследования

Объектом исследования статьи является участок автомобильной дороги М-1 «Беларусь», 86-й км, и его потребительские свойства. Методами машинного обучения [7] произведён анализ данных интенсивности движения на этом линейно протяжённом участке дороги и разработаны прогностические модели для определения будущих значений интенсивности в соответствии с требованиями СТО АВТОДОР 2.28-2016 [8]. Для этого были поставлены три основные задачи (рис. 1). Решение этих задач позволило предсказать будущее состояние участка дороги, определить возможные проблемы и разработать соответствующие рекомендации для поддержания безопасности и комфорта движения.

missing image file

Рис. 1. Основные задачи при оценке потребительских свойств дороги

missing image file

Рис. 2. Процесс изменения средних показателей IRI

В качестве исходных данных использованы два датасета с передвижных лабораторий Государственной компании «Автодор». Первый датасет – это данные интенсивности движения с разделением на 6 категорий транспортных средств в период с 2014 по 2024 год включительно в табличном формате средствами Microsoft Excel. Данные представлены по каждой категории транспорта (легковые авто, микроавтобусы, малые грузовики, одиночные АТС, автобусы, автопоезда до 13 м, от 13 до 18 м и свыше 18 м) в прямом и обратном направлениях, а также суммарный показатель по двум направлениям. Второй датасет описывает значение ровности IRI по годам для каждого участка дороги с 84-го по 95-й километр трассы М-1. Предварительный анализ второго датасета выявил нарушения требований ГОСТ 33388-2015 [9], где значение IRI не должно превышать 3,1. По графику изменения средних показателей IRI для каждой полосы (рис. 2) можно отметить процесс ухудшения состояния дороги с течением времени. Прямой участок на этом графике соответствует 2019-2020 гг. и соотносится с периодом, за который данные предоставлены не были.

Для определения закона распределения интенсивности применена библиотека SciPy и модуль stats Python. При уровне значимости, равном 0.05, найдены значения статистики и p-value, на основании которых сделан вывод, что ежегодные распределения значений IRI для каждой полосы подходят для приближённого моделирования и последующей передачи в модели машинного обучения.

Логика процесса предобработки данных интенсивности первого датасета интенсивности движения построена так:

1) загружается файл исходных данных и считываются названия всех листов таблицы в списке sheet_names (‘2014-2024’) в DataFrame с помощью функции pd.read_excel() библиотеки Pandas с разделением на 6 категорий транспортного средства;

2) инициализируется пустой датафрейм combined_df для размещения объединённых данных со всех листов, при этом очищается датасет от ненужных признаков данных. В начале запуска выполнения общей функции очистки идёт обход всех листов таблицы датасета, и окончательно формируется список объектов данных интенсивности за год типа pd.DataFrame из источника данных Microsoft Excel (метод библиотеки Pandas – pd.read_excel()) в переменную combined_df, а также происходит удаление верхних информативных ненужных строк и добавление столбца с датой проведённого наблюдения транспортной интенсивности с точностью до целого дня;

3) все элементы списка объединяются в большой единый датафрейм data с логическим удалением столбца индекса, в котором хранилась дата проведённого наблюдения. Этот получившийся датафрейм является результатом всего процесса предобработки входного датасета транспортной интенсивности за прошедшие 10 лет наблюдений экспертов;

4) сохраняется обработанный датафрейм в новый Excel-файл.

Заключительным шагом в общем процессе предобработки датасетов является необходимое для дальнейшего обучения модели машинного обучения выделение новых временных признаков датасетов: номер месяца, номер дня, номер дня недели и год проведённого наблюдения транспортной интенсивности, значения общей интенсивности дорог в прямых и обратных направлениях. С этой целью произведена группировка всех показателей транспортной интенсивности (вне зависимости от типа транспортного средства) по столбцу даты, который уже представлен и готов к группировке с точностью до целого дня возможностями библиотеки Pandas с указанием суммирования показателей интенсивности по всем часам в рамках целого дня, что очень удобно в вычислениях и наглядно в представлении.

По данным второго датасета с предобработанными данными, подготовительные этапы построения и обучения моделей с их дальнейшей оценкой с целью прогнозирования значений состоят в следующем:

1. Разбить выборку данных на признаки и целевые значения.

2. Выбрать признаки и переменные, на основе которых будут предсказывать целевые значения.

3. Разделить выборку на обучающую и тестовую (для корректной работы тестовая выборка не должна использоваться для обучения).

Остановимся коротко на основных моментах процесса создания подходящей модели предсказаний для различных целевых колонок на основе данных за прошлые годы и применения этих моделей для дальнейшего прогнозирования на период 2025-2035 годы.

Создание функций обучения моделей: здесь разделены данные на тестовые и обучающиеся выборки. X ДатаФрейм содержит значения «старт» – начало отрезка дороги, по которым модель будет делать предсказания. Значения года также использованы для отслеживания изменения качества дорожного покрытия в течение года. Y ДатаФрейм содержит сами значения IRI. Функция train_test_split разделяет данные на тестовые и обучающиеся выборки в пропорции 4 к 1 (рис. 3). Это является оптимальным значением, так как позволяет разделить так, что остается больше данных для обучения, но и остаются данные для проверки.

missing image file

Рис. 3. Функция обучения моделей

missing image file

Рис. 4. Сравнение предсказаний разных моделей интенсивности прямого движения

Выбор модели, её обучение, настройка и оценка результатов: выбор модели [10] (дерево решений, нейронные сети, линейные регрессии, методы опорных векторов и так далее) происходит в зависимости от задачи, например классификации, регрессии, кластеризации. После определения модели идет обучение модели, ее настройка и оценка результатов. Когда получившаяся модель показывает хорошие результаты, ее уже можно использовать для практических задач [11], и происходит внедрение модели в первоначальную систему, для которой она и создавалась. Применяемые в этом исследовании модели машинного обучения (линейная регрессия, градиентный бустинг, случайный лес) для каждого направления дороги обучаются на тренировочных данных, и их производительность оценивается на тестовой выборке с помощью метрик mean_squared_error и r2_score [12] (рис. 3). Результаты сохраняются в словаре results. Матрица признаков X включает столбцы start и year, а целевые переменные представлены в столбцах polosa_1, polosa_2, polosa_3 и polosa_4. Для каждой целевой переменной модели обучаются и оцениваются отдельно. После этого результаты выводятся на экран.

Создание модели предсказаний: для прогнозирования значений на период 2025-2035 годы созданы новые данные. Новые годы сгенерированы с использованием функции range, а структура нового «ДатаФрейм» создана таким образом, чтобы каждый год повторялся для всех уникальных значений столбца start из исходных данных. Это позволяет сохранить соответствие между значениями start и новыми годами. Предсказания сделаны с использованием обученных моделей. Результаты предсказаний сохранены в словаре predictions.

Был опробован метод машинного обучения, который моделирует линейные отношения между зависимой переменной (целевой) и одной или несколькими независимыми переменными (признаками) – линейная регрессия. В результате работы этого метода среднее квадратичное отклонение предсказанных значений от фактических составило 0.2667. Значения целевой переменной варьируются в небольших пределах, например от 2 до 6, значит ошибка 0.2667 может быть значительной. Однако при прогнозировании интенсивности движения следует также учитывать прогноз интенсивности движения согласно СТО АВТОДОР 2.28-2016 [8] и ГОСТ 50597-2017 [13].

На рисунке 4 представлены результаты предсказаний различных моделей интенсивности прямого движения за период с 2025 по 2035 год.

Рассматривая каждый график на рисунке 4, можно сделать выводы об их работе:

1. Линейная регрессия (модель представлена синей линией) показывает наименьшую точность предсказаний, особенно заметны большие отклонения в начале и конце периода.

2. Случайный лес (модель представлена оранжевой линией) демонстрирует более точные предсказания по сравнению с линейной регрессией, однако все еще имеет некоторые отклонения от реальных значений, особенно в пиковые моменты.

3. Градиентный бустинг (модель представлена зелёной линией) наиболее точно воспроизводит сезонные колебания интенсивности движения и меньше всего отклоняется от истинных значений.

По графику (рис. 4) можно заметить, что интенсивность движения имеет выраженную сезонную природу с пиками и спадами, которые наиболее точно предсказываются моделью градиентного бустинга.

Для уточнения результатов использована нейронная сеть на основе длительной кратковременной памяти – Long short-term memory (LSTM) – рекуррентная нейронная сеть (recurrent neural network – RNN), разработанная для эффективного обучения и прогнозирования временных рядов и последовательных данных [14]. Результаты обучения нейронной сети показали, что модель обучалась в течение 100 эпох, где на каждой эпохе выполнялось 72 шага со скоростью около 3 миллисекунд на шаг. В последние несколько эпох значения потерь на обучающей выборке находились в диапазоне от 0.0094 до 0.0098, а значения потерь на валидационной выборке оставались стабильными, колеблясь между 0.0106 и 0.0121. Итоговая потеря на тестовой выборке составила 0.0091, что указывает на хорошие результаты модели на обучающей, валидационной и тестовой выборках с минимальными колебаниями значений потерь.

Предсказания продольной ровности IRI сделаны с использованием двух подходов: по результатам измерений IRI прошедших лет, используя модель линейной регрессии, и по формуле 6.1 из STO AVTODOR 2.28-2016 [8], используя интенсивность движения будущих лет, которая была предсказана моделью нейросети.

Результаты исследования и их обсуждение

Приведём и обсудим основные результаты исследования.

На графике (рис. 5), показывающем предсказание интенсивности до 2035 г., наблюдается увеличение транспортного потока в будущем. При этом на прогнозном отрезке видно, что сезонные колебания продолжаются, с пиками в летние месяцы и спадами в зимние. В 2034 и 2035 годах интенсивность движения достигает значений около 800 000, что является значительно выше значений в предыдущие годы. В целом, прогноз указывает на устойчивый рост транспортной интенсивности, несмотря на ежегодные сезонные колебания, что предполагает необходимость дальнейшего планирования и развития транспортной инфраструктуры.

Рисунок 6 наглядно отображает предсказание коэффициента IRI на 10 лет для четырех полос дороги на участке 86-й км трассы М-1. Каждая линия на графике соответствует одной из полос: синяя линия представляет первую полосу, оранжевая – вторую, зеленая – третью, а красная – четвертую, прогнозируемого периода с 2025 по 2035 год, что указывает на постепенное ухудшение состояния дорожного покрытия.

На первой полосе (синяя линия) IRI возрастает с примерно 3.0 до 5.0. На второй полосе (оранжевая линия) значение IRI начинается около 2.4 и достигает примерно 4.8. Третья полоса (зеленая линия) показывает рост IRI с 3.0 до 5.4. На четвертой полосе (красная линия) значения IRI начинают около 3.6 и увеличиваются до 6.1 к 2035 году. Красная пунктирная линия на уровне 4 по оси Y обозначает максимально допустимое значение IRI. Все четыре полосы демонстрируют восходящий тренд с тенденцией к увеличению с течением времени. По рисунку 6 видно, что коэффициенты IRI для всех полос имеют тенденцию к увеличению с течением времени. Полоса 4 (красная линия) уже превысила максимально допустимое значение и продолжает расти быстрее остальных. Полосы 1, 2 и 3 (синяя, оранжевая и зеленая линии соответственно) также демонстрируют рост, но пока остаются ниже допустимого уровня. Все полосы показывают линейный рост коэффициента IRI, что свидетельствует о непрерывном ухудшении дорожного покрытия на протяжении следующих десяти лет. Самый высокий темп ухудшения наблюдается на четвертой полосе, тогда как самая низкая начальная и конечная точки характерны для второй полосы. Оба подхода показали такой результат. Это подчеркивает необходимость планирования денежных затрат для реализации мероприятий по улучшению и восстановлению дорожного покрытия, чтобы замедлить рост неровностей и сохранить качество дорог. При анализе также было выявлено, что не будет изменяться и состав движения. Для этой трассы характерна одинаковая пропорция различного вида транспорта.

С использованием формулы 6.1 STO AVTODOR 2.28-2016 [8] для расчета колейности выполнен прогноз изменения поперечной ровности (колейности) (рис. 7). График на рисунке 7 представляет собой прогноз изменения колейности на 86-м км трассы M-1 на 10 лет вперед.

missing image file

Рис. 5. Предсказание интенсивности

missing image file

Рис. 6. Изменение показателя IRI на 10 лет при прогнозировании роста интенсивности движения

missing image file

Рис. 7. Предсказание колейности на 10 лет

Горизонтальная ось обозначает годы, начиная с 2024 года и заканчивая 2035 годом, а вертикальная ось показывает коэффициент колейности. Линии на графике показывают линейный тренд увеличения колейности, что свидетельствует о непрерывном ухудшении дорожного покрытия на протяжении прогнозируемого периода. Первая полоса (синяя линия) начинается с уровня около 2.3 мм в 2024 году и достигает приблизительно 2.55 мм к 2032 году. Вторая полоса (оранжевая линия) показывает рост с 2.24 см до чуть выше 2.48 см за тот же период. Третья полоса (зеленая линия) начинается около 2.31 см и растет до 2.6 см. Четвертая полоса (красная линия) имеет самый высокий начальный уровень, около 2.42 см, и к 2032 году достигает уровня приблизительно 2.72 см. Красная пунктирная линия обозначает максимальное допустимое значение колейности, равное 2.5 см. Полоса 4, обозначенная красной линией, уже превышает это значение примерно к 2026 году. Полоса 3, обозначенная зеленой линией, достигает предельного значения ближе к середине 2029 года. Полоса 2, обозначенная оранжевой линией, достигает предельного значения ближе к концу 2032 года, но также показывает значительное увеличение. Таким образом, четвертая полоса может выйти из строя в 2026 году. Первая и третья ожидают обслуживания в 2030 и 2029 годах соответственно, а вторая полоса останется целой до 2032.

Общие рекомендации для управления прогнозируемым ростом транспортной интенсивности на трассе М-1, сделанные по результатам исследования, следующие:

1) планировать реконструкции дороги, включая увеличение числа полос и строительство новых транспортных развязок, что поможет распределить транспортные потоки и снижение нагрузки на существующие участки инфраструктуры для управления этим ростом;

2) проводить регулярный мониторинг и мероприятия по поддержанию и ремонту дорожного покрытия для замедления ухудшения состояния дороги и обеспечения безопасного и комфортного движения на трассе М-1.

Заключение

Применяя технологии машинного обучения, можно значительно снизить издержки компаний благодаря своевременной диагностике участков автомобильных дорог. В результате данного исследования собственник дороги получает подробные и оптимальные графики денежных затрат на планируемые периоды эксплуатации и ремонта дорожного покрытия на несколько лет вперед. Благодаря более точной и своевременной диагностике технического состояния дороги можно проводить восстановительные и ремонтные работы заранее, что в свою очередь позволит снизить затраты на капитальный ремонт и продлить срок службы дороги.


Библиографическая ссылка

Шамраева В.В. ПРОГНОЗИРОВАНИЕ ИНТЕНСИВНОСТИ ТРАНСПОРТНОГО ПОТОКА И ОЦЕНКА ПОТРЕБИТЕЛЬСКИХ СВОЙСТВ ДОРОГИ МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ // Фундаментальные исследования. 2025. № 2. С. 93-101;
URL: https://fundamental-research.ru/ru/article/view?id=43784 (дата обращения: 18.05.2025).
DOI: https://doi.org/10.17513/fr.43784