Mobile QR Code QR CODE
Export citation EndNote

  1. 충남대학교 토목공학과 석사과정 (Graduate Student, Department of Civil Engineering, Chungman University, Daejeon 34134, Rep. of Korea)
  2. 충남대학교 토목공학과 석사과정 (Graduate Student, Department of Civil Engineering, Chungman University, Daejeon 34134, Rep. of Korea)
  3. 충남대학교 토목공학과 박사과정 (Graduate Student, Department of Civil Engineering, Chungman University, Daejeon 34134, Rep. of Korea)
  4. 충남대학교 토목공학과 정교수 (Professor, Department of Civil Engineering, Chungman University, Daejeon 34134, Rep. of Korea)



기계 학습, 예측 모델, 열화, 상태 등급, 결함도 지수
machine learning, predictive modeling, deterioration, condition rating, defect index

1. 서 론

1.1 연구 배경

국내 기반 시설물의 붕괴 사고는 2004년 이후로 시설의 노후화와 관리 부족으로 인하여 꾸준히 증가하고 있다. 이로 인한 재산 및 인명 피해도 늘어나는 상황이며 향후 10년 내에 공용연수가 30년을 초과하는 노후 시설물이 지금의 두 배 이상 증가할 것으로 예상하고 있다(Lee et al. 2023). 또한, 최근 교량 바닥판의 유지관리 부실로 인해 사고가 자주 발생하고 있기에 보다 체계적인 바닥판 유지관리 계획이 필수적이다(Jeong et al. 2024). 효율적인 유지관리 계획을 세우기 위해서는 교량의 보수 시점과 적절한 보수 공법을 결정할 수 있는 의사결정체계가 필요하며, 이 과정에서 교량의 열화 상태를 예측하는 것이 핵심이다(Lee et al. 2020).

교량 부재 단위나 전체를 대상으로 기계 학습을 이용하여 손상 및 상태를 예측하는 모델을 개발하는 연구들이 많이 진행되어 왔다. ANN(artificial neural network), LSTM(long-short term memory) 등의 기계 학습 알고리즘을 이용하여 콘크리트 교량을 대상으로 하여 교량 전체에 대한 열화 또는 바닥판, 교대, 벽 등의 교량 부재 열화를 예측하였다(Srikanth and Arockiasamy 2020; Lim and Chi 2021; Miao et al. 2023; Rashidi and Elzarka 2023). 하지만, 기존 연구들은 대체로 특정 상부형식, 예를 들어 콘크리트 교량에 치중되어 있었다. 또한, 일부 연구들은 하나의 알고리즘만 활용하여 예측 모델을 제시하였고, 특히 대부분의 연구가 바닥판의 상태등급 예측에 초점을 두었다.

1.2 연구 목적

본 연구에서는 이러한 제한점을 보완하여 특정 상부형식에 국한되지 않고, 다양한 방법의 기계 학습 알고리즘을 고려하여 바닥판의 상태등급과 결함도 지수를 예측할 수 있는 일반화된 모델을 개발하고자 하였다. 이를 통해 다양한 구조적 조건과 환경적 요인들을 종합적으로 고려하여 바닥판의 열화 상태를 더욱 정확하게 예측할 수 있는 범용적인 예측 도구를 제공하는 것을 목표로 한다.

2. 예측 알고리즘, 데이터 전처리, 평가 지표

2.1 예측 모델 알고리즘

교량 부재의 열화 상태를 예측하기 위해 다양한 머신 러닝 알고리즘이 연구되어 왔다. 이러한 알고리즘들은 교량 데이터의 특성과 구조적 요인들을 효과적으로 처리하여 열화 과정을 분석하고, 이를 바탕으로 교량의 상태를 예측하는 데 중점을 둔다. 본 연구에서는 일곱 가지 머신 러닝 알고리즘을 활용하여 교량 부재의 열화 상태를 예측하였다. 선택된 알고리즘은 Random Forest(RF), eXtreme Gradient Boosting(XGB), k-Nearest Neighbor(k-NN), Support Vector Machine(SVM), Neural Network(NN), Long Short-Term Memory(LSTM), 그리고 Gated Recurrent Unit(GRU)이다. 이 절에서는 각 알고리즘의 기본 이론과 장점, 그리고 다른 연구 사례를 참조하여 어떻게 적용하였는지를 설명한다. 알고리즘의 일곱 가지 특징은 Table 1에 나타내었다.

Table 1 Definitions and features of machine learning algorithms

Algorithm

Definition & features

References

RF

・An ensemble method that improves prediction by combining decision trees.

・Uses bagging to reduce overfitting and enhance generalization.

Rashidi Nasab, A., & Elzarka, H. (2023) predicted the deterioration condition of bridge decks using random forest.

Galen, C., & Steele, R. (2020) addressed the issue of performance degradation over time in machine learning-based malware detection models using random forest.

XGB

・A machine learning algorithm based on gradient boosting.

・Known for high performance, efficiency, and includes regularization to reduce overfitting.

Rashidi Nasab, A., & Elzarka, H. (2023) predicted the deterioration condition of bridge decks using XGBoost.

Lim, S., and Chi, S. (2019) developed a bridge damage prediction model using XGBoost.

k-NN

・A non-parametric algorithm that classifies data based on nearest neighbors.

・Simple but can be slow with large datasets.

Rashidi Nasab, A., & Elzarka, H. (2023) predicted the deterioration condition of bridge decks using k-NN.

SVM

・A supervised learning algorithm that finds the optimal boundary (hyperplane) to separate different classes.

・Effective for high-dimensional spaces; works well for classification tasks.

Rashidi Nasab, A., & Elzarka, H. (2023) predicted the deterioration condition of bridge decks using SVM.

Zhu et al. (2022) used k-NN to develop a water quality assessment prediction model for surface water.

NN

・A machine learning model inspired by the human brain, consisting of interconnected nodes (neurons).

・Effective for complex pattern recognition; works well with large datasets.

Srikanth, I., & Arockiasamy, M. (2020) predicted the deterioration condition of bridge decks using neural network.

Ali et al. (2019) predicted the deterioration condition of superstructure, substructure, and deck of Missouri bridges using neural network.

LSTM

・A type of recurrent neural network (RNN) designed to learn and remember long-term dependencies in sequential data.

・Effective for time series and sequence prediction tasks.

Miao et al. (2023) predicted the deterioration process of concrete bridges using LSTM.

GRU

・A variant of RNN that is designed to capture long- term dependencies in sequential data.

・Simpler and faster than LSTM, while still being effective for tasks involving sequence data.

Choi et al. (2020) compared Pseudo-LSTM and GRU, reporting that GRU recorded lower loss values and contributed to reducing overfitting.

2.2 데이터 전처리

데이터 전처리는 기계 학습 모델의 성능을 극대화하기 위한 필수 단계로, 원시 데이터를 모델이 이해할 수 있는 형식으로 변환하고 불균형한 데이터를 처리하는 데 중요한 역할을 한다. 본 연구에서는 데이터의 품질을 개선하고 모델의 성능을 높이기 위한 데이터 전처리 과정 중 데이터 리샘플링, StandScaler와 One-Hot Encoding을 설명한다.

2.2.1 데이터 리샘플링

리샘플링 기법은 불균형한 데이터 문제를 해결하기 위해 사용하는 중요한 데이터 전처리 기법이다. SMOTE(synthetic minority over-sampling technique)는 소수 클래스의 데이터를 인위적으로 생성하여 데이터 불균형을 개선하는 기법으로, 주로 분류 성능을 높이기 위해 사용된다. Tomek Links는 다수 클래스와 소수 클래스 간의 경계를 명확히 하기 위해 데이터 포인트를 제거하는 언더샘플링 기법이다. Swana et al. (2022)의 연구에서는 SMOTE와 Tomek Links를 결합한 하이브리드 기법을 이용하여 기계 고장 데이터의 불균형 문제를 해결하기 위한 방법으로 제시했다. 이 기법을 통해 고장 데이터의 분류 성능을 크게 개선했다. 본 연구에서도 불균형 데이터셋의 개선을 위해 SMOTE- TomekLinks 리샘플링 기법을 적용하였다.

2.2.2 One-Hot Encoding

One-Hot Encoding은 범주형 데이터를 기계 학습 모델에서 처리할 수 있도록 변환하는 대표적인 방법이다. 범주형 데이터를 각 범주에 대해 이진 벡터로 변환하여, 각 범주를 0 또는 1로 표현한다. 이 방식은 데이터의 순서나 관계가 없는 경우에 적합하며, 범주형 변수가 많은 경우에도 효과적이다.

Al-Shehari and Alsowail (2021)는 One-Hot Encoding을 활용하여 내부 데이터 유출 탐지 모델을 개발하였다. 연구는 범주형 데이터를 One-Hot Encoding을 통해 변환하고, 이를 다양한 기계 학습 알고리즘에 적용하여 데이터를 정확하게 분류했다.

2.2.3 StandScaler

StandardScaler(정규화)는 데이터 전처리에서 자주 사용되는 스케일링 기법으로, 각 변수의 평균을 0, 표준편차를 1로 맞추어 데이터의 분포를 표준화하는 방식이다. 이는 변수 간의 스케일 차이를 줄여 모델이 데이터를 학습할 때 불필요한 편향을 방지하는 데 유리하다. 특히, SVM과 같은 거리 기반 알고리즘이나 가중치가 중요한 모델에서 성능 향상에 기여할 수 있다. Ahsan et al. (2021)은 다양한 스케일링 기법을 사용하여 심장 질환 예측 모델의 성능을 평가하였다, 그 결과 StandardScaler가 SVM 모델에서 우수한 성능을 보였음을 확인하였다.

2.3 예측 모델 평가

본 연구에서는 교량 부재 결함도 지수와 상태평가 예측 모델을 각각 평가하기 위해 문헌을 참고하여 아래의 다양한 성능 지표를 사용하였다.

2.3.1 부재 결함도 지수 예측 모델 평가

Raschka (2018)는 회귀 분석 또는 머신 러닝 모델의 성능을 평가하는 중요한 지표라고 설명했다. 본 연구는 다음의 다섯 가지 평가지표를 이용하여 부재 결함도 지수 예측 모델에 대해 평가를 하였다.

MSE(mean squared error)는 예측 값과 실제 값의 차이를 제곱한 후 평균을 구하는 방식으로, 오차가 클수록 더 크게 반영되기 때문에 큰 오류를 강조하는 데 유리하다. RMSE(root mean squared error)는 MSE의 제곱근을 취해 오차 단위를 원래 데이터와 동일하게 만들어 해석이 직관적이다. MAE(mean absolute error)는 예측 값과 실제 값 간의 차이를 절대값으로 계산한 후 그 평균을 구하며, 큰 오차에 덜 민감하다. MAPE(mean absolute percentage error)는 예측 값과 실제 값의 차이를 백분율로 표현하여 상대적인 오차를 평가하는 지표이다. R2(결정계수)는 모델이 실제 데이터를 얼마나 잘 설명하는지 나타내며, 값이 1에 가까울수록 설명력이 높음을 의미한다.

2.3.2 부재 상태평가 예측 모델 평가

혼동 행렬(confusion matrix)은 모델이 실제 값과 예측 값을 얼마나 정확히 분류했는지 나타내는 표로, True Positive(TP), True Negative(TN), False Positivie(FP), False Negative(FN) 값을 포함한다. 정확도(accuracy)는 전체 데이터 중 올바르게 예측된 비율을 나타내며, 모델 성능을 전반적으로 평가하는 데 활용된다. 정밀도(precision)는 양성으로 예측된 데이터 중 실제로 양성인 비율로, TP 값을 TP와 FP의 합으로 나누어 계산된다. 재현율(recall)은 실제 양성 데이터 중 양성으로 정확히 예측된 비율을 나타내며, F1-스코어(F1-Score)는 정밀도와 재현율의 조화 평균으로, 두 지표 간의 균형을 평가하는 지표이다.

Li and Burgueño (2019)는 혼동 행렬을 통해 교대 손상 예측 모델의 성능을 평가하였으며, 예측 성능과 오류를 시각적으로 확인하는 데 사용되었다. 또한, Miao et al. (2023) 연구에서는 콘크리트 교량의 열화 과정을 예측하는 모델을 평가하기 위해 Recall, Precision, F1-Score를 이용하였다.

2.3.3 Cross-Validation

Berrar (2019)는 머신 러닝 모델에서 Overfitting(과적합) 여부를 판단하기 위해 Cross-Validation(교차 검증) 기법을 소개하였다. 여러 교차 검증 기법 중, k-fold 교차검증 기법은 가장 일반적으로 사용되는 교차 검증 기법으로, 데이터를 k개의 부분 집합으로 나눈 뒤, 각 부분 집합을 검증 세트로 사용하고 나머지를 훈련 세트로 사용하여 모델을 학습하는 방법이다. 이를 k번 반복하여 모든 부분 집합이 한 번씩 검증 세트로 사용되며, 최종적으로 각 반복에서 얻은 성능 측정을 평균하여 모델의 일반화 성능을 평가하는 방법이다.

3. 데이터 수집 및 모델 개발

3.1 데이터 수집

본 연구에서 예측 모델을 만들기 위해 사용된 데이터는 시설물통합정보관리시스템(facility management system, FMS)을 통해 수집된 정밀점검 및 정밀안전진단 상태평가 보고서를 바탕으로 구성되었다. 1종 교량 1,205개와 2종 교량 1,224개를 포함하여 총 2,429개의 데이터를 수집하였다. 수집된 데이터 항목은 준공년도로부터 점검년도까지의 공용연수, 교량 길이(교장), 경간 수, 상부 형식, 교량 위치(지역), 전체 상태등급 등이다.

교량의 공용연수가 지남에 따른 부재 열화를 반영하기 위해 시설물 안전 및 유지관리 세부지침(안전점검・진단_교량 편, 2022)을 바탕으로 바닥판, 하부, 거더, 신축이음, 포장, 배수, 난간연석, 교량받침, 기초, 염화물, 탄산화 등 11개 부재의 결함도 지수 및 상태등급 데이터를 수집하였다. 다만 기초, 염화물, 탄산화에 대한 데이터는 대부분 누락되어 분석에서 제외하였고 교량받침은 내진 보강 시 열화에 관계없이 탄성받침이나 면진받침으로 교체되는 경우가 많기에 데이터에서 제외하였다.

또한, 제설제에 의한 염화물이나 동결융해와 같은 환경적 요인을 고려하기 위해 기상 데이터를 수집하였다. 이를 위해 정밀점검 및 정밀안전진단이 실시된 연도의 기상 데이터를 포함하여 평균기온, 최저기온, 최고기온, 강수량, 평균 상대습도 등을 포함한 자료를 수집하였으며, 이 데이터는 Table 2에 정리하였다.

수집한 데이터 총 2,429개 중 교량 상부형식 분포는 강교, 콘크리트교, 라멘교, 슬래브교, 복합교로 총 5개 항목으로 분포하였다. 교량 구간별 상부형식이 다른 교량의 경우를 복합교로 정의하였다. 그 중 강교가 54.4 %(1,323개), 콘크리트교가 39.8 %(968개)로 전체 데이터의 약 94 %로 가장 큰 비율을 차지하였다.

또한, 공용연수의 분포는 평균 14.46년, 표준편차가 9.28년으로 나왔고 대부분의 공용연수가 30년 이내로 분포하는 것을 확인하였다. 부재 상태등급의 분포는 바닥판의 경우, a등급이 18.4 %(447개), b등급 60.5 %(1,471개), c등급 20.3 %(493개), d등급 0.7 %(18개)로 나타났다. 공용연수와 부재 상태등급에 대한 분포는 각각 Fig. 1Fig. 2에 나타내었다.

Fig. 1 Distribution of bridge year bridge classes 1 & 2

../../Resources/KCI/JKCI.2024.36.6.657/fig1.png

Fig. 2 Distribution of component condition ratings

../../Resources/KCI/JKCI.2024.36.6.657/fig2.png

교장, 지역 등 기타 상세 제원과 기온, 습도, 강수량과 같은 환경 데이터는 다양한 값을 포함하고 있어 시각적으로 명확히 제시하기 어려웠으며, 연구 목적에 비추어 특별한 분포상의 특성이 발견되지 않아 본문에서 생략하였다. 본 연구에 사용된 데이터는 FMS(facility management system)의 정밀점검 및 정밀안전진단 상태평가 보고서에서 수집되었으며, 공용연수에 따른 불균형한 분포를 보였다. 예를 들어, Fig. 2에서는 공용연수 55년~ 80년 구간의 데이터가 없고, 80년~85년 구간의 데이터만 포함된 것을 확인할 수 있었다. 이러한 데이터 분포는 원본 데이터에 따른 것으로, 연구자가 임의로 조정할 수 없었다. 따라서 데이터 전처리 과정에서는 누락된 데이터만 제거하고, 원본 데이터의 분포 특성을 그대로 유지하였다.

Table 2 List of collected data

Bridge basic specifications

Time history data

Environmental data

Data

Bridge year

Length Numbers of spans Superstructure type Region Condition rating

Deck slab Girder Pavement Drainage Parapet Expansion joint Substructure

Avg. temp Min/Max temp Avg. min/max Precipitation Humidity

3.2 예측 모델 개발

본 연구에서는 Python(3.13.0)을 사용하여 예측 모델을 개발하였으며, Table 2에 제시된 데이터를 모두 입력 변수로, 바닥판 결함도 지수와 상태등급을 출력 변수로 설정하였다. 다양한 부재와 환경 데이터가 바닥판 열화에 영향을 미친다는 점(Lee et al. 2023)을 고려하여 SMOTE-TomekLinks 기법으로 C, D등급 샘플을 보완하여 균형 있는 데이터 분포를 확보하였다. 결함도 지수는 연속형 데이터이고 시설물 안전 및 유지관리 세부지침 상태평가 보고서에 근거하여 결함도 지수가 상태등급과 연관된다는 점에 따라 상태등급을 기준으로 리샘플링을 진행하였다. C등급과 D등급 데이터가 적어 전체 데이터세트에 리샘플링을 적용하였으며, 트레이닝 세트만 리샘플링할 경우 One-Hot Encoding 시 트레이닝 세트에만 존재하는 범주가 테스트 세트에 없어 모델이 작동하지 않는 문제를 방지하고자 하였다.

리샘플링 방법으로 데이터 불균형을 해소한 결과는 Table 3에 나타내었고, 생성된 데이터를 프로그램에 업로드하여 전처리 과정을 수행하였다. 전처리 단계에서는 One-Hot Encoding으로 범주형 데이터를 숫자형으로 변환하고 StandardScaler로 스케일을 표준화하였다. 전처리된 데이터는 일곱 가지 알고리즘(RF, XGB, k-NN, SVM, NN, LSTM, GRU)으로 7:3 비율로 학습 및 테스트 데이터를 분할하여 기계 학습을 진행하였으며, 각 알고리즘의 하이퍼파라미터와 훈련 시간, 메모리 사용량은 Table 4에 정리하였다.

기계 학습 후, 부재 결함도 지수 예측 모델은 MSE, RMSE, MAE, MAPE 지표로, 상태등급 예측 모델은 Confusion Matrix, Accuracy, F1-Score, Recall, Precision 지표로 성능을 평가하였고, 과적합 여부는 훈련 데이터와 테스트 데이터의 MSE와 MAE 값을 비교하여 교차 검증으로 확인하였다. 예측 모델 생성 과정의 전체 흐름도는 Fig. 3에 나타내었다.

Fig. 3 Flow chart of predictive model development

../../Resources/KCI/JKCI.2024.36.6.657/fig3.png

Table 3 Resampled data distribution

a

b

c

d

Total

SMOTE- TomekLinks

1,105

1,043

1,091

1,163

4,402

Table 4 Comparison of algorithm hyperparameters, training time, and memory usage

Algorithms

Main parameters

Training time (s)

Memory usage (MB)

RF

Number of trees, Seed

2.82

0.00

XGB

Number of trees, Learning rate, Seed

0.26

0.31

k-NN

Number of neighbors

0.00

0.00

SVM

Kernel type

0.09

0.00

NN

Number of layers, Regularization,

Number of epochs, Batch size

16.79

0.64

LSTM

Number of LSTM layers, Dropout rate,

Number of epochs, Batch size

30.01

0.77

GRU

Number of GRU layers, Dropout rate,

Regularization, Number of epochs, Batch size

29.80

0.34

4. 결 과

4.1 바닥판 결함도 지수 예측 결과

앞서 제시한 방법을 적용하여 부재 결함도 지수를 예측하는 모델을 구축하고, 각 알고리즘의 다섯 가지 평가 지표를 분석하였다. 결정계수(R2)의 평균은 0.879로 나타났으며, LSTM, RF, XGB 모델이 각각 0.940, 0.932, 0.926으로 높은 성능을 보였다. MSE와 RMSE의 평균은 각각 0.005와 0.068이며, LSTM, RF, XGB는 MSE 0.002, 0.003, 0.003, RMSE 0.050, 0.052, 0.056으로 우수한 결과를 기록하였다. 또한, MAE와 MAPE에서도 LSTM, RF, XGB가 일곱 가지 알고리즘 평균보다 높은 성능을 보였다.

이러한 평가 지표를 종합한 결과, 성능 순위는 LSTM, RF, XGB, k-NN, SVM, NN, GRU 순으로 나타났으며, 각 알고리즘의 성능 평가 지표 값은 Table 5에 정리하였다. 또한, 예측 모델의 결함도 지수와 실제 수집한 FMS의 정밀점검과 정밀안전진단 보고서의 값을 비교한 결과를 Fig. 4에 나타내었다.

비교 결과를 시각적으로 나타내기 위해, 예측 값과 실제 값이 일치할 경우 해당 값들이 선 위에 분포하도록 그래프를 작성하였다. 등급 구간은 a등급부터 e등급까지 각각 녹색, 파란색, 노란색, 주황색, 빨간색으로 표시하여 등급별 비교가 가능하게 하였다. 이를 통해 예측 모델이 실제 데이터를 얼마나 정확히 추정하는지 시각적으로 평가할 수 있었다. 각 알고리즘의 예측 결과와 실제 데이터를 비교한 결과, 예측 값이 선상에 가깝게 분포하여 모델이 바닥판 결함도 지수를 비교적 정확하게 추정함을 확인하였다. 다만 일부 데이터 포인트는 선에서 다소 벗어나 있어 각 알고리즘 간 예측 성능 차이가 있을 수 있음을 시사한다.

Fig. 4 Comparison results between actual and predicted values of the deck defect index (from top left : RF, XGB, k-NN, SVM, NN, LSTM, GRU)

../../Resources/KCI/JKCI.2024.36.6.657/fig4.png

Table 5 Evaluation of predictive models for defect index prediction

Model

$R^{2}$

MSE

RMSE

MAE

MAPE (%)

RF

0.932

0.003

0.052

0.031

15.95

XGB

0.926

0.003

0.054

0.035

17.38

k-NN

0.896

0.004

0.065

0.036

18.94

SVM

0.869

0.006

0.075

0.064

31.33

NN

0.853

0.006

0.077

0.057

27.66

LSTM

0.940

0.002

0.050

0.030

13.83

GRU

0.737

0.011

0.105

0.082

34.97

Avg.

0.879

0.005

0.068

0.048

22.87

4.2 바닥판 상태등급 예측 결과

앞서 제시한 방법을 적용하여 부재 상태등급을 예측하는 모델을 생성하고, 각 알고리즘에 대해 다섯 가지 평가 지표인 Accuracy, Recall, Precision, F1-Score의 결과와 Confusion Matrix를 분석하였다. 7개의 알고리즘에 대해 Accuracy, Recall, Precision, F1-Score의 평균값은 각각 0.789, 0.786, 0.789, 0.775로 나타났다. 또한 7개의 알고리즘 중 가장 높은 성능을 보인 알고리즘은 XGB로, 각각의 평가 지표 값이 0.882, 0.882, 0.882, 0.881으로 가장 높았다. 7개의 알고리즘에 대한 각 지표의 값은 Table 6에 나타내었다.

Table 6 Evaluation of predictive models for condition ratings

Model

Accuracy

Recall

Precision

F1-Score

RF

0.871

0.872

0.871

0.870

XGB

0.882

0.882

0.882

0.881

k-NN

0.709

0.706

0.709

0.697

SVM

0.424

0.409

0.424

0.342

NN

0.878

0.877

0.878

0.877

LSTM

0.878

0.877

0.878

0.877

GRU

0.881

0.880

0.881

0.880

Avg.

0.789

0.786

0.789

0.775

각 알고리즘에 대한 Confusion Matrix는 Fig. 5에 나타내었다. 결과에서 XGB가 7개의 알고리즘 중 가장 높은 성능을 보였고, GRU, LSTM, RF 순으로 높은 성능을 나타냈다. 이는 앞서 부재 결함도 지수를 예측할 때 LSTM, RF, XGB의 우수한 성능과 차이를 보이며, 상태등급 예측에서는 XGB가 더 강력한 일반화 성능을 보였고, GRU와 LSTM은 시계열 데이터에 강점을 보여 높은 성능을 기록한 것으로 판단된다.

Fig. 5 Comparison results between actual and predicted values of the deck condition rating (from top left : RF, XGB, k-NN, SVM, NN, LSTM, GRU)

../../Resources/KCI/JKCI.2024.36.6.657/fig5.png

4.3 예측 모델 교차 검증 결과

모델의 과적합 여부를 판단하기 위해 k-fold 교차 검증 방법을 활용하였다. 바닥판 결함도 지수 예측 모델에서는 k=5로 설정하여 다섯 번 반복한 평균 교차 검증 MSE와 실제 모델의 MSE를 비교하였고, 상태등급 예측 모델에서는 평균 교차 검증 Accuracy와 실제 Accuracy를 비교하였다. 결과는 각각 Table 7Table 8에 나타내었다. 결함도 지수 예측 모델에서는 대부분의 알고리즘이 MSE가 고르게 분포하여 과적합이 발생하지 않았으나, SVM과 NN은 각 폴드별 값 차이가 두드러져 과적합으로 판단되었다. 반면, 상태등급 예측 모델에서는 7개의 알고리즘 모두 고르게 분포하는 것을 확인하였다.

Table 7 Results of cross-validation for defect index

Model

Number of folds (MSE, $\times 10^{-3}$)

Avg.

1

2

3

4

5

RF

4.706

4.770

3.300

5.548

2.499

4.165

XGB

4.728

4.550

4.728

6.179

2.002

4.437

k-NN

12.13

16.95

14.28

9.385

30.56

16.66

SVM

11.64

14.05

25.15

25.19

84.03

32.01

NN

136.9

5146

195.4

326.1

3926

1946

LSTM

7.090

9.244

10.55

8.873

9.566

9.065

GRU

17.82

16.73

19.72

17.90

20.30

18.50

Table 8 Results of cross-validation for condition

Model

Number of folds (accuracy)

Avg.

1

2

3

4

5

RF

0.823

0.869

0.928

0.916

0.903

0.888

XGB

0.828

0.888

0.933

0.930

0.911

0.898

k-NN

0.728

0.733

0.761

0.771

0.755

0.749

SVM

0.423

0.442

0.418

0.430

0.373

0.417

NN

0.885

0.896

0.897

0.896

0.893

0.893

LSTM

0.880

0.880

0.891

0.896

0.890

0.887

GRU

0.897

0.875

0.882

0.894

0.894

0.888

5. 결 론

국내 교량의 노후화와 유지관리 부족으로 인한 사고가 증가하면서 교량 바닥판의 열화 상태를 정확히 예측할 수 있는 모델 개발의 필요성이 강조되고 있다. 기존 연구는 특정 상부 형식에 집중하거나 단일 알고리즘을 사용하는 경우가 많았으나, 본 연구에서는 다양한 기계 학습 알고리즘을 활용하여 교량 바닥판의 결함도 지수와 상태등급을 예측하는 일반화된 모델을 개발하였다.

본 연구는 정밀점검 및 정밀안전진단 상태평가 보고서를 기반으로 RF, XGB, k-NN, SVM, NN, LSTM, GRU 등 일곱 가지 알고리즘을 적용하였다. 결함도 지수 예측 모델은 MSE, RMSE, MAE, MAPE, R2 지표로 평가하였고, LSTM이 MSE 0.002, RMSE 0.050, MAE 0.030, MAPE 13.83 %, R2 0.940으로 우수한 성능을 보였으며, RF와 XGB도 높은 예측 정확도를 나타냈다. 상태등급 예측 모델은 Accuracy, Precision, Recall, F1-Score 지표로 평가하였다. 그 중, XGB는 Accuracy, Recall, Precision은 0.882, F1-Score는 0.881로 가장 높은 성능을 기록하였다.

하지만, B등급과 C등급 간의 예측 오차가 상대적으로 높았던 이유로는 두 등급이 상태상 중간에 위치하여 구조적 및 내구성 차이가 미세하고, 이로 인해 모델이 이를 명확히 구분하기 어려운 것으로 판단된다. 이에 따라, 향후 연구에서는 B와 C등급을 더욱 명확히 구분할 수 있는 변수를 도입하거나, 전처리 과정에서 특성의 변별력을 높이는 방법을 고려할 예정이다.

결론적으로, 결함도 지수 예측에는 LSTM, RF, XGB가, 상태등급 예측에는 XGB, GRU, LSTM이 적합한 알고리즘으로 확인되었다. 본 연구에서 개발된 예측 모델은 교량 바닥판의 열화를 사전에 정확하게 평가하여 효율적인 유지관리 계획 수립에 기여할 것으로 기대되며, 예방적 유지보수와 관리 비용 절감에도 중요한 역할을 할 수 있다.

향후 연구에서는 공용연수 30년 이상의 교량 데이터를 추가 수집하고, 열화에 영향을 미치는 다양한 환경적 요인과 구조적 변수를 반영하여 b등급과 c등급을 명확히 구분할 수 있는 추가 변수를 도입하거나 전처리 기법을 고려하여 모델의 예측 성능을 개선할 계획이다. 또한, 교량 유지관리의 실시간 모니터링 시스템과 연계하여 예측 모델의 실용성을 높이는 연구가 필요할 것이다.

감사의 글

본 연구는 국토교통부 기반시설 첨단과리 기술개발사업(과제번호 : RS-2022-00142566)의 연구비 지원으로 수행되었으며, 이에 감사드립니다.

References

1 
Ahsan, M. M., Mahmud, M. P., Saha, P. K., Gupta, K. D., and Siddique, Z. (2021) Effect of Data Scaling Methods on Machine Learning Algorithms and Model Performance. Technologies 9(3), 52.DOI
2 
Ali, G., Elsayegh, A., Assaad, R., El-Adaway, I. H., and Abotaleb, I. S. (2019) Artificial Neural Network Model for Bridge Deterioration and Assessment. Laval, Quebec; Canadian Society for Civil Engineering (CSCE) Annual Conference. June 12 - 15, 2019URL
3 
Al-Shehari, T., and Alsowail, R. A. (2021) An Insider Data Leakage Detection Using One-Hot Encoding, Synthetic Minority Oversampling and Machine Learning Techniques. Entropy 23(10), 1258.DOI
4 
Berrar, D. (2019) Cross-Validation. Encyclopedia of Bioinformatics and Computational Biology.URL
5 
Choi, Y., Lee, J., and Kong, J. (2020) Performance Degradation Model for Concrete Deck of Bridge Using Pseudo-LSTM. Sustainability 12(9), 3848.DOI
6 
Galen, C., and Steele, R. (2020) Performance Maintenance Over Time of Random Forest-based Malware Detection Models. In 2020 11th IEEE Annual Ubiquitous Computing, Electronics and Mobile Communication Conference (UEMCON), 536-541.DOI
7 
Jeong, Y., Lee, I., and Kim, W. (2024) Deterioration Mechanism and Repair Methods for Concrete Decks in Bridges. Journal of the Korea Concrete Institute 36(4), 347-355. (In Korean)DOI
8 
Lee, J., Min, G., and Kim, W. (2023) Development of Performance Evaluation and Prediction Models for Bridge Components Considering Time Characteristics. Journal of the Korea Concrete Institute 35(6), 673-680. (In Korean)DOI
9 
Lee, Y., Sun, J., and Park, K. (2020) Development of Bridge Deck Pavement Deterioration Prediction. Journal of the Korea Concrete Institute 32(1), 253-254. (In Korean)URL
10 
Li, Z., and Burgueño, R. (2019) Structural Information Integration for Predicting Damages in Bridges. Journal of Industrial Information Integration 15, 174-182.DOI
11 
Lim, S., and Chi, S. (2019) Xgboost Application on Bridge Management Systems for Proactive Damage Estimation. Advanced Engineering Informatics 41(6):100922.DOI
12 
Lim, S., and Chi, S. (2021) Damage Prediction on Bridge Decks Considering Environmental Effects with the Application of Deep Neural Networks. KSCE Journal of Civil Engineering 25(2), 371-385.DOI
13 
Miao, P., Yokota, H., and Zhang, Y. (2023) Deterioration Prediction of Existing Concrete Bridges Using a LSTM Recurrent Neural Network. Structure and Infrastructure Engineering 19(4), 475-489.DOI
14 
Python Software Foundation. (2024) Python 3.13.0. https://docs.python.org/3/URL
15 
Raschka, S. (2018) Model Evaluation, Model Selection, and Algorithm Selection in Machine Learning. arXiv:1811.12808.DOI
16 
Rashidi Nasab, A., and Elzarka, H. (2023) Optimizing Machine Learning Algorithms for Improving Prediction of Bridge Deck Deterioration: A Case Study of Ohio Bridges. Buildings 13(6), 1517.DOI
17 
Srikanth, I., and Arockiasamy, M. (2020) Deterioration Models for Prediction of Remaining Useful Life of Timber and Concrete Bridges: A Review. Journal of Traffic and Transportation Engineering (English edition) 7(2), 152-173.DOI
18 
Swana, E. F., Doorsamy, W., and Bokoro, P. (2022) Tomek Link and Smote Approaches for Machine Fault Classification with an Imbalanced Dataset. Sensors 22(9), 3246.DOI
19 
Zhu, M., Wang, J., Yang, X., Zhang, Y., Zhang, L., Ren, H., Wu, B., and Ye, L. (2022) A Review of the Application of Machine Learning in Water Quality Evaluation. Eco- Environment and Health 1(2), 107-116.DOI