Mobile QR Code QR CODE
Export citation EndNote

  1. (Graduate Student, Department of Architecture and Architectural Engineering, Seoul National University, Seoul 08826, Rep. of Korea)
  2. (Professor, Department of Architecture and Architectural Engineering, Seoul National University, Seoul 08826, Rep. of Korea)



기계학습, 압축강도, 배합설계, 신경망, 가우시안 프로세스 회귀모형
machine learning, compressive strength, mix design, neural networks, Gaussian process regression

1. 서 론

건설 현장에서 콘크리트의 품질관리는 구조물의 붕괴 방지와 내구성 확보, 사용자의 안전, 공기 단축을 위해 매우 중요한 요소이다. 특히, 콘크리트 타설 후 소요강도가 발현되지 않은 채, 거푸집과 동바리의 조기 해체로 인해 콘크리트 품질관리 및 후속 공사에 차질이 생기고 심지어 구조물의 붕괴 등 건설 공사 사고까지 발생할 수 있다(Hong et al. 2010; Chun et al. 2014). 최근 시공현장에서는 콘크리트 타설 후 측정한 구조체의 강도가 목표한 설계 강도에 못 미치는 경우가 종종 발생하고 있어, 콘크리트의 실제 강도를 정확히 예측하는 방법이 요구되고 있다.

콘크리트의 강도는 시멘트의 수화반응을 통해 발현된다. 콘크리트 제작을 위한 배합 시에는 시멘트와 물 외에도 굵은 골재, 잔골재, 혼화재 등 다양한 재료가 함께 섞인 불균일 혼합물이기 때문에 강도 예측의 불확실성이 매우 높다. 예를 들어, 고로슬래그미분말이나 플라이 애시를 함께 배합하면 포졸란 반응에 의해 조기 강도 발현은 낮아질 수 있지만, 내구성과 같은 장기적 성능을 향상시켜줄 수 있다. 또한, 적절하지 않은 골재의 입도분포는 재료분리 및 건조수축 등을 일으켜 압축강도에 부정적 영향을 미치기도 한다. 물-시멘트비는 강도와 가장 밀접한 인자로서 그 변화에 따라 ITZ(interfacial transition zone)의 미세구조 상태가 달라지며 압축강도에 영향을 줄 수 있다. 이때 ITZ에 존재하는 칼슘실리케이트 수화물(calcium silicate hydrate, C-S-H)의 미세구조를 정확히 알지 못하는 것도 강도 예측의 불확실성의 원인이 된다. 이와 같이 콘크리트의 역학적 특성은 여러 배합 인자들의 복합적인 영향에 의해 결정된다.

이에 국내 콘크리트 표준시방서(MOLIT 2022)에서는 세부적인 배합설계 절차를 제시하고 있지만 동일한 목표 압축강도라도 수많은 배합비로 결정될 수 있으며 레미콘 업체마다 상이하게 적용되고 있다. 배합표는 레미콘 납품서에 기재되어 현장에 제공되고 있지만, 해당 정보만으로 다양한 배합 인자들의 영향을 고려하여 압축강도를 예측하는 작업은 쉽지 않다.

국내・외 지침에서는 30번 이상의 시험에 의해 도출된 압축강도와 물-시멘트비의 관계식 (1)을 사용하는 것을 원칙으로 하며, Table 1과 같이 물-시멘트비를 이용한 압축강도 추정식을 제시하고 있지만, 경험적 실험 데이터 활용 및 단순 회귀분석이라는 점에서 신뢰성에 한계가 있다. 더욱이 레미콘 제품의 호칭 강도와 콘크리트 구조 설계에 적용하는 설계기준강도가 상이한 개념이지만 혼동되어 사용되기 때문에 타설 현장에서 실제 압축강도를 정확히 판단할 필요가 있다. 식 (1)에서 A와 B는 28일 재령 압축강도와 물-시멘트비를 토대로 한 선형 회귀식의 계수이다.

Table 1 Compression strength estimation equation according to the W/C ratio

Type

Strength estimation equation

Source

Ordinary Portland cement without admixture

$W/C=\dfrac{215}{f_{28}+210}$

$W/C=\dfrac{61}{\dfrac{f_{28}}{k}+0.34}$

Korea

Concrete

Standard Specification

(KCI 1999)

Concrete without air entraining agent

$f_{28}=-13.9+23.0C/W$

US

ACI 211.1

(ACI 1993)

$f_{28}=-7.6+19.0C/W$

$f_{28}=2.2+14.4C/W$

AE concrete with more than 4 % air volume

$f_{28}=-7.4+16.2C/W$

$f_{28}=-1.8+13.4C/W$

Ordinary Portland cement

$W/C=\dfrac{51}{\dfrac{f_{28}}{k}+0.31}$

Japan

Construction

Standard

Specification

(AIJ 2003)

High early strength Portland cement

$W/C=\dfrac{41}{\dfrac{f_{28}}{k}+0.17}$

Moderate heat Portland cement

$W/C=\dfrac{66}{\dfrac{f_{28}}{k}+0.64}$

Note: $W/C$: water-cement ratio; $f_{28}$: compressive strength at 28 days; $k$: strength of cement; $C/W$: cement-water ratio
(1)
$f_{28}={A}+{B}(C/W)$

4차 산업혁명의 도래로 건설 분야에서 인공지능과 기계학습을 활용한 스마트 건설 기술이 도입되고 있으며 구조 및 재료와 관련하여 경험식에 의존하던 분야에서도 활용성이 높아지고 있다(Lee et al. 2018; Park et al. 2021). 본 연구에서는 구조 설계에서 가장 기본적인 재료 물성치이며 빅데이터를 구축하기 용이한 콘크리트의 압축강도 예측에 인공지능과 기계학습을 적용하고자 한다. 실무에서 레미콘 납품서의 기본 배합 정보를 활용하여 회귀 목적의 다양한 머신러닝 알고리즘을 종합적으로 분석하고 콘크리트 압축강도 예측에 가장 적합한 모형을 찾아 정확하게 예측하는데 목적이 있다.

2. 기존 연구 사례

콘크리트의 압축강도 산정을 위해 기존의 많은 연구자들이 배합비를 바꿔가며 반복한 실험 데이터를 토대로 회귀 분석하였다. Cho et al. (2003)은 현장콘크리트의 배합표에 의한 압축강도 추정식을 배합 인자들의 상관관계를 고려하여 다중 회귀분석으로 도출하였다. Sobhani et al.(2010)은 프리패브리케이션(pre-fabrication)을 위해 사용되는 28일 재령의 슬럼프가 없는 콘크리트의 압축강도를 회귀분석을 통해 예측하였다. Chithra et al.(2016)은 나노 실리카(nano silica)와 동 슬래그(copper slag)를 포함한 고성능 콘크리트의 압축강도를 다중 회귀분석을 사용하여 예측하였다. 그러나 콘크리트의 배합비와 압축강도 사이의 관계가 선형이 아니기 때문에 다중 선형회귀분석 등 기존의 모형은 한계가 뚜렷하다. Xu et al.(2021)은 유전 알고리즘(genetic algorithm, GA)을 이용하여 콘크리트에 가장 큰 영향을 주는 변수를 찾고 랜덤 포레스트(random forest, RF)를 사용하여 압축강도를 예측하였다. Nguyen et al.(2020)은 신경망을 이용하여 플라이 애시 기반의 지오폴리머 콘크리트의 압축강도를 예측하였다. Kim et al.(2002)은 인공신경망의 한 종류인 다층 퍼셉트론을 이용하여 콘크리트의 배합 요소와 압축강도, 슬럼프값을 추정하였다. Choi et al.(2015)는 강섬유 보강 콘크리트의 실험 결과를 이용하여 기계적 성질을 추정하기 위해 신경망을 적용하였다. Yeh(1998)은 신경망을 적용하여 고성능 콘크리트의 강도를 예측하였다.

이처럼 기존의 관련 선행연구들은 콘크리트 압축강도를 예측하기 위해 신경망, 랜덤 포레스트 등 하나의 기계학습 모형을 선택하여 회귀를 시도하였으나, 여러 기계학습 모형 간의 성능을 비교 및 최적의 모델을 분석한 연구는 아직 부족한 실정이다. 따라서 모델 성능을 파악하기 위해 동일 데이터로 학습한 여러 모델의 직접적인 비교가 필요하다. 각 모델의 특징을 분석하여 압축강도 예측에 대한 최적의 모델을 도출하고자 한다.

3. 배경 이론 및 데이터 분석

3.1 기계학습 알고리즘

인공지능은 컴퓨터로 하여금 사람의 지능을 모사하도록 하는 시스템을 포괄적으로 일컫는 용어이고, 그중에서도 학습에 초점이 맞추어진 것이 기계학습이다. 반복적으로 학습하면 사람도 잘 기억하게 되듯이, 컴퓨터가 빅데이터를 여러 번 반복하여 학습하게 함으로써 그 정확도를 높이는 방식이다. 정답 데이터를 알고 훈련에 활용하는 지도학습 계열의 기계학습은 회귀와 분류에 있어 탁월한 능력을 보여왔다. 변수들 사이의 내재된 패턴을 학습함으로써 기존의 방법론인 단순 회귀 모형보다 더 정확하게 예측할 수 있다는 점에 그 우수성이 있다. 본 연구에서는 콘크리트의 압축강도 예측을 위해 여러 기계학습 모형 중 회귀에 목적을 둔 Linear Regression(LR), Decision Tree(DT), Support Vector Machine (SVM), Ensemble, Gaussian Process Regression(GPR), Neural Network(NN) 모형을 사용하였다.

LR은 식 (2)와 같이 선형으로 된 식을 이용하여 데이터를 예측하는 회귀 모형을 구성한다. $x_{j}$는 각 데이터의 입력변수이고, $w_{i}$는 가중치, $h_{w}$는 출력변수를 의미한다. 구성된 선형 회귀 모형인 $h_{w}$가 실제 출력변수 값인 $y$에 얼마나 일치하는지를 확인하고 오차를 최소화하는 최적의 모형을 구성하기 위해 식 (3)과 같이 $w^{*}$를 상정할 수 있다. 가중치를 조정하여 최적의 선형 회귀를 찾는 방법으로 널리 활용되는 경사 하강법(gradient descent)은 learning rate를 $\alpha$라 할 때, 식 (4)와 같이 미분계수가 0이 되도록 하는 점을 찾는 방법으로 $w^{*}$를 구할 수 있다.

(2)
$h_{w}(x_{j})= w_{0}+\sum_{i=1}^{n}w_{i}x_{j,\: i}$
(3)
$w^{*}=\arg\underline{\dfrac{}{}}\min_{w}\sum_{j}L_{2}(y_{j},\: h_{w}(x_{j}))$
(4)
$w_{i}=w_{i}+\alpha\sum_{j}x_{j,\: i}(y_{j}-h_{w}(x_{j}))$

DT 회귀는 학습에 활용되는 데이터 세트를 기준값보다 작은 그룹과 큰 그룹으로 이진 분할을 반복하며 트리 구조를 형성하는 방식으로 동작한다. 각 노드의 leaf가 하나의 값에 대응되도록 하여, 노드 별로 이진 분할의 기준이 되는 값을 훈련 데이터 세트로부터 학습하여 회귀 모형을 구성한다.

SVM은 support vector와 margin을 이용하여 데이터의 경계를 결정하는 데에 널리 사용되는 기계학습 모형이기 때문에 margin을 최대화하면 분류 문제에 적용할 수 있고, margin을 최소화하면 회귀 문제에 적용할 수 있다. 즉, 주어진 margin 내에 최대로 많은 데이터가 존재하도록 하는 방식으로 회귀 모형을 구성한다.

Ensemble은 DT 여러 개를 결합하여 구성한 것으로, Bagging 방식과 Boosting 방식 등이 있다. 핵심적인 아이디어는 여러 개의 약한 분류기를 결합하여 강한 분류기를 구성하는 것이다. Bagging 방식은 병렬적으로 DT를 구성하여 최종적으로 분산을 줄이는 것이고, Boosting 방식은 여러 DT를 순차적으로 학습하면서 가중치를 부여하여 최종적인 회귀 모형을 구성하는 것이다.

GPR은 앞서 언급한 4가지 모형과 달리 데이터의 개수가 늘어남에 따라 parameter 개수도 변화하는 non parametric 모형으로, 다변량 정규분포를 무한 차원으로 일반화하여 확장한 것이기 때문에 좀 더 복잡한 회귀 문제에 적합하다. Gaussian process인 $f(x)$가 평균 함수 $m(x)$를 포함하고, 공분산 함수 $k(x,\: x')$를 포함할 때 행렬 $[K(X,\: X)]_{ij}$의 각 항이 $k(x_{i},\: x_{j})$라면 식 (5)와 같은 분포 식을 통해 예측값 $f*$를 알 수 있다. 모형을 훈련하는 과정에서는 kernel function으로 불리는 공분산 함수의 파라미터들을 조절하며 정확도를 향상하게 되고, 적절한 kernel function을 결정하는 것이 엔지니어의 몫이다.

(5)
$f*vert X*,\: X,\: f\sim N(K(X*,\: X)K(X,\: X)^{-1}f,\: \\ K(X*,\: X*)-K(X*,\: X)K(X,\: X)^{-1}K(X,\: X*))$

NN은 사람의 신경 세포 사이의 상호작용을 모사한 기계학습 모형으로, 크게 입력층과 은닉층, 출력층으로 구성된다. 각 층에는 노드가 여러 개 존재할 수 있으며 각 노드에서 가중치와 편향 값의 조정을 통해 출력을 변화할 수 있다. 은닉층의 개수, 각 은닉층의 노드 개수, learning rate 등은 엔지니어에 의해 결정되는 hyper parameter이다. 입력값과 출력값 사이의 내재된 패턴을 찾기 위해 가중치를 계속해서 업데이트하면서 예측값과 실제 값의 오차가 특정 값 이하로 될 때까지 반복하며 학습을 수행한다. 단일 은닉층 신경망의 노드 개수를 무한대로 늘리면 중심 극한 정리에 따라 NN이 Gaussian process로 수렴하는 것은 널리 알려져 있다.

3.2 데이터베이스 분석

기계학습 모형의 훈련과 검증을 위해 사용된 데이터로는 17개의 서로 다른 논문에서 발표한 콘크리트 압축강도 실험 데이터를 수집한 University of California, Irvine(UCI)의 Machine Learning Repository의 오픈 데이터베이스(Yeh 1998)를 활용하였다. 공시체의 크기는 모두 높이 15 cm의 원통형으로 변환되어 통일되었으며, 골재 크기가 20 mm 이상인 것과 특수 환경에서 양생된 것은 제거되었다(Yeh 1999).

또한 실제 압축강도와의 정확도 검증을 위해 국내 레미콘 회사 3곳의 배합비 4종으로 직접 실험한 38개 압축강도 시험 데이터를 활용하였다. 시험은 KS F 2405(KATS 2017)에 준하여 𝜙100×200 mm 원주형 공시체로 실시하였다(Fig. 1).

Fig. 1 Compressive strength test of cylinder
../../Resources/KCI/JKCI.2022.34.5.505/fig1.png

데이터에는 시멘트, 고로슬래그미분말, 플라이 애시, 물, 고성능 감수제, 굵은 골재, 잔골재, 재령, 콘크리트 압축강도로 총 9개의 변수가 있고, 총 1,068개의 콘크리트 배합비와 재령정보, 압축강도 데이터로 구성되어 있다. 압축강도를 출력변수로 하고, 나머지 8개의 변수를 입력변수로 설정하였다.

기계학습 모형에 적용하기에 앞서 모든 데이터는 min-max scaler 방식으로 식 (6)과 같이 정규화하는 전처리 과정을 거쳤다. 이러한 스케일링 과정을 거치는 이유는 데이터의 값이 너무 크거나 작은 경우 기계학습 모형이 학습하는 과정에서 값이 0으로 수렴하거나 무한으로 발산하게 되므로 제대로 된 학습이 불가하기 때문이다. 따라서 사용된 min-max scaler는 모든 변수들의 값을 0과 1 사이에 위치하게 함으로써 학습과정 중 문제가 발생하지 않도록 전처리하였다.

(6)
$x_{{no alized}}=\dfrac{x- x_{\min}}{x_{\max}- x_{\min}}$

Table 2에서는 변수별 최솟값, 최댓값, 평균, 단위를 나타내었다. 데이터 세트의 분할비는 훈련 집합(training set)을 전체의 67 %인 712개, 검증 집합(testing set)을 나머지 33 %인 356개로 설정하였다. 데이터의 분할은 무작위하게 이루어졌으며, 각 기계학습 모형의 동등 비교를 위해 같은 훈련 집합과 검증 집합으로 성능 비교를 수행하였다.

Table 2 Ranges of variables of data sets

Variable

Minimum

Maximum

Average

Unit

Cement

102

540

281.17

kg/m3

Ground blast-furnace slag

0

359.4

73.90

kg/m3

Fly ash

0

200.1

54.19

kg/m3

Water

121.8

247

181.57

kg/m3

Superplasticizer

0

32.2

6.20

kg/m3

Coarse aggregate

801

1145

972.92

kg/m3

Fine aggregate

594

992.6

773.58

kg/m3

Age

1

365

45.66

day

Compressive strength

2.33

82.6

35.82

MPa

각각의 입력변수와 콘크리트 압축강도 사이의 상관관계는 Fig. 2에 나타나 있다. 시멘트 양과 재령, 고성능감수제, 고로슬래그미분말은 콘크리트 압축강도와 양의 상관관계를 보이고, 물과 골재량, 플라이 애시는 콘크리트 압축강도와 음의 상관관계를 보인다. 시멘트 양, 고성능감수제, 재령, 고로슬래그미분말 순으로 압축강도 증가에 큰 영향을 끼쳤다. 반대로 물의 양이 굵은 골재와 잔골재량, 플라이 애시 양에 비해 압축강도 감소에 더 큰 영향을 끼쳤다. 시멘트와 물의 양이 압축강도에 가장 큰 영향을 주는 변수라는 점에서 기존의 경험식에 부합하는 결과이지만, 더 정확한 예측을 위해서는 물과 시멘트 외의 다른 변수들에 대한 고려가 필요하다.

Fig. 2 Heat map between variables
../../Resources/KCI/JKCI.2022.34.5.505/fig2.png

4. 기계학습을 이용한 콘크리트 압축강도 예측 성능 결과 및 분석

여러 모형의 성능을 평가하기 위해 도입한 지표는 일반적으로 기계학습 모형을 평가하는 데에 널리 활용되는 세 가지로 RMSE(root mean square error), Coefficient of Determination ($R^{2}$), MAE(mean absolute error)이다. 각 지표의 계산 식은 아래와 같다. RMSE와 MAE는 값이 0에 가까울수록, $R^{2}$는 값이 1에 가까울수록 모형의 성능이 우수함을 의미한다.

(7)
${R}{M}{S}{E}=\sqrt{\dfrac{\sum_{i=1}^{{N}}(y_{i}-\hat{y_{i}})^{2}}{N}}$
(8)
$R^{2}=1-\dfrac{\sum_{i}(y_{i}-\hat{y_{i}})^{2}}{\sum_{i}(y_{i}-\overline{y})^{2}}$
(9)
${MAE}=\dfrac{1}{N}\sum_{{i}=1}^{N}\left | y_{i}-\hat{y_{i}}\right |$

각 모형의 학습에서 하이퍼파라미터는 다음과 같이 설정하였다. DT는 minimum parent size와 minimum leaf size를 설정하였는데, Fine DT는 각각 10, 4, Medium DT는 각각 24, 12, Coarse DT는 각각 72, 36로 설정하였다. Minimum parent size란 branch 노드에서 관찰하는 최소의 수를 의미하며, minimum leaf size란 leaf 노드에서 관찰하는 최소의 수를 의미한다. SVM은 kernel function의 종류와 kernel scale을 하이퍼파라미터로 설정하였다. 먼저 linear SVM은 식 (10)과 같이 kernel function을 linear로 설정하였고, quadratic SVM은 식 (11)과 같이 kernel function을 polynomial로 설정하였으며, 이 때 차수는 2로 설정하였다. Cubic SVM은 차수를 3으로 설정하였다. 식 (11)에서 $q$는 차수를 의미한다. 세 개의 Gaussian SVM은 kernel function이 식 (12)와 같이 Gaussian으로서, kernel scale은 각각 0.71, 2.8, 11로 설정되었다.

(10)
$G(x_{j},\: x_{k})=x_{j}'x_{k}$
(11)
$G(x_{k},\: x_{j})=(1+x_{j}'x_{k})^{q}$
(12)
$$ G\left(x_k, x_j\right)=\exp \left(-\left\|x_j-x_k\right\|^2\right) $$

Boosted Ensemble 모형의 경우, minimum leaf size를 8로, learning rate를 0.1로, ensemble cycle 수를 30으로 설정하였다. Bagged Ensemble 모형의 경우, minimum leaf size를 8로, learning rate를 1로, ensemble learning cycle 수를 30으로 설정하였다. GPR은 kernel function의 종류를 하이퍼파라미터로 설정하였다. 각 GPR 모형의 kernel function은 Squared Exponential(식 (13)), Matern 5/2(식 (14)), Exponential(식 (15)), Rational Quadratic(식 (16))이다.

(13)
$k(x_{i},\: x_{j}vert\theta)=\sigma_{f}^{2}\exp\left[-\dfrac{1}{2}\dfrac{(x_{i}-x_{j})^{T}(x_{i}-x_{j})}{\sigma_{l}^{2}}\right]$
(14)
$k(x_{i},\: x_{j})=\sigma_{f}^{2}\left(1+\dfrac{\sqrt{5}r}{\sigma_{l}}+\dfrac{5r^{2}}{3\sigma_{l}^{2}}\right)\exp\left(-\dfrac{\sqrt{5}r}{\sigma_{l}}\right)$
(15)
$k(x_{i},\: x_{j}vert\theta)=\sigma_{f}^{2}\exp\left(-\dfrac{r}{\sigma_{l}}\right)$
(16)
$k(x_{i},\: x_{j}vert\theta)=\sigma_{f}^{2}\left(1+\dfrac{r^{2}}{2\alpha\alpha_{l}^{2}}\right)^{-\alpha}$

여기서, $\sigma_{l}$ : characteristic length scale

$\sigma_{f}$ : signal standard deviation

$\alpha$ : 양의 값의 scale mixture parameter

$r$ : 유클리드 거리, =$\sqrt{(x_{i}-x_{j})^{T}(x_{i}-x_{j})}$

NN 모형에서는 activation function으로 ReLU(rectified linear unit)를 사용하였고, 훈련 시 적용된 알고리즘은 Levenberg- Marquardt이며, 초기 $\mu$값은 0.001, 감소 인자는 0.1, 증가 인자는 10으로 설정하였다. 여기서 $\mu$의 의미는 그 값이 작아져서 0이 되면 Levenberg-Marquardt 알고리즘이 근사 헤세 행렬을 사용하는 뉴턴 방법이 되고, $\mu$의 값이 큰 값이면 스텝의 크기가 작은 경사하강법이 되도록 하는 파라미터이다. $\mu$는 성능 함수가 감소되는 스텝이 끝날 때마다 감소되고, 반대의 경우 증가한다. Narrow NN은 은닉층의 사이즈를 10, epoch 수는 15로, Medium NN은 은닉층의 사이즈를 25, epoch 수는 20으로, Wide NN은 은닉층의 사이즈를 100, epoch 수는 21로 두었다. 2개 은닉층 깊이의 Bilayered NN은 첫 번째 은닉층의 사이즈를 10, 두 번째 은닉층의 사이즈도 역시 10으로 설정하였다. epoch 수는 27이다. 마지막으로 3개 은닉층 깊이의 Trilayered NN의 경우에도 모든 은닉층의 사이즈를 10으로, epoch 수는 15로 두고 학습을 진행하였다.

Table 3에 각 모형의 성능 평가 결과를 나타내었다. 훈련 집합과 검증 집합에서 GPR 모형과 NN 모형이 다른 모형들에 비해 우수한 설명력과 낮은 오차를 보였다. GPR 모형 중에서는 Exponential kernel function을 사용한 모형이 훈련 집합에서 결정 계수 0.9771을 보였고, 오차 지표인 RMSE와 MAE도 각각 0.0315, 0.0211로 가장 우수하였다. GPR은 자체적인 학습과정으로 예측의 불확실성을 감소시키며, 예측값뿐만 아니라 그 예측값의 신뢰도를 알 수 있는 모형이다. 이를 실무에 적용할 시, 현장의 엔지니어가 예측값을 판단하는 데 있어 유리하다. GPR 모형은 알고 있는 값들로부터의 거리를 함수로 표현하는 커널을 도입하여 확률분포를 기반으로 새로운 입력에 관한 결과를 예측하는 만큼, 훈련집합의 결과에 비해 검증 집합의 결과 정확도가 다소 낮을 수밖에 없는 모형의 내재적 특성이 있으므로 과적합된 것이 아니다. 이는 결정계수 값에서 차이가 거의 없는 것을 통해 수치적으로도 확인할 수 있다. NN 모형 중에서는 hidden layer size를 25로 설정한 Medium NN 모형이 훈련 집합에서 결정 계수 0.9140을 보였고, RMSE와 MAE가 각각 0.0610, 0.0435로 나타났다. NN의 경우, hidden layer의 개수가 많아지거나 여러 겹이 된다고 해서 무조건 결과가 좋아지는 것이 아님을 확인할 수 있다. Yeh(1998)의 연구에서는 은닉층 깊이를 단층으로 하고, 유닛 개수를 8개로 했을 때 훈련 집합의 결정 계수 0.917, 검증 집합의 결정 계수 0.855로 보고된 바 있다. 본 연구에서 은닉층 깊이를 동일하게 하고 유닛 개수를 10개로 했을 때 훈련 집합의 결정 계수 0.902, 검증 집합의 결정 계수 0.823으로 거의 동등한 결과를 보였다. CPU 연산만을 사용했을 때 전체 데이터 세트를 대상으로 한 모든 모델의 학습시간은 1분 내외로 소요되었다.

Fig. 3은 훈련 집합과 검증 집합의 결과를 가로축을 실제 압축강도, 세로축을 예측한 압축강도로 하여 도시한 그래프이다. 각각의 대분류 모형에서 대표적인 세부 모형 한 개씩을 나타내었다. 기본적이며 단순한 회귀 모형인 LR(Fig. 3(a))의 예측이 예상대로 가장 부정확하게 나타났다. 선형적인 식으로는 입력변수와 출력변수 사이의 관계를 정확히 표현하지 못하여 전 영역에서 산발적으로 나타났다. DT(Fig. 3(b))는 데이터가 비례하는 경향성은 띠었지만 이진 분할을 반복하며 트리 구조를 형성하는 방식으로 동작하기 때문에 데이터 예측값이 단계적으로 나타났다.

SVM(Fig. 3(c))은 데이터의 경계를 결정하는 margin을 최소화하여 회귀 문제를 해결하도록 하였다. 결국 margin에 따라 LR과 유사한 방식으로 학습하며 예측 결과도 그와 유사한 분포를 보였다. Ensemble(Fig. 3(d))은 여러 DT를 순차적으로 학습하며 분류기를 결합하는 방식으로 예측력을 보완할 수 있지만, 그 한계가 존재하였다. 또한 LR, DT, SVM, Ensemble 모형은 공통적으로 저강도에서는 예측 강도를 과대평가하였고, 고강도에서는 과소평가하는 경향을 보였다.

한편, 육안으로도 GPR과 NN의 산포도가 압축강도의 전반적인 범위에서 항등 함수 직선에 밀집되어 있음이 관찰된다. 즉, 두 모델이 콘크리트 압축강도를 보다 정확하게 예측하는 것으로 나타났다. 특히, GPR이 실제 값과 예측값의 대응 관계가 높은 것을 확인하였다. 회귀 모형을 모델링 할 때, LR처럼 모형의 식 형태를 미리 정해놓고 추정할 시 변수 간 상관관계가 복잡해짐에 따라 예측력이 떨어진다. 하지만, 함수 식을 정해놓고 파라미터를 찾는 것이 아니라 데이터를 가장 잘 반영할 수 있는 함수 자체를 찾는 GPR과 NN 방식은 복합적 요소가 작용하는 콘크리트 압축강도 발현을 보다더 잘 설명할 수 있다. 기계학습을 진행하면서, GPR의 Kernel function을 최적화하기 위한 파라미터나 NN의 Hidden layer 내부에서 조정되는 Weight는 내부에서 작동하는 방식에 대한 단서가 없더라도 좋은 회귀 결과를 예측하게끔 적절하게 조정되는 것으로 확인되었다.

Fig. 3 Regression results of several machine learning models (horizontal axis: normalized actual strength, vertical axis: normalized predicted strength)
../../Resources/KCI/JKCI.2022.34.5.505/fig3.png
Table 3 Machine learning results

Types of machine learning model

RMSE

Coefficient of determination

MAE

Parameter setting

Training

Testing

Training

Testing

Training

Testing

Linear regression

(LR)

Simple LR

0.1286

0.1325

0.6236

0.5926

0.1006

0.1035

-

Interactions LR

0.1051

0.1085

0.7554

0.7269

0.0821

0.0858

Robust option: off

Robust LR

0.1109

0.2119

0.8326

-0.0415

0.1060

0.1190

Robust option: on

Stepwise LR

0.1095

0.1166

0.7296

0.6850

0.0848

0.0894

Maximum number of steps: 1000

Decision tree

(DT)

Fine DT

0.0539

0.0894

0.9329

0.8147

0.0381

0.0640

Minimum leaf size: 4

Medium DT

0.0802

0.0933

0.8515

0.7983

0.0598

0.0729

Minimum leaf size: 12

Coarse DT

0.1072

0.1160

0.7348

0.6880

0.0828

0.0925

Minimum leaf size: 36

Support vector machine

(SVM)

Linear SVM

0.1341

0.1474

0.5850

0.4964

0.0985

0.1048

Linear kernel function

Quadratic SVM

0.0948

0.0963

0.7926

0.7847

0.0707

0.0717

Quadratic kernel function

Cubic SVM

0.0738

0.0851

0.8745

0.8319

0.0534

0.0622

Cubic kernel function

Fine Gaussian SVM

0.0825

0.0882

0.8430

0.8197

0.0595

0.0652

Gaussian kernel function

kernel scale: 0.71

Medium Gaussian SVM

0.1207

0.1253

0.6637

0.6362

0.0947

0.0987

Gaussian kernel function

kernel scale: 2.8

Coarse Gaussian SVM

0.1731

0.1740

0.3085

0.2976

0.1391

0.1396

Gaussian kernel function

kernel scale: 11

Ensemble

Boosted trees ensemble

0.0671

0.0786

0.8963

0.8569

0.0508

0.0584

Minimum leaf size: 8

Number of learners: 30

Learning rate: 0.1

Bagged trees ensemble

0.0553

0.0717

0.9293

0.8807

0.0410

0.0536

Minimum leaf size: 8

Number of learners: 30

Gaussian process regression

(GPR)

Squared exponential GPR

0.0544

0.0665

0.9318

0.8976

0.0406

0.0509

Squared exponential

kernel function

Matern 5/2 GPR

0.0517

0.0646

0.9383

0.9033

0.0382

0.0488

Matern 5/2

kernel function

Exponential GPR

0.0315

0.0661

0.9771

0.8988

0.0211

0.0473

Exponential

kernel function

Rational quadratic GPR

0.0540

0.0658

0.9326

0.8997

0.0403

0.0505

Rational quadratic

kernel function

Neural network

(NN)

Narrow NN

0.0652

0.0874

0.9020

0.8229

0.0484

0.0663

Hidden layer size

10

Medium NN

0.0610

0.0699

0.9140

0.8867

0.0435

0.0526

Hidden layer size

25

Wide NN

0.0721

0.0863

0.8802

0.8274

0.0528

0.0598

Hidden layer size

100

Bilayered NN

0.0747

0.0702

0.8714

0.8858

0.0577

0.0543

Hidden layer size

[10 10]

Trilayered NN

0.0711

0.0783

0.8833

0.8579

0.0537

0.0604

Hidden layer size

[10 10 10]

5. 결 론

콘크리트 압축강도 발현은 하나의 식, 하나의 과정으로 설명하기 어렵고, 비선형성의 매우 복잡한 과정이 작용한다. 실무에서도 배합표만으로 압축강도를 예측하는 것이 어려워, 정확도가 떨어지는 28일 재령 압축강도 경험식에 의존하고 있는 실정이다. 이에 본 연구에서는 콘크리트 압축강도 예측을 위해 기계학습 인공지능 모형을 도입함으로써 모형별 예측 성능을 비교 및 분석하였다. 본 연구를 통해 얻은 유의미한 결과를 정리하면 다음과 같다.

1) 기존의 물-시멘트 비에만 의존하고, 28일 재령으로 제한하던 경험식을 탈피하여 여러 변수를 입력으로 활용하였다. 입력변수는 시멘트, 고로슬래그미분말, 플라이 애시, 물, 고성능 감수제, 굵은 골재, 잔골재, 재령으로 8개이며, 출력변수는 콘크리트 압축강도이다. 배합 인자와 압축강도의 일차원적인 상관성이 아닌, 다량의 입력변수가 포함된 비선형적인 모형으로 구현하였다.

2) 단순 회귀분석 식이 아닌 비선형적 모형을 구현하기 위해 기계학습 모형을 도입하여 예측력을 높였다. 반복적이고 복잡한 비선형 계산 과정도 간단히 수행하여 배합표의 정보만을 토대로 비교적 정확한 압축강도 예측이 가능하였다.

3) 실제 활용 빈도가 높은 여러 기계학습 모형 간의 비교를 통해 콘크리트 압축강도 예측에 가장 적합한 모형을 도출하였다. 결과적으로, 다른 회귀 모형과 달리 데이터의 개수가 늘어남에 따라 parameter 개수도 변화하는 non-parametric 모형인 GPR이 가장 우수한 성능을 보였다. 또한 입력값과 출력값 사이의 내재된 패턴을 찾기 위해 가중치를 계속해서 업데이트하는 NN 방식이 차순위로 우수한 것을 확인하였다. 배합비만으로 실제 공시체 측정 없이 적은 오차 범위 내에서 콘크리트 압축강도 예측이 가능한 기계학습 모형을 구현하였다는 점에서 의의가 있다. 또한 기존 연구와 다르게 회귀를 위한 여러 기계학습 모형의 성능을 동일 데이터에 대하여 직접 비교하였다는 차별점이 있다.

4) 양생 일수나 온습도 등 환경조건, 골재의 크기 및 강도가 모두 반영된다면 더욱 정확한 예측이 가능하겠으나, 이에 대한 데이터가 존재하지 않아 한계가 있다. 본 연구에서는 이의 영향을 최소화하기 위해 재령 정보를 입력변수에 포함하였으며, 특수 환경에서 양생된 데이터는 제외하고 분석하였다. 골재의 크기 및 강도에 대한 정보는 부재하여 향후 실험적 연구에서 추가로 고려되어야 할 것이다. 앞으로 데이터베이스의 축적을 통해 보완이 가능할 것이며, 해당 기계학습 모형을 통한 예측의 정확도는 더욱 향상될 것으로 기대된다.

감사의 글

이 논문은 서울대학교 2019년도 융・복합 연구과제 지원사업의 지원을 받아 수행된 연구입니다. 이에 감사드립니다.

References

1 
ACI Committee 211. 이름, 1993, Standard Practice for Selecting Proportions for Normal, Heavyweight, and Mass Concrete (ACI 211.1), Farmington Hills, MI; American Concrete Institute (ACI)Google Search
2 
AIJ. 이름, 2003, Japanese Architectural Standard Specification for Reinforced Concrete Work (JASS 5), Architectural Institute of Japan (AIJ)Google Search
3 
Chithra S., Senthil Kumar S.R.R., Chinnaraju K., Alfin Ashmita F., 2016, A Comparative Study on the Compressive Strength Prediction Models for High Performance Concrete Containing Nano Silica and Copper Slag Using Regression Analysis and Artificial Neural Networks, Construction and Building Materials, Vol. 114, No. 1, pp. 528-535DOI
4 
Cho H., Yoon S., Jee N.Y., 2003, The Estimation of Compressive Strength of Ready-Mixed Concrete On the Basis of Mix Design, Journal of the Architectural Institute of Korea - Structure & Construction, Vol. 19, No. 4, pp. 105-112Google Search
5 
Choi H.-K., Bae B.-I., Koo H.-S., 2015, Correlation between Mix Proportion and Mechanical Characteristics of Steel Fiber Reinforced Concrete, Journal of the Korea Concrete Institute, Vol. 27, No. 4, pp. 331-341DOI
6 
Chun S.-C., Tak S.-Y., Lee S.-H., Sho K.-H., Ha T.-H., 2014, Evaluation of Construction Loads of Slabs and Shores with Removing Shores and Placing Reshores, Journal of the Korea Concrete Institute, Vol. 26, No. 3, pp. 385-392DOI
7 
Hong G.-H., Park H.-G., Eum T.-S., Mihn J.-S., Kim Y.-N., 2010, Evaluation of Strength and Stiffness Gain of Concrete at Early-Ages, Journal of the Korea Concrete Institute, Vol. 22, No. 2, pp. 237-245DOI
8 
KATS , 2017, Standard Test Method for Compressive Strength of Concrete (KS F 2405), Seoul, Korea: Korea Agency for Technology and Standards (KATS), Korea Standard Association (KSA). 1-12. (In Korean)Google Search
9 
Kim I.-S., Lee J.-H., Yang D.-S., Park S.-K., 2002, Prediction on Mix Proportion Factor and Strength of Concrete Using Neural Network, Journal of the Korea Concrete Institute, Vol. 14, No. 4, pp. 457-466Google Search
10 
Lee Y.-I., Kim B., Cho S., 2018, Image-Based Spalling Detection of Concrete Structures Using Deep Learning, Journal of the Korea Concrete Institute, Vol. 30, No. 1, pp. 91-99Google Search
11 
MOLIT. 이름, 2022, Korean Construction Specification: General Concrete (KCS 14 20 10), Sejong, Korea: Ministry of Land, Infrastructure and Transport (MOLIT). (In Korean)Google Search
12 
Nguyen K. T., Nguyen Q. D., Le T. A., Shin J., Lee K., 2020, Analyzing the Compressive Strength of Green Fly Ash Based Geopolymer Concrete Using Experiment and Machine Learning Approaches, Construction and Building Materials 2020, Vol. 247DOI
13 
Park J., Kim D., Shim S., Hong J., Choi H., Jin S.-S., 2021, Water-Cement Ratio Estimation of Cementitious Materials Using Electrochemical Impedance Spectroscopy and Machine Learning, Journal of the Korea Concrete Institute, Vol. 33, No. 4, pp. 353-361Google Search
14 
Sobhani J., Najimi M., Pourkhorshidi A. R., Parhizkar T., 2010, Prediction of the Compressive Strength of No-Slump Concrete: A Comparative Study of Regression, Neural Network and ANFIS Model, Construction and Building Materials, Vol. 24, No. 5, pp. 709-718DOI
15 
Xu J., Zhou L., He G., Ji X., Dai Y., Dang Y., 2021, Comprehensive Machine Learning-Based Model for Predicting Compressive Strength of Ready-Mix Concrete, Materials, Vol. 14, No. 5, pp. 1068DOI
16 
Yeh I.-C., 1998, Modeling of Strength of High Performance Concrete Using Artificial Neural Networks, Cement and Concrete Research, Vol. 28, No. 12, pp. 1797-1808DOI
17 
Yeh I.-C., 1999, Design of High Performance Concrete Mixture Using Neural Networks, Journal of Computing in Civil Engineering ASCE, Vol. 13, No. 1, pp. 36-42DOI