Mobile QR Code QR CODE

Journal of the Korea Concrete Institute

ISO Journal TitleJ Korea Concr Inst.

SCOPUS
KCI Accredited Journal

Main Menu

Journal Search

Export citation EndNote

[

Research article

]

Journal of the Korea Concrete Institute

KCI Vol. 34, No. 5, p.505-513

ISSN (print) :

1229-5515

ISSN (online) :

2234-2842

Received : 14 February 2022Revised : 29 June 2022Accepted : 11 July 2022

DOI :

https://doi.org/10.4334/JKCI.2022.34.5.505

기계학습 모형의 콘크리트 압축강도 예측 성능 비교 연구

Comparison of Performance for Predicting Compressive Strength of Concrete Using Machine Learning

이상민 (Sang Min Lee) ¹iD 성한석 (Han Suk Sung) ¹iD 강현구 (Thomas H.-K. Kang) ²^†iD

(Graduate Student, Department of Architecture and Architectural Engineering, Seoul National University, Seoul 08826, Rep. of Korea)
(Professor, Department of Architecture and Architectural Engineering, Seoul National University, Seoul 08826, Rep. of Korea)

^† Corresponding author E-mail: tkang@snu.ac.kr

License :

This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.(www.kci.or.kr).

Abstract

본 연구의 목적은 콘크리트 압축강도 예측을 위한 여러 기계학습 모형의 성능을 비교하고 분석하는 것이다. 공개된 콘크리트 배합비와 압축강도 데이터베이스와 함께 실제 실험을 통해 측정한 공시체의 압축강도와 배합비 데이터가 함께 사용되었다. 입력변수로 시멘트, 고로슬래그미분말, 플라이 애시, 물, 고성능감수제, 굵은 골재, 잔골재, 재령이 도입되었고, 출력변수는 콘크리트 압축강도로 설정하였다. 각 기계학습 모형의 세부 파라미터를 변경해가며 가장 예측력이 높은 모형을 탐색하였고, 결과적으로 Neural Network와 Gaussian Process Regression 계열의 모형이 Linear Regression, Decision Tree, Support Vector Machine, Ensemble 모형에 비해 전반적으로 우수한 예측 성능을 보이는 것을 확인하였다. 본 연구에서는 배합비만으로 실제 공시체 측정 없이 적은 오차 범위 이내로 콘크리트 압축강도 예측이 가능한 기계학습 모형을 구현하였다는 점에서 의미 있는 결론을 도출하였다. 또한 기존의 연구와 다르게 회귀를 위한 여러 기계학습 모형의 성능을 동일 데이터에 대하여 직접 비교하였다는 차별점이 있다. 향후 데이터베이스의 계속된 축적과 여러 환경 변수들의 추가를 통해 성능을 더욱 높일 수 있을 것이다.

Abstract

The purpose of this study is to compare and investigate the performance of various machine learning models for predicting the compressive strength of concrete. The compressive strength and mixing ratio data of the specimens measured from various experiments were combined with an open database. Input variables were related to cement, blast furnace slag, fly ash, water, superplasticizer, coarse aggregate, fine aggregate, and age. The output variable was the compressive strength of the concrete. As a consequence, the neural network and Gaussian process regression model outperformed the linear regression, decision tree, support vector machine, and ensemble models in terms of predictive performance. This study is superior in that it uses a machine learning model to predict the compressive strength of concrete within a limited error range without having to measure the compressive strength of concrete. This research paves the way to improving the accuracy of prediction through database accumulation and the incorporation of environmental variables in the future.

키워드

기계학습, 압축강도, 배합설계, 신경망, 가우시안 프로세스 회귀모형

Key words

machine learning, compressive strength, mix design, neural networks, Gaussian process regression

1. 서 론

건설 현장에서 콘크리트의 품질관리는 구조물의 붕괴 방지와 내구성 확보, 사용자의 안전, 공기 단축을 위해 매우 중요한 요소이다. 특히, 콘크리트 타설 후 소요강도가 발현되지 않은 채, 거푸집과 동바리의 조기 해체로 인해 콘크리트 품질관리 및 후속 공사에 차질이 생기고 심지어 구조물의 붕괴 등 건설 공사 사고까지 발생할 수 있다^{(Hong et al. 2010;} ^{Chun et al. 2014)}. 최근 시공현장에서는 콘크리트 타설 후 측정한 구조체의 강도가 목표한 설계 강도에 못 미치는 경우가 종종 발생하고 있어, 콘크리트의 실제 강도를 정확히 예측하는 방법이 요구되고 있다.

콘크리트의 강도는 시멘트의 수화반응을 통해 발현된다. 콘크리트 제작을 위한 배합 시에는 시멘트와 물 외에도 굵은 골재, 잔골재, 혼화재 등 다양한 재료가 함께 섞인 불균일 혼합물이기 때문에 강도 예측의 불확실성이 매우 높다. 예를 들어, 고로슬래그미분말이나 플라이 애시를 함께 배합하면 포졸란 반응에 의해 조기 강도 발현은 낮아질 수 있지만, 내구성과 같은 장기적 성능을 향상시켜줄 수 있다. 또한, 적절하지 않은 골재의 입도분포는 재료분리 및 건조수축 등을 일으켜 압축강도에 부정적 영향을 미치기도 한다. 물-시멘트비는 강도와 가장 밀접한 인자로서 그 변화에 따라 ITZ(interfacial transition zone)의 미세구조 상태가 달라지며 압축강도에 영향을 줄 수 있다. 이때 ITZ에 존재하는 칼슘실리케이트 수화물(calcium silicate hydrate, C-S-H)의 미세구조를 정확히 알지 못하는 것도 강도 예측의 불확실성의 원인이 된다. 이와 같이 콘크리트의 역학적 특성은 여러 배합 인자들의 복합적인 영향에 의해 결정된다.

이에 국내 콘크리트 표준시방서^{(MOLIT 2022)}에서는 세부적인 배합설계 절차를 제시하고 있지만 동일한 목표 압축강도라도 수많은 배합비로 결정될 수 있으며 레미콘 업체마다 상이하게 적용되고 있다. 배합표는 레미콘 납품서에 기재되어 현장에 제공되고 있지만, 해당 정보만으로 다양한 배합 인자들의 영향을 고려하여 압축강도를 예측하는 작업은 쉽지 않다.

국내･외 지침에서는 30번 이상의 시험에 의해 도출된 압축강도와 물-시멘트비의 관계식 (1)을 사용하는 것을 원칙으로 하며, Table 1과 같이 물-시멘트비를 이용한 압축강도 추정식을 제시하고 있지만, 경험적 실험 데이터 활용 및 단순 회귀분석이라는 점에서 신뢰성에 한계가 있다. 더욱이 레미콘 제품의 호칭 강도와 콘크리트 구조 설계에 적용하는 설계기준강도가 상이한 개념이지만 혼동되어 사용되기 때문에 타설 현장에서 실제 압축강도를 정확히 판단할 필요가 있다. 식 (1)에서 A와 B는 28일 재령 압축강도와 물-시멘트비를 토대로 한 선형 회귀식의 계수이다.

Table 1 Compression strength estimation equation according to the W/C ratio

Type	Strength estimation equation	Source
Ordinary Portland cement without admixture	$W/C=\dfrac{215}{f_{28}+210}$ $W/C=\dfrac{61}{\dfrac{f_{28}}{k}+0.34}$	Korea Concrete Standard Specification ^{(KCI 1999)}
Concrete without air entraining agent	$f_{28}=-13.9+23.0C/W$	US ACI 211.1 ^{(ACI 1993)}
	$f_{28}=-7.6+19.0C/W$
	$f_{28}=2.2+14.4C/W$
AE concrete with more than 4 % air volume	$f_{28}=-7.4+16.2C/W$
AE concrete with more than 4 % air volume	$f_{28}=-1.8+13.4C/W$
Ordinary Portland cement	$W/C=\dfrac{51}{\dfrac{f_{28}}{k}+0.31}$	Japan Construction Standard Specification ^{(AIJ 2003)}
High early strength Portland cement	$W/C=\dfrac{41}{\dfrac{f_{28}}{k}+0.17}$
Moderate heat Portland cement	$W/C=\dfrac{66}{\dfrac{f_{28}}{k}+0.64}$

Note: $W/C$: water-cement ratio; $f_{28}$: compressive strength at 28 days; $k$: strength of cement; $C/W$: cement-water ratio

(1)

$f_{28}={A}+{B}(C/W)$

4차 산업혁명의 도래로 건설 분야에서 인공지능과 기계학습을 활용한 스마트 건설 기술이 도입되고 있으며 구조 및 재료와 관련하여 경험식에 의존하던 분야에서도 활용성이 높아지고 있다^{(Lee et al. 2018;} ^{Park et al. 2021)}. 본 연구에서는 구조 설계에서 가장 기본적인 재료 물성치이며 빅데이터를 구축하기 용이한 콘크리트의 압축강도 예측에 인공지능과 기계학습을 적용하고자 한다. 실무에서 레미콘 납품서의 기본 배합 정보를 활용하여 회귀 목적의 다양한 머신러닝 알고리즘을 종합적으로 분석하고 콘크리트 압축강도 예측에 가장 적합한 모형을 찾아 정확하게 예측하는데 목적이 있다.

2. 기존 연구 사례

콘크리트의 압축강도 산정을 위해 기존의 많은 연구자들이 배합비를 바꿔가며 반복한 실험 데이터를 토대로 회귀 분석하였다. ^{Cho et al. (2003)}은 현장콘크리트의 배합표에 의한 압축강도 추정식을 배합 인자들의 상관관계를 고려하여 다중 회귀분석으로 도출하였다. ^{Sobhani et al.(2010)}은 프리패브리케이션(pre-fabrication)을 위해 사용되는 28일 재령의 슬럼프가 없는 콘크리트의 압축강도를 회귀분석을 통해 예측하였다. ^{Chithra et al.(2016)}은 나노 실리카(nano silica)와 동 슬래그(copper slag)를 포함한 고성능 콘크리트의 압축강도를 다중 회귀분석을 사용하여 예측하였다. 그러나 콘크리트의 배합비와 압축강도 사이의 관계가 선형이 아니기 때문에 다중 선형회귀분석 등 기존의 모형은 한계가 뚜렷하다. ^{Xu et al.(2021)}은 유전 알고리즘(genetic algorithm, GA)을 이용하여 콘크리트에 가장 큰 영향을 주는 변수를 찾고 랜덤 포레스트(random forest, RF)를 사용하여 압축강도를 예측하였다. ^{Nguyen et al.(2020)}은 신경망을 이용하여 플라이 애시 기반의 지오폴리머 콘크리트의 압축강도를 예측하였다. ^{Kim et al.(2002)}은 인공신경망의 한 종류인 다층 퍼셉트론을 이용하여 콘크리트의 배합 요소와 압축강도, 슬럼프값을 추정하였다. ^{Choi et al.(2015)}는 강섬유 보강 콘크리트의 실험 결과를 이용하여 기계적 성질을 추정하기 위해 신경망을 적용하였다. ^Yeh(1998)은 신경망을 적용하여 고성능 콘크리트의 강도를 예측하였다.

이처럼 기존의 관련 선행연구들은 콘크리트 압축강도를 예측하기 위해 신경망, 랜덤 포레스트 등 하나의 기계학습 모형을 선택하여 회귀를 시도하였으나, 여러 기계학습 모형 간의 성능을 비교 및 최적의 모델을 분석한 연구는 아직 부족한 실정이다. 따라서 모델 성능을 파악하기 위해 동일 데이터로 학습한 여러 모델의 직접적인 비교가 필요하다. 각 모델의 특징을 분석하여 압축강도 예측에 대한 최적의 모델을 도출하고자 한다.

3. 배경 이론 및 데이터 분석

3.1 기계학습 알고리즘

인공지능은 컴퓨터로 하여금 사람의 지능을 모사하도록 하는 시스템을 포괄적으로 일컫는 용어이고, 그중에서도 학습에 초점이 맞추어진 것이 기계학습이다. 반복적으로 학습하면 사람도 잘 기억하게 되듯이, 컴퓨터가 빅데이터를 여러 번 반복하여 학습하게 함으로써 그 정확도를 높이는 방식이다. 정답 데이터를 알고 훈련에 활용하는 지도학습 계열의 기계학습은 회귀와 분류에 있어 탁월한 능력을 보여왔다. 변수들 사이의 내재된 패턴을 학습함으로써 기존의 방법론인 단순 회귀 모형보다 더 정확하게 예측할 수 있다는 점에 그 우수성이 있다. 본 연구에서는 콘크리트의 압축강도 예측을 위해 여러 기계학습 모형 중 회귀에 목적을 둔 Linear Regression(LR), Decision Tree(DT), Support Vector Machine (SVM), Ensemble, Gaussian Process Regression(GPR), Neural Network(NN) 모형을 사용하였다.

LR은 식 (2)와 같이 선형으로 된 식을 이용하여 데이터를 예측하는 회귀 모형을 구성한다. $x_{j}$는 각 데이터의 입력변수이고, $w_{i}$는 가중치, $h_{w}$는 출력변수를 의미한다. 구성된 선형 회귀 모형인 $h_{w}$가 실제 출력변수 값인 $y$에 얼마나 일치하는지를 확인하고 오차를 최소화하는 최적의 모형을 구성하기 위해 식 (3)과 같이 $w^{*}$를 상정할 수 있다. 가중치를 조정하여 최적의 선형 회귀를 찾는 방법으로 널리 활용되는 경사 하강법(gradient descent)은 learning rate를 $\alpha$라 할 때, 식 (4)와 같이 미분계수가 0이 되도록 하는 점을 찾는 방법으로 $w^{*}$를 구할 수 있다.

(2)

$h_{w}(x_{j})= w_{0}+\sum_{i=1}^{n}w_{i}x_{j,\: i}$

(3)

$w^{*}=\arg\underline{\dfrac{}{}}\min_{w}\sum_{j}L_{2}(y_{j},\: h_{w}(x_{j}))$

(4)

$w_{i}=w_{i}+\alpha\sum_{j}x_{j,\: i}(y_{j}-h_{w}(x_{j}))$

DT 회귀는 학습에 활용되는 데이터 세트를 기준값보다 작은 그룹과 큰 그룹으로 이진 분할을 반복하며 트리 구조를 형성하는 방식으로 동작한다. 각 노드의 leaf가 하나의 값에 대응되도록 하여, 노드 별로 이진 분할의 기준이 되는 값을 훈련 데이터 세트로부터 학습하여 회귀 모형을 구성한다.

SVM은 support vector와 margin을 이용하여 데이터의 경계를 결정하는 데에 널리 사용되는 기계학습 모형이기 때문에 margin을 최대화하면 분류 문제에 적용할 수 있고, margin을 최소화하면 회귀 문제에 적용할 수 있다. 즉, 주어진 margin 내에 최대로 많은 데이터가 존재하도록 하는 방식으로 회귀 모형을 구성한다.

Ensemble은 DT 여러 개를 결합하여 구성한 것으로, Bagging 방식과 Boosting 방식 등이 있다. 핵심적인 아이디어는 여러 개의 약한 분류기를 결합하여 강한 분류기를 구성하는 것이다. Bagging 방식은 병렬적으로 DT를 구성하여 최종적으로 분산을 줄이는 것이고, Boosting 방식은 여러 DT를 순차적으로 학습하면서 가중치를 부여하여 최종적인 회귀 모형을 구성하는 것이다.

GPR은 앞서 언급한 4가지 모형과 달리 데이터의 개수가 늘어남에 따라 parameter 개수도 변화하는 non parametric 모형으로, 다변량 정규분포를 무한 차원으로 일반화하여 확장한 것이기 때문에 좀 더 복잡한 회귀 문제에 적합하다. Gaussian process인 $f(x)$가 평균 함수 $m(x)$를 포함하고, 공분산 함수 $k(x,\: x')$를 포함할 때 행렬 $[K(X,\: X)]_{ij}$의 각 항이 $k(x_{i},\: x_{j})$라면 식 (5)와 같은 분포 식을 통해 예측값 $f*$를 알 수 있다. 모형을 훈련하는 과정에서는 kernel function으로 불리는 공분산 함수의 파라미터들을 조절하며 정확도를 향상하게 되고, 적절한 kernel function을 결정하는 것이 엔지니어의 몫이다.

(5)

$f*vert X*,\: X,\: f\sim N(K(X*,\: X)K(X,\: X)^{-1}f,\: \\ K(X*,\: X*)-K(X*,\: X)K(X,\: X)^{-1}K(X,\: X*))$

NN은 사람의 신경 세포 사이의 상호작용을 모사한 기계학습 모형으로, 크게 입력층과 은닉층, 출력층으로 구성된다. 각 층에는 노드가 여러 개 존재할 수 있으며 각 노드에서 가중치와 편향 값의 조정을 통해 출력을 변화할 수 있다. 은닉층의 개수, 각 은닉층의 노드 개수, learning rate 등은 엔지니어에 의해 결정되는 hyper parameter이다. 입력값과 출력값 사이의 내재된 패턴을 찾기 위해 가중치를 계속해서 업데이트하면서 예측값과 실제 값의 오차가 특정 값 이하로 될 때까지 반복하며 학습을 수행한다. 단일 은닉층 신경망의 노드 개수를 무한대로 늘리면 중심 극한 정리에 따라 NN이 Gaussian process로 수렴하는 것은 널리 알려져 있다.

3.2 데이터베이스 분석

기계학습 모형의 훈련과 검증을 위해 사용된 데이터로는 17개의 서로 다른 논문에서 발표한 콘크리트 압축강도 실험 데이터를 수집한 University of California, Irvine(UCI)의 Machine Learning Repository의 오픈 데이터베이스^{(Yeh 1998)}를 활용하였다. 공시체의 크기는 모두 높이 15 cm의 원통형으로 변환되어 통일되었으며, 골재 크기가 20 mm 이상인 것과 특수 환경에서 양생된 것은 제거되었다^{(Yeh 1999)}.

또한 실제 압축강도와의 정확도 검증을 위해 국내 레미콘 회사 3곳의 배합비 4종으로 직접 실험한 38개 압축강도 시험 데이터를 활용하였다. 시험은 KS F 2405^{(KATS 2017)}에 준하여 𝜙100×200 mm 원주형 공시체로 실시하였다(Fig. 1).

Fig. 1 Compressive strength test of cylinder

데이터에는 시멘트, 고로슬래그미분말, 플라이 애시, 물, 고성능 감수제, 굵은 골재, 잔골재, 재령, 콘크리트 압축강도로 총 9개의 변수가 있고, 총 1,068개의 콘크리트 배합비와 재령정보, 압축강도 데이터로 구성되어 있다. 압축강도를 출력변수로 하고, 나머지 8개의 변수를 입력변수로 설정하였다.

기계학습 모형에 적용하기에 앞서 모든 데이터는 min-max scaler 방식으로 식 (6)과 같이 정규화하는 전처리 과정을 거쳤다. 이러한 스케일링 과정을 거치는 이유는 데이터의 값이 너무 크거나 작은 경우 기계학습 모형이 학습하는 과정에서 값이 0으로 수렴하거나 무한으로 발산하게 되므로 제대로 된 학습이 불가하기 때문이다. 따라서 사용된 min-max scaler는 모든 변수들의 값을 0과 1 사이에 위치하게 함으로써 학습과정 중 문제가 발생하지 않도록 전처리하였다.

(6)

$x_{{no alized}}=\dfrac{x- x_{\min}}{x_{\max}- x_{\min}}$

Table 2에서는 변수별 최솟값, 최댓값, 평균, 단위를 나타내었다. 데이터 세트의 분할비는 훈련 집합(training set)을 전체의 67 %인 712개, 검증 집합(testing set)을 나머지 33 %인 356개로 설정하였다. 데이터의 분할은 무작위하게 이루어졌으며, 각 기계학습 모형의 동등 비교를 위해 같은 훈련 집합과 검증 집합으로 성능 비교를 수행하였다.

Table 2 Ranges of variables of data sets

Variable	Minimum	Maximum	Average	Unit
Cement	102	540	281.17	kg/m3
Ground blast-furnace slag	0	359.4	73.90	kg/m3
Fly ash	0	200.1	54.19	kg/m3
Water	121.8	247	181.57	kg/m3
Superplasticizer	0	32.2	6.20	kg/m3
Coarse aggregate	801	1145	972.92	kg/m3
Fine aggregate	594	992.6	773.58	kg/m3
Age	1	365	45.66	day
Compressive strength	2.33	82.6	35.82	MPa

각각의 입력변수와 콘크리트 압축강도 사이의 상관관계는 Fig. 2에 나타나 있다. 시멘트 양과 재령, 고성능감수제, 고로슬래그미분말은 콘크리트 압축강도와 양의 상관관계를 보이고, 물과 골재량, 플라이 애시는 콘크리트 압축강도와 음의 상관관계를 보인다. 시멘트 양, 고성능감수제, 재령, 고로슬래그미분말 순으로 압축강도 증가에 큰 영향을 끼쳤다. 반대로 물의 양이 굵은 골재와 잔골재량, 플라이 애시 양에 비해 압축강도 감소에 더 큰 영향을 끼쳤다. 시멘트와 물의 양이 압축강도에 가장 큰 영향을 주는 변수라는 점에서 기존의 경험식에 부합하는 결과이지만, 더 정확한 예측을 위해서는 물과 시멘트 외의 다른 변수들에 대한 고려가 필요하다.

Fig. 2 Heat map between variables

4. 기계학습을 이용한 콘크리트 압축강도 예측 성능 결과 및 분석

여러 모형의 성능을 평가하기 위해 도입한 지표는 일반적으로 기계학습 모형을 평가하는 데에 널리 활용되는 세 가지로 RMSE(root mean square error), Coefficient of Determination ($R^{2}$), MAE(mean absolute error)이다. 각 지표의 계산 식은 아래와 같다. RMSE와 MAE는 값이 0에 가까울수록, $R^{2}$는 값이 1에 가까울수록 모형의 성능이 우수함을 의미한다.

(7)

${R}{M}{S}{E}=\sqrt{\dfrac{\sum_{i=1}^{{N}}(y_{i}-\hat{y_{i}})^{2}}{N}}$

(8)

$R^{2}=1-\dfrac{\sum_{i}(y_{i}-\hat{y_{i}})^{2}}{\sum_{i}(y_{i}-\overline{y})^{2}}$

(9)

${MAE}=\dfrac{1}{N}\sum_{{i}=1}^{N}\left | y_{i}-\hat{y_{i}}\right |$

각 모형의 학습에서 하이퍼파라미터는 다음과 같이 설정하였다. DT는 minimum parent size와 minimum leaf size를 설정하였는데, Fine DT는 각각 10, 4, Medium DT는 각각 24, 12, Coarse DT는 각각 72, 36로 설정하였다. Minimum parent size란 branch 노드에서 관찰하는 최소의 수를 의미하며, minimum leaf size란 leaf 노드에서 관찰하는 최소의 수를 의미한다. SVM은 kernel function의 종류와 kernel scale을 하이퍼파라미터로 설정하였다. 먼저 linear SVM은 식 (10)과 같이 kernel function을 linear로 설정하였고, quadratic SVM은 식 (11)과 같이 kernel function을 polynomial로 설정하였으며, 이 때 차수는 2로 설정하였다. Cubic SVM은 차수를 3으로 설정하였다. 식 (11)에서 $q$는 차수를 의미한다. 세 개의 Gaussian SVM은 kernel function이 식 (12)와 같이 Gaussian으로서, kernel scale은 각각 0.71, 2.8, 11로 설정되었다.

(10)

$G(x_{j},\: x_{k})=x_{j}'x_{k}$

(11)

$G(x_{k},\: x_{j})=(1+x_{j}'x_{k})^{q}$

(12)

$$ G\left(x_k, x_j\right)=\exp \left(-\left\|x_j-x_k\right\|^2\right) $$

Boosted Ensemble 모형의 경우, minimum leaf size를 8로, learning rate를 0.1로, ensemble cycle 수를 30으로 설정하였다. Bagged Ensemble 모형의 경우, minimum leaf size를 8로, learning rate를 1로, ensemble learning cycle 수를 30으로 설정하였다. GPR은 kernel function의 종류를 하이퍼파라미터로 설정하였다. 각 GPR 모형의 kernel function은 Squared Exponential(식 (13)), Matern 5/2(식 (14)), Exponential(식 (15)), Rational Quadratic(식 (16))이다.

(13)

$k(x_{i},\: x_{j}vert\theta)=\sigma_{f}^{2}\exp\left[-\dfrac{1}{2}\dfrac{(x_{i}-x_{j})^{T}(x_{i}-x_{j})}{\sigma_{l}^{2}}\right]$

(14)

$k(x_{i},\: x_{j})=\sigma_{f}^{2}\left(1+\dfrac{\sqrt{5}r}{\sigma_{l}}+\dfrac{5r^{2}}{3\sigma_{l}^{2}}\right)\exp\left(-\dfrac{\sqrt{5}r}{\sigma_{l}}\right)$

(15)

$k(x_{i},\: x_{j}vert\theta)=\sigma_{f}^{2}\exp\left(-\dfrac{r}{\sigma_{l}}\right)$

(16)

$k(x_{i},\: x_{j}vert\theta)=\sigma_{f}^{2}\left(1+\dfrac{r^{2}}{2\alpha\alpha_{l}^{2}}\right)^{-\alpha}$

여기서, $\sigma_{l}$ : characteristic length scale

$\sigma_{f}$ : signal standard deviation

$\alpha$ : 양의 값의 scale mixture parameter

$r$ : 유클리드 거리, =$\sqrt{(x_{i}-x_{j})^{T}(x_{i}-x_{j})}$

NN 모형에서는 activation function으로 ReLU(rectified linear unit)를 사용하였고, 훈련 시 적용된 알고리즘은 Levenberg- Marquardt이며, 초기 $\mu$값은 0.001, 감소 인자는 0.1, 증가 인자는 10으로 설정하였다. 여기서 $\mu$의 의미는 그 값이 작아져서 0이 되면 Levenberg-Marquardt 알고리즘이 근사 헤세 행렬을 사용하는 뉴턴 방법이 되고, $\mu$의 값이 큰 값이면 스텝의 크기가 작은 경사하강법이 되도록 하는 파라미터이다. $\mu$는 성능 함수가 감소되는 스텝이 끝날 때마다 감소되고, 반대의 경우 증가한다. Narrow NN은 은닉층의 사이즈를 10, epoch 수는 15로, Medium NN은 은닉층의 사이즈를 25, epoch 수는 20으로, Wide NN은 은닉층의 사이즈를 100, epoch 수는 21로 두었다. 2개 은닉층 깊이의 Bilayered NN은 첫 번째 은닉층의 사이즈를 10, 두 번째 은닉층의 사이즈도 역시 10으로 설정하였다. epoch 수는 27이다. 마지막으로 3개 은닉층 깊이의 Trilayered NN의 경우에도 모든 은닉층의 사이즈를 10으로, epoch 수는 15로 두고 학습을 진행하였다.

Table 3에 각 모형의 성능 평가 결과를 나타내었다. 훈련 집합과 검증 집합에서 GPR 모형과 NN 모형이 다른 모형들에 비해 우수한 설명력과 낮은 오차를 보였다. GPR 모형 중에서는 Exponential kernel function을 사용한 모형이 훈련 집합에서 결정 계수 0.9771을 보였고, 오차 지표인 RMSE와 MAE도 각각 0.0315, 0.0211로 가장 우수하였다. GPR은 자체적인 학습과정으로 예측의 불확실성을 감소시키며, 예측값뿐만 아니라 그 예측값의 신뢰도를 알 수 있는 모형이다. 이를 실무에 적용할 시, 현장의 엔지니어가 예측값을 판단하는 데 있어 유리하다. GPR 모형은 알고 있는 값들로부터의 거리를 함수로 표현하는 커널을 도입하여 확률분포를 기반으로 새로운 입력에 관한 결과를 예측하는 만큼, 훈련집합의 결과에 비해 검증 집합의 결과 정확도가 다소 낮을 수밖에 없는 모형의 내재적 특성이 있으므로 과적합된 것이 아니다. 이는 결정계수 값에서 차이가 거의 없는 것을 통해 수치적으로도 확인할 수 있다. NN 모형 중에서는 hidden layer size를 25로 설정한 Medium NN 모형이 훈련 집합에서 결정 계수 0.9140을 보였고, RMSE와 MAE가 각각 0.0610, 0.0435로 나타났다. NN의 경우, hidden layer의 개수가 많아지거나 여러 겹이 된다고 해서 무조건 결과가 좋아지는 것이 아님을 확인할 수 있다. ^Yeh(1998)의 연구에서는 은닉층 깊이를 단층으로 하고, 유닛 개수를 8개로 했을 때 훈련 집합의 결정 계수 0.917, 검증 집합의 결정 계수 0.855로 보고된 바 있다. 본 연구에서 은닉층 깊이를 동일하게 하고 유닛 개수를 10개로 했을 때 훈련 집합의 결정 계수 0.902, 검증 집합의 결정 계수 0.823으로 거의 동등한 결과를 보였다. CPU 연산만을 사용했을 때 전체 데이터 세트를 대상으로 한 모든 모델의 학습시간은 1분 내외로 소요되었다.

Fig. 3은 훈련 집합과 검증 집합의 결과를 가로축을 실제 압축강도, 세로축을 예측한 압축강도로 하여 도시한 그래프이다. 각각의 대분류 모형에서 대표적인 세부 모형 한 개씩을 나타내었다. 기본적이며 단순한 회귀 모형인 LR(Fig. 3(a))의 예측이 예상대로 가장 부정확하게 나타났다. 선형적인 식으로는 입력변수와 출력변수 사이의 관계를 정확히 표현하지 못하여 전 영역에서 산발적으로 나타났다. DT(Fig. 3(b))는 데이터가 비례하는 경향성은 띠었지만 이진 분할을 반복하며 트리 구조를 형성하는 방식으로 동작하기 때문에 데이터 예측값이 단계적으로 나타났다.

SVM(Fig. 3(c))은 데이터의 경계를 결정하는 margin을 최소화하여 회귀 문제를 해결하도록 하였다. 결국 margin에 따라 LR과 유사한 방식으로 학습하며 예측 결과도 그와 유사한 분포를 보였다. Ensemble(Fig. 3(d))은 여러 DT를 순차적으로 학습하며 분류기를 결합하는 방식으로 예측력을 보완할 수 있지만, 그 한계가 존재하였다. 또한 LR, DT, SVM, Ensemble 모형은 공통적으로 저강도에서는 예측 강도를 과대평가하였고, 고강도에서는 과소평가하는 경향을 보였다.

한편, 육안으로도 GPR과 NN의 산포도가 압축강도의 전반적인 범위에서 항등 함수 직선에 밀집되어 있음이 관찰된다. 즉, 두 모델이 콘크리트 압축강도를 보다 정확하게 예측하는 것으로 나타났다. 특히, GPR이 실제 값과 예측값의 대응 관계가 높은 것을 확인하였다. 회귀 모형을 모델링 할 때, LR처럼 모형의 식 형태를 미리 정해놓고 추정할 시 변수 간 상관관계가 복잡해짐에 따라 예측력이 떨어진다. 하지만, 함수 식을 정해놓고 파라미터를 찾는 것이 아니라 데이터를 가장 잘 반영할 수 있는 함수 자체를 찾는 GPR과 NN 방식은 복합적 요소가 작용하는 콘크리트 압축강도 발현을 보다더 잘 설명할 수 있다. 기계학습을 진행하면서, GPR의 Kernel function을 최적화하기 위한 파라미터나 NN의 Hidden layer 내부에서 조정되는 Weight는 내부에서 작동하는 방식에 대한 단서가 없더라도 좋은 회귀 결과를 예측하게끔 적절하게 조정되는 것으로 확인되었다.

Fig. 3 Regression results of several machine learning models (horizontal axis: normalized actual strength, vertical axis: normalized predicted strength)

Table 3 Machine learning results

Types of machine learning model		RMSE		Coefficient of determination		MAE		Parameter setting
Types of machine learning model		Training	Testing	Training	Testing	Training	Testing	Parameter setting
Linear regression (LR)	Simple LR	0.1286	0.1325	0.6236	0.5926	0.1006	0.1035	-
	Interactions LR	0.1051	0.1085	0.7554	0.7269	0.0821	0.0858	Robust option: off
	Robust LR	0.1109	0.2119	0.8326	-0.0415	0.1060	0.1190	Robust option: on
	Stepwise LR	0.1095	0.1166	0.7296	0.6850	0.0848	0.0894	Maximum number of steps: 1000
Decision tree (DT)	Fine DT	0.0539	0.0894	0.9329	0.8147	0.0381	0.0640	Minimum leaf size: 4
	Medium DT	0.0802	0.0933	0.8515	0.7983	0.0598	0.0729	Minimum leaf size: 12
	Coarse DT	0.1072	0.1160	0.7348	0.6880	0.0828	0.0925	Minimum leaf size: 36
Support vector machine (SVM)	Linear SVM	0.1341	0.1474	0.5850	0.4964	0.0985	0.1048	Linear kernel function
	Quadratic SVM	0.0948	0.0963	0.7926	0.7847	0.0707	0.0717	Quadratic kernel function
	Cubic SVM	0.0738	0.0851	0.8745	0.8319	0.0534	0.0622	Cubic kernel function
	Fine Gaussian SVM	0.0825	0.0882	0.8430	0.8197	0.0595	0.0652	Gaussian kernel function kernel scale: 0.71
	Medium Gaussian SVM	0.1207	0.1253	0.6637	0.6362	0.0947	0.0987	Gaussian kernel function kernel scale: 2.8
	Coarse Gaussian SVM	0.1731	0.1740	0.3085	0.2976	0.1391	0.1396	Gaussian kernel function kernel scale: 11
Ensemble	Boosted trees ensemble	0.0671	0.0786	0.8963	0.8569	0.0508	0.0584	Minimum leaf size: 8 Number of learners: 30 Learning rate: 0.1
Ensemble	Bagged trees ensemble	0.0553	0.0717	0.9293	0.8807	0.0410	0.0536	Minimum leaf size: 8 Number of learners: 30
Gaussian process regression (GPR)	Squared exponential GPR	0.0544	0.0665	0.9318	0.8976	0.0406	0.0509	Squared exponential kernel function
	Matern 5/2 GPR	0.0517	0.0646	0.9383	0.9033	0.0382	0.0488	Matern 5/2 kernel function
	Exponential GPR	0.0315	0.0661	0.9771	0.8988	0.0211	0.0473	Exponential kernel function
	Rational quadratic GPR	0.0540	0.0658	0.9326	0.8997	0.0403	0.0505	Rational quadratic kernel function
Neural network (NN)	Narrow NN	0.0652	0.0874	0.9020	0.8229	0.0484	0.0663	Hidden layer size 10
	Medium NN	0.0610	0.0699	0.9140	0.8867	0.0435	0.0526	Hidden layer size 25
	Wide NN	0.0721	0.0863	0.8802	0.8274	0.0528	0.0598	Hidden layer size 100
	Bilayered NN	0.0747	0.0702	0.8714	0.8858	0.0577	0.0543	Hidden layer size [10 10]
	Trilayered NN	0.0711	0.0783	0.8833	0.8579	0.0537	0.0604	Hidden layer size [10 10 10]

5. 결 론

콘크리트 압축강도 발현은 하나의 식, 하나의 과정으로 설명하기 어렵고, 비선형성의 매우 복잡한 과정이 작용한다. 실무에서도 배합표만으로 압축강도를 예측하는 것이 어려워, 정확도가 떨어지는 28일 재령 압축강도 경험식에 의존하고 있는 실정이다. 이에 본 연구에서는 콘크리트 압축강도 예측을 위해 기계학습 인공지능 모형을 도입함으로써 모형별 예측 성능을 비교 및 분석하였다. 본 연구를 통해 얻은 유의미한 결과를 정리하면 다음과 같다.

1) 기존의 물-시멘트 비에만 의존하고, 28일 재령으로 제한하던 경험식을 탈피하여 여러 변수를 입력으로 활용하였다. 입력변수는 시멘트, 고로슬래그미분말, 플라이 애시, 물, 고성능 감수제, 굵은 골재, 잔골재, 재령으로 8개이며, 출력변수는 콘크리트 압축강도이다. 배합 인자와 압축강도의 일차원적인 상관성이 아닌, 다량의 입력변수가 포함된 비선형적인 모형으로 구현하였다.

2) 단순 회귀분석 식이 아닌 비선형적 모형을 구현하기 위해 기계학습 모형을 도입하여 예측력을 높였다. 반복적이고 복잡한 비선형 계산 과정도 간단히 수행하여 배합표의 정보만을 토대로 비교적 정확한 압축강도 예측이 가능하였다.

3) 실제 활용 빈도가 높은 여러 기계학습 모형 간의 비교를 통해 콘크리트 압축강도 예측에 가장 적합한 모형을 도출하였다. 결과적으로, 다른 회귀 모형과 달리 데이터의 개수가 늘어남에 따라 parameter 개수도 변화하는 non-parametric 모형인 GPR이 가장 우수한 성능을 보였다. 또한 입력값과 출력값 사이의 내재된 패턴을 찾기 위해 가중치를 계속해서 업데이트하는 NN 방식이 차순위로 우수한 것을 확인하였다. 배합비만으로 실제 공시체 측정 없이 적은 오차 범위 내에서 콘크리트 압축강도 예측이 가능한 기계학습 모형을 구현하였다는 점에서 의의가 있다. 또한 기존 연구와 다르게 회귀를 위한 여러 기계학습 모형의 성능을 동일 데이터에 대하여 직접 비교하였다는 차별점이 있다.

4) 양생 일수나 온습도 등 환경조건, 골재의 크기 및 강도가 모두 반영된다면 더욱 정확한 예측이 가능하겠으나, 이에 대한 데이터가 존재하지 않아 한계가 있다. 본 연구에서는 이의 영향을 최소화하기 위해 재령 정보를 입력변수에 포함하였으며, 특수 환경에서 양생된 데이터는 제외하고 분석하였다. 골재의 크기 및 강도에 대한 정보는 부재하여 향후 실험적 연구에서 추가로 고려되어야 할 것이다. 앞으로 데이터베이스의 축적을 통해 보완이 가능할 것이며, 해당 기계학습 모형을 통한 예측의 정확도는 더욱 향상될 것으로 기대된다.

감사의 글

이 논문은 서울대학교 2019년도 융･복합 연구과제 지원사업의 지원을 받아 수행된 연구입니다. 이에 감사드립니다.

References

ACI Committee 211. 이름, 1993, Standard Practice for Selecting Proportions for Normal, Heavyweight, and Mass Concrete (ACI 211.1), Farmington Hills, MI; American Concrete Institute (ACI)

AIJ. 이름, 2003, Japanese Architectural Standard Specification for Reinforced Concrete Work (JASS 5), Architectural Institute of Japan (AIJ)

Chithra S., Senthil Kumar S.R.R., Chinnaraju K., Alfin Ashmita F., 2016, A Comparative Study on the Compressive Strength Prediction Models for High Performance Concrete Containing Nano Silica and Copper Slag Using Regression Analysis and Artificial Neural Networks, Construction and Building Materials, Vol. 114, No. 1, pp. 528-535

Cho H., Yoon S., Jee N.Y., 2003, The Estimation of Compressive Strength of Ready-Mixed Concrete On the Basis of Mix Design, Journal of the Architectural Institute of Korea - Structure & Construction, Vol. 19, No. 4, pp. 105-112

Choi H.-K., Bae B.-I., Koo H.-S., 2015, Correlation between Mix Proportion and Mechanical Characteristics of Steel Fiber Reinforced Concrete, Journal of the Korea Concrete Institute, Vol. 27, No. 4, pp. 331-341

Chun S.-C., Tak S.-Y., Lee S.-H., Sho K.-H., Ha T.-H., 2014, Evaluation of Construction Loads of Slabs and Shores with Removing Shores and Placing Reshores, Journal of the Korea Concrete Institute, Vol. 26, No. 3, pp. 385-392

Hong G.-H., Park H.-G., Eum T.-S., Mihn J.-S., Kim Y.-N., 2010, Evaluation of Strength and Stiffness Gain of Concrete at Early-Ages, Journal of the Korea Concrete Institute, Vol. 22, No. 2, pp. 237-245

KATS , 2017, Standard Test Method for Compressive Strength of Concrete (KS F 2405), Seoul, Korea: Korea Agency for Technology and Standards (KATS), Korea Standard Association (KSA). 1-12. (In Korean)

Kim I.-S., Lee J.-H., Yang D.-S., Park S.-K., 2002, Prediction on Mix Proportion Factor and Strength of Concrete Using Neural Network, Journal of the Korea Concrete Institute, Vol. 14, No. 4, pp. 457-466

Lee Y.-I., Kim B., Cho S., 2018, Image-Based Spalling Detection of Concrete Structures Using Deep Learning, Journal of the Korea Concrete Institute, Vol. 30, No. 1, pp. 91-99

MOLIT. 이름, 2022, Korean Construction Specification: General Concrete (KCS 14 20 10), Sejong, Korea: Ministry of Land, Infrastructure and Transport (MOLIT). (In Korean)

Nguyen K. T., Nguyen Q. D., Le T. A., Shin J., Lee K., 2020, Analyzing the Compressive Strength of Green Fly Ash Based Geopolymer Concrete Using Experiment and Machine Learning Approaches, Construction and Building Materials 2020, Vol. 247

Park J., Kim D., Shim S., Hong J., Choi H., Jin S.-S., 2021, Water-Cement Ratio Estimation of Cementitious Materials Using Electrochemical Impedance Spectroscopy and Machine Learning, Journal of the Korea Concrete Institute, Vol. 33, No. 4, pp. 353-361

Sobhani J., Najimi M., Pourkhorshidi A. R., Parhizkar T., 2010, Prediction of the Compressive Strength of No-Slump Concrete: A Comparative Study of Regression, Neural Network and ANFIS Model, Construction and Building Materials, Vol. 24, No. 5, pp. 709-718

Xu J., Zhou L., He G., Ji X., Dai Y., Dang Y., 2021, Comprehensive Machine Learning-Based Model for Predicting Compressive Strength of Ready-Mix Concrete, Materials, Vol. 14, No. 5, pp. 1068

Yeh I.-C., 1998, Modeling of Strength of High Performance Concrete Using Artificial Neural Networks, Cement and Concrete Research, Vol. 28, No. 12, pp. 1797-1808

Yeh I.-C., 1999, Design of High Performance Concrete Mixture Using Neural Networks, Journal of Computing in Civil Engineering ASCE, Vol. 13, No. 1, pp. 36-42

Article Information (continued)

[

Research article

]

키워드 :

키워드

Keyword :

기계학습

Keyword :

압축강도

Keyword :

배합설계

Keyword :

신경망

Keyword :

가우시안 프로세스 회귀모형

Key words :

Key words

Keyword :

machine learning

Keyword :

compressive strength

Keyword :

mix design

Keyword :

neural networks

Keyword :

Gaussian process regression

This display is generated from NISO JATS XML with jats-style.xsl. The XSLT engine is Saxonica.

JKCIJournal ofthe Korea Concrete Institute

Journal of the Korea Concrete Institute

ISO Journal TitleJ Korea Concr Inst.

Journal Search

Journal XML

Journal Information

Comparison of Performance for Predicting Compressive Strength of Concrete Using Machine Learning

Abstract

Abstract

키워드

Key words

1. 서 론

Table 1 Compression strength estimation equation according to the W/C ratio

(1)

2. 기존 연구 사례

3. 배경 이론 및 데이터 분석

3.1 기계학습 알고리즘

(2)

(3)

(4)

(5)

3.2 데이터베이스 분석

Fig. 1 Compressive strength test of cylinder

(6)

Table 2 Ranges of variables of data sets

Fig. 2 Heat map between variables

4. 기계학습을 이용한 콘크리트 압축강도 예측 성능 결과 및 분석

(7)

(8)

(9)

(10)

(11)

(12)

(13)

(14)

(15)

(16)

Fig. 3 Regression results of several machine learning models (horizontal axis: normalized actual strength, vertical axis: normalized predicted strength)

Table 3 Machine learning results

5. 결 론

감사의 글

References

Article Information (continued)

키워드

Key words

JKCIJournal of
the Korea Concrete Institute