Journal of the Korean Society for Marine Environment and Energy
[ Original Article ]
Journal of the Korean Society for Marine Environment & Energy - Vol. 29, No. 1, pp.1-20
ISSN: 2288-0089 (Print) 2288-081X (Online)
Print publication date 25 Feb 2026
Received 01 Sep 2025 Revised 15 Nov 2025 Accepted 26 Jan 2026
DOI: https://doi.org/10.7846/JKOSMEE.2026.29.1.1

공간적 상관을 이용한 연안 퇴적환경의 지리적 구분과 총유기탄소(TOC)를 포함한 유기물의 분포 특성

김남규1 ; 최태섭2,
1㈜엔이비 환경안전연구소 연구원
2㈜엔이비 환경안전연구소 책임연구원
Spatial Classification of Coastal Depositionary Environments Using Spatial Correlation, and the Distribution Characteristics of Organic Matter Including Total Organic Carbon (TOC)
Nam Kyu Kim1 ; Tae Seob Choi2,
1Researcher, Institute of Environment Protection, NEB Co., Seoul 08504, Korea
2Principal Researcher, Institute of Environment Protection, NEB Co., Seoul 08504, Korea

Correspondence to: tschoi67@gmail.com

초록

연안 해역의 퇴적환경은 조석, 파랑, 지형적 특성에 의해 복잡한 양상을 보이는 것이 일반적이다. 복잡한 양상의 퇴적환경은 특성지표인 강열감량(IL), 화학적산소요구량(COD), 산휘발성황화물(AVS), 총유기탄소(TOC) 등의 분포와 일치하지 않아 지리적 구분이 매우 어렵다. 퇴적환경의 지리적 구분을 위해 해양환경에 대한 국가 모니터링 프로그램을 통해 수집된 표층퇴적물 측정자료를 활용하여 기계학습 기반 클러스터링과 공간상관 분석을 적용하여 연안의 퇴적환경을 군집화하여 구분하였다. 입력변수는 위치정보(위경도)와 니질함량(%)이었으며, 가우시안혼합모델(GMM) 클러스터링을 통해 국내 연안을 4개의 퇴적환경(클러스터 1: zS, 클러스터 2~4: sZ)으로 구분하였다. 공간상관 분석을 위해 세미베리오그램을 적용한 결과, 각 클러스터는 고유한 공간상관성 구조를 보였으며, 특히 클러스터 4는 높은 Nugget/Sill 비율(0.89)로 파랑 우세 환경의 지속적인 교란 특성을 갖는 것으로 나타났다. 유기물 지표(IL, COD, AVS, TOC, TN)의 분포 특성을 클러스터별로 분석한 결과, 통계적으로 유의한 차이로 구분되었다(***p < 0.001). TOC 함량은 중앙값(median)을 기준으로 클러스터 1(0.4%), 클러스터 2(0.7%), 클러스터 4(1.2%), 클러스터3(1.3%) 순으로 증가하였으며, 이는 입도 특성과 뚜렷한 상관을 갖기 때문이다. TOC와 TN(총질소)을 이용한 C/N 비를 이용한 유기물 기원 추정에서는 클러스터 1과 3은 해양기원 유기물이 우세한 반면(C/N 비 5~9 범위가 각각 50.3과 42.7%), 반면 클러스터 2와 4는 육상기원 유기물 영향이 상대적으로 큰 것으로 나타났다(C/N 비 15이상 범위가 각각 30.1과 29.9%). 스피어만(Spearman) 상관을 이용한 분석에서 TOC는 세립질 퇴적물과 뚜렷한 상관(니질함량, r = 0.60)을 보였으나, 저서생태계 다양성과 클러스터별 상관은 상반된 결과를 보여 유기물과 저서생태계 간의 비선형적 관계를 확인하였다. 본 연구의 결과는 연안 퇴적환경 특성을 고려한 적절한 구분이 각 해역에 단일한 환경기준을 적용하는 현행 연안퇴적물 관리의 효율성을 개선하는데 활용될 수 있을 것이다. 또한, 다량의 자료를 기계학습 기반의 객관적 분석을 통해 연안 퇴적환경의 특성을 반영한 적절한 구분을 시도하여 자연적 배경 수준을 고려한 차별화된 해양환경 관리 정책 수립의 과학적 근거로 활용될 수 있을 것으로 기대한다.

Abstract

The depositional environment of coastal waters typically exhibits complex characteristics driven by tidal currents, waves, and topographical features. This complex depositional environment often doesn't align with the distribution of characteristic indicators such as loss on ignition (IL), chemical oxygen demand (COD), acid volatile sulfide (AVS), and total organic carbon (TOC), making geographic distinctions extremely difficult. Therefore, the surface sediment data collected through the national marine environmental monitoring program was applied to machine learning-based clustering and spatial correlation analysis to cluster and distinguish coastal depositional environments. The coordinates information (latitude and longitude) and mud content (%) were set as input variables and Gaussian mixture model (GMM) clustering was used to divide the coastal waters into four depositional environments (cluster 1; silty sand (zS), clusters 2~4; sandy silt (sZ)). Semi-variogram analysis for spatial correlation analysis revealed that each cluster exhibited a unique spatial correlation structure, with Cluster 4 showing a high Nugget/Sill ratio (0.89), indicating a characteristic of continuous disturbance in a wave-dominated environment. In the analysis of environmental variables for for each classified cluster, all of indicators for organic matter (IL, COD, AVS, TOC, TN) showed statistically significant differences (***p < 0.001). The increase in total organic carbon (TOC) content in the order of Cluster 1 (0.4%), Cluster 2 (0.7%), Cluster 4 (1.2%), and Cluster 3 (1.3%) based on the median value, is due to a clear correlation with grain size characteristics. In estimating the origin of organic matter using the C/N ratio based on TOC and TN, Clusters 1 and 3 were predominantly derived from marine organic matter (C/N ratio range of 5~9 at 50.3% and 42.7%, respectively), while Clusters 2 and 4 appeared more largely influenced by terrestrial organic matter (C/N ratios above 15 accounted for 30.1 and 29.9%, respectively). While Spearman's correlation analysis revealed a clear correlation between TOC and fine-grained sediment (with silt content, r = 0.60), the correlation between benthic ecosystem diversity and cluster showed conflicting results, confirming the nonlinear relationship between organic matter and the benthic ecosystem. The results of this study can be utilized to improve the efficiency of current coastal sediment management, which applies to a single environmental standard to whole coastal depositional environment without considering the characteristics of those. This study attempts to establish a proper classification which reflects the characteristics of coastal depositional environments using machine learning based objective analysis on a large data set. It is expected for the results to provide scientific evidence for the development of differentiated marine environmental management policies that consider natural background levels.

Keywords:

Surface sediment, Gaussian mixture model(GMM), Clustering, Semi-variogram, Total organic carbon (TOC)

키워드:

표층퇴적물, 가우시안혼합모델, 클러스터링, 세미베리오그램, 총유기탄소

1. 서 론

연안 퇴적환경은 조석, 파랑과 같은 해양 동력학적 요인과 하천을 통한 육상기원 물질의 유입, 그리고 복잡한 해안선에 의한 지형 특성이 상호작용하여 형성되는 매우 역동적이고 복잡한 시스템이다. 특히 계절풍의 영향을 받는 우리나라 연안에서는 동일한 만(bay) 내에서도 해안선의 방향과 위치에 따라 퇴적과 침식이 계절적으로 다르게 나타나는 등 물리적 힘의 차이가 뚜렷하다(Ryu[2003]). 이러한 상호작용은 퇴적물의 입도 분포, 유기물함량, 산화-환원 상태 등에서 뚜렷한 공간적 이질성을 야기한다(Khim et al.[2023]). 우리나라 연안은 동해, 서해, 남해가 뚜렷하게 구분된 해양환경으로, 각 해역의 퇴적환경은 서로 다른 특성을 나타낸다. 연안 표층퇴적물은 해양으로 유입된 오염물질의 최종 종착지이자 저서 생태계의 서식 환경이 된다. 따라서 퇴적환경 특성에 기초한 지리적 구분은 연안 생태계의 건강성을 평가하고 생물다양성을 유지하기 위한 효과적인 정책 수립에 있어서 기초가 될 것이다.

국내 연안 표층 퇴적환경에 대한 지리적 비교는 해역특성의 차이 때문에 직접적인 비교가 쉽지 않으며, 퇴적환경의 차이에 따른 오염물질의 축적 양상에서도 차이가 나타난다. 따라서 퇴적환경에 대한 측정결과의 비교, 상관, 추세, 장기 변동 양상 등에 대해서 분석의 어려움이 존재한다. 해역의 퇴적특성에 기초한 직접적인 비교가 쉽지 않고 통계적으로 유의한 조건에 대한 판단이 오류를 발생할 수 있다. 표층퇴적물의 퇴적환경 특성에 따른 구분은 해양환경의 장기 변동을 추적하는데 있어서 매우 중요하다. 특히 퇴적상은 급격한 퇴적환경의 변화가 발생하지 않는 이상 단기간에 특성의 변화하지 않는다는 특징을 갖기 때문이다.

현행 국내 해양환경 관리 체계는 주로 해수의 물리·화학적 특성에 기반한 해역별 수질등급기준(Water Quality Index, WQI)을 적용하고 있다(Choi et al.[2015]). 해역별 수질등급기준은 우리나라 해양 환경특성에 적합한 종합적인 해역수질평가 기준 설정을 위해 해역을 해류, 조석, 조위차, 탁도, 수심 등과 같은 환경특성을 바탕으로 5개의 생태구(서해중부, 서남해역, 제주, 대한해협, 동해)로 구분하고 있다(Park et al.[2019]). 부영양화의 원인 항목인 용존무기질소(DIN), 용존무기인(DIP)과 일차반응항목(클로로필(Chl-a), 투명도(Secchi Depth))과 이차반응항목(저층 용존산소포화도(DO)에 해당하는 항목들을 평가항목으로 하여 계산된 수질등급기준을 생태구별로 적용하고 있다. 우리나라 전 해역을 5개의 생태구로 구분하는 것은, 해수 순환과 같은 거시적 현상에 초점을 맞춘 것으로 퇴적물 관점에서 연안환경이 지닌 미시적이고 복잡한 이질성을 반영하기에는 한계가 있다. 퇴적학적 특성이 전혀 다른 환경임에도 불구하고 동일한 생태구로 묶여 관리됨에 따라, 각 해역의 고유한 환경특성을 고려한 정밀한 진단과 관리방안 수립이 어려운 실정이다.

더욱이, 표층퇴적물 내 유기물 함량만을 이용하여 퇴적환경의 오염여부를 판단하고 관리하는 방식은 과학적 타당성에 대한 의문을 갖게 한다. 연안 퇴적환경은 물리적 에너지 수준에 따라 유기물을 수용하고 보존하는 자연적 배경 수준(natural background level)이 본질적으로 다르다(Middelburg and Levin[2009]; Jessen et al.[2017]; Walker et al.[2022]). 예를 들어, 강한 조류와 파랑의 영향을 받는 조립질 퇴적환경은 자연적으로 유기물 함량이 낮은 반면, 에너지가 낮은 반폐쇄성 만의 세립질 퇴적환경은 유기물 축적이 용이하다. 물리적 해양환경이 다른 해역에 획일적인 기준을 적용할 경우, 자연적으로 유기물이 풍부한 환경을 오염된 것으로 판단하거나, 인위적 오염에 취약한 환경을 과소평가하는 등의 왜곡이 발생할 수 있다.

이러한 한계를 극복하기 위해, 해양환경측정망 등 국가 모니터링 프로그램을 통해 과거 수십년동안 축적된 연안 표층퇴적물에 대한 빅데이터를 활용하여 자료 속에 내재된 객관적인 패턴을 발견하는 기계학습(Machine Learning)을 활용한 정밀한 분석 및 해석이 필요한 것으로 판단된다. 기계학습은 인간의 주관적 판단이나 기존의 해역 경계를 배제하고, 데이터 자체의 통계적 유사성에 기반하여 복잡한 환경 시스템의 공간적 이질성을 명확하게 군집화할 수 있다(Kim et al.[2019]). 이를 통해 기존의 정성적 구분 방식보다 훨씬 더 세밀하고 과학적 근거에 기반한 분류 체계를 수립할 수 있다.

기계학습을 통해 도출된 클러스터가 단순한 통계기반의 그룹화를 넘어 실제 지리적 구분의 의미를 갖는 환경 단위인지 검증하는 과정 또한 중요하다. 이를 위해 공간자기상관성(spatial autocorrelation) 분석, 즉 지구 통계학적(geostatistical) 분석이 요구된다. 지구통계학의 핵심 도구인 세미베리오그램(semi-variogram)은 두 지점 간의 거리에 따른 측정값 차이의 변동성을 정량화하여, 자료의 공간적 구조를 명시적으로 보여준다(Goff et al.[2008]). 세미베리오그램 분석을 통해 각 클러스터의 고유한 공간 구조를 나타내는 주요 매개변수인 Range(공간적 자기상관이 유지되는 거리), Nugget(측정 오차 및 미시적 변동성), 그리고 Sill(전체 변동성)을 추정할 수 있다. 이는 클러스터링 결과가 물리적으로 타당하고 예측 가능한 공간 구조를 가지는지 객관적으로 판단하며(Park and Jang[2014]; Gaida et al.[2019]), 각 환경 단위의 동역학적 특성을 해석하는 데 근거를 제공한다.

따라서, 본 연구에서는 연안 표층퇴적물에 대한 관측자료를 기반으로 객관적 방법론을 통해 퇴적환경 특성이 반영된 지리적 구분을 시도하였다. 이는 해역별 특성 차이로 인한 직접 비교의 어려움, 현행 수질등급기준(WQI) 생태구의 퇴적학적 한계, 그리고 획일적 유기물 기준 적용의 문제점을 극복하고 각 해역의 고유한 환경적 특성을 고려한 정밀한 진단과 관리방안을 마련하기 위함이다. 첫째, 국가 해양환경 모니터링 자료를 활용하여 기계학습 기반의 클러스터링을 통해 연안 퇴적환경을 군집화하여 구분하고자 하였다. 둘째, 구분된 퇴적환경에 대해 공간상관성 분석을 통해 지리적 구분 결과의 지구통계학적 타당성과 공간적 고유성을 검증하고자 하였다. 셋째, 기계학습을 통해 구분한 클러스터별(지리적 구분) 환경변수 분포 특성을 비교하여 구분된 개별 퇴적환경의 지화학적 특성 차이를 확인하고자 하였다. 최종적으로는 국내 연안 퇴적환경의 특성을 바탕으로 기계학습 기반의 클러스터링을 통해 새로운 지리적 구분 체계 및 특성화를 제시함으로써, 해양환경의 보전 및 관리 정책의 과학적 기반강화와 실효성을 높이는 데 기여하고자 하였다.


2. 재료 및 방법

2.1 표층퇴적물 측정자료의 수집

국내 연안 표층퇴적물에 대한 관측자료는 국가 모니터링 프로그램인 해양수산부의 ‘해양환경측정망(1997-2024)’, ‘국가해양생태계 종합조사(2015-2021)’, ‘해양오염퇴적물 정화사업(2009-2022)’, 및 ‘어장환경모니터링 퇴적물 조사(2010-2022)’에서 수집하였다(Fig. 1). 국가 모니터링 프로그램에서 연안 표층퇴적물에 대해 측정한 자료는 정도관리를 통해 관리되고 있으며, ‘해양환경공정시험기준(National Institute of Fisheries Science[2023])’과 ‘국가해양생태계 종합조사 지침서(Ministry of Oceans and Fisheries[2022])’ 등에 따라 수행되었으므로 높은 신뢰도와 일관성을 확보하였을 것으로 판단하였다. 수집된 자료는 표층퇴적물의 물리적 특성인 입도 자료로서 니질함량(Mud, %)와 평균입도(GS, Φ) 등이다. 또한, 화학적 특성에 해당하는 총유기탄소(TOC, %), 총질소(TN, %), 강열감량(IL, %), 화학적산소요구량(COD, mg/g·dry), 산휘발성황화물(AVS, mg/g·dry), 함수율(%) 등을 수집하였다. 생태계 관련 항목으로는 출현종수, 개체밀도(개체수/m2), 생체량(습중량, g/m2), 그리고 종풍부도지수(d), 수도(abundance)와 생물량(biomass)에 대한 종다양도지수(H'), 건강도지수(ISEP) 등의 군집지수를 수집하였다. 수집된 자료의 수는 해양환경측정망에서 3,954개, 국가해양생태계종합조사에서 1,716개, 해양오염퇴적물 정화사업에서 873개, 어장환경모니터링에서 4,996개로 총 11,539개였다. 수집된 자료의 공간적 분포는 우리나라 전 연안 해역(서해, 남해, 동해)을 포괄하고 있으며, 하천 영향 및 반폐쇄성 해역, 개방성 해역, 특별관리해역 등 다양한 특성을 가진 해역을 포함하고 있다(Fig. 1).

Fig. 1.

The map portrays the locationofeach data point gathered from National Marine Environment Monitoring Program (1997~2024), operated by the Ministry of Oceans and Fisheries. Colors ofcircles represent different monitoring programs: National Marine Ecosystem Survey (white, n=1,716), Marine Environment Monitoring Network(black, n=3,954), Fishery Environment Monitoring (blue, n=4,996), Contaminated Sediment Remediation Program (red, n=873). Red dashed line outlines the established ecological regions, based on Marine Environmental Quality Standard for water quality.

2.1.1 표층퇴적물 특성에 따른 분류

표층퇴적물의 분류는 Folk[1968]의 삼각도표를 기반으로 하였으며(Fig. 4), 자갈(gravel, >2 mm), 모래(sand, 2~0.063 mm), 니질(mud, <0.063 mm)의 상대적 비율에 따라 퇴적물을 체계적으로 구분하였다. 니질은 실트(silt, 0.063~0.004 mm)와 점토(clay, <0.004 mm)로 세분되며, 각 퇴적상은 주 구성 성분을 대문자(S=sand, Z=silt, C=clay)로, 부 구성 성분을 소문자(s=sandy, z=silty, c=clayey)로 표시한다. 클러스터링(clustering)과 크리깅(kriging)을 통해 분할된 각 그룹의 퇴적상 특성을 반영하여 퇴적환경의 물리적 특성을 정량화하였으며, 각 클러스터별 샘플 수, 입도 조성비 및 퇴적상 분류 결과는 표 1에 요약하여 제시하였다.

2.2 클러스터링(Clustering)

해양환경 해역별 수질등급기준의 수질평가 지수값 WQI(Water Quality Index) 기반 생태구 구분의 한계를 극복하고, 해양환경의 공간적 상관성과 표층 퇴적상 특성을 보다 효과적으로 반영한 구역화를 위해 기계학습 기반의 클러스터링 기법을 적용하였다. 클러스터링을 통해 유사한 퇴적환경 특성을 가진 해역들을 그룹화함으로써, 보다 물리화학적으로 의미 있고 통계적으로 타당한 연안 퇴적환경 구분을 도출하고자 하였다.

클러스터링은 많은 수의 자료를 유사한 특징을 가진 그룹으로 묶는 기계학습의 일종으로 그룹별 특성을 파악하는 데 유용하게 사용되는 기법이다. 일반적으로 클러스터링은 개별 자료의 내재적 특성에 따라 그룹화하는 비지도 학습 방법이며, 레이블이 없는 자료에서도 유의미한 경향을 찾아낼 수 있다는 장점이 있다. 통계자료 해석에서 일반적으로 잘 알려진 클러스터링 알고리즘 중 K-Means 클러스터링, DBSCAN(Density-Based Spatial Clustering of Applications with Noise), 가우시안혼합모델(Gaussian Mixture Model, GMM)을 사용하였다.

2.2.1 클러스터링을 위한 입력 변수 선택

수집된 많은 자료를 몇 개의 그룹으로 클러스터링하기 위한 입력 변수는 관측 지점에 대한 위치정보(위경도 정보)와 퇴적상의 주요 지표인 니질함량(Mud, %)을 이용하였다. 위치정보는 공간적 연속성을 고려한 군집화를 가능하게 하며, 니질함량은 퇴적환경의 물리적 특성을 대표하는 핵심 지표로서 연안 퇴적환경에서 유기물 분포와 밀접한 관련이 있다(Lee et al.[2021], Lee et al.[2019], Diesing et al.[2021]). 니질함량(Mud, %)은 세립질 퇴적물(점토 + 실트)의 구성 비율로 정의되며, 퇴적환경에서 유기물의 흡착, 보존, 분해 과정에 직접적인 영향을 미치는 중요한 물리적 인자이다. 세립질 퇴적물은 넓은 비표면적으로 인해 유기물질의 흡착능력이 높고, 상대적으로 낮은 투수성으로 인해 산소 공급이 제한되어 유기물의 분해를 억제하는 특성을 가진다(Lee et al.[2019]; Park et al.[2020]). 따라서 니질함량 항목을 클러스터링 입력변수로 선택함으로써 퇴적환경의 유사성을 반영한 그룹화가 가능할 것으로 기대하였다.

2.2.2 클러스터링 알고리즘 비교

최적의 클러스터링 방법을 선정하기 위해 K-means, DBSCAN, 가우시안혼합모델(GMM) 세 가지 대표적인 클러스터링 알고리즘을 이용하여 분석하였고, 그 결과를 비교하였다. 클러스터링 방법은 각 알고리즘의 특성과 연안 퇴적환경 자료에 대한 적합성을 고려하여 선택하였다.

K-means 클러스터링은 각각의 자료를 가장 가까운 중심점(centroid)에 할당하는 분할 기반 알고리즘으로, 계산 효율성이 높고 구현이 간단하다는 장점이 있다. 그러나 구형(spherical) 클러스터 형태만 잘 식별하는 한계가 있으며, 클러스터 수를 사전에 지정해야 하는 제약이 있다(Ahmed et al.[2020]).

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 밀도 기반 클러스터링 알고리즘으로, 불규칙한 형태의 클러스터를 찾는 데 유용하며, 노이즈 자료를 효과적으로 처리할 수 있다(Bushra and Yi[2021]). 이 알고리즘은 자료들이 밀집된 지역을 클러스터로 식별하며, 자료들이 희박하거나 없는 지역을 경계로 하여 서로 다른 클러스터로 구분한다. 그러나 밀도 파라미터(eps, min_samples) 설정에 민감하며, eps(epsilon) 파라미터는 이웃한 자료들 간의 최대 거리를, min_samples 파라미터는 하나의 클러스터를 형성하기 위한 요구되는 최소 자료의 개수를 정의하는데, 이러한 파라미터들의 부적절한 사용은 클러스터의 과분할(over-segmentation)이나 과병합(over-merging)을 야기할 수 있다. 특히, 연안 퇴적환경 자료와 같이 공간적으로 밀도가 불균등하고 다중 스케일 특성을 가진 경우, 전역적으로 설정된 단일 eps 파라미터값으로는 모든 영역의 클러스터 구조를 적절히 포착하기 어려워 성능이 제한적일 수 있다(Ram et al.[2010]).

가우시안혼합모델(GMM) 알고리즘은 확률 분포 기반의 클러스터링 기법으로, 각각의 자료가 여러 클러스터에 속할 확률을 제공한다. 이는 연안 퇴적환경에서 흔히 관찰되는 점진적 환경 변화와 경계 지역의 자연스러운 전이를 표현하는 데 적합한 것으로 알려져 있다(Ye and Zhou[2025]). 또한 타원형 클러스터도 잘 식별할 수 있어 연안 환경의 복잡한 공간 구조를 효과적으로 모델링할 수 있을 것으로 기대하였다(Kim and Kim[2008]).

2.2.3 가우시안 혼합 모델(GMM)의 최적 클러스터 수의 결정

가우시안혼합모델(GMM)의 최적 클러스터 수를 결정하기 위해 실루엣 점수(Silhouette Score), AIC(Akaike Information Criterion), BIC(Bayesian Information Criterion) 3가지 정보기준을 이용하여 평가하였다(Fig. 3). 3가지 정보기준은 모델의 복잡성과 자료에 대한 적합도를 동시에 고려하여 최적의 모델을 선택하기 위한 기준으로 활용하였다.

(1) 실루엣 점수(Silhouette Score)

클러스터 내 개별 자료의 응집도(cohesion)와 클러스터 간 자료의 분리도(separation)를 동시에 평가하는 정보기준으로, 다음과 같이 정의한다.

s(i)=b(i)-a(i)max(a(i),b(i))(1) 

여기서 a(i)는 점(자료) i와 같은 클러스터 내 다른 점(자료)들과의 평균 거리, b(i)는 점 i와 가장 가까운 다른 클러스터 내 점들과의 평균 거리이다. 실루엣 점수는 -1에서 1 사이의 값을 가지며, 값이 클수록 클러스터링 결과가 그룹별 속성을 잘 반영하고 있다는 것을 의미한다.

(2) AIC(Akaike Information Criterion)

통계 모형에서 매개변수를 추가하면 최대우도 추정값이 증가하여 모형의 적합도가 개선되는 것처럼 보이지만, 이는 훈련 데이터에만 과도하게 최적화되어 새로운 데이터에 대한 일반화 성능이 저하되는 과적합(overfitting) 현상을 야기할 수 있다. AIC는 이러한 문제를 해결하기 위해, 모형의 적합도(최대우도)와 복잡도(매개변수 개수)를 동시에 고려하는 정보기준이다. 즉, 최대우도값에 매개변수 개수에 비례하는 벌점(penalty)을 부과하여 모형의 복잡도를 제어하며, 다음과 같이 정의한다.

AIC=-2ln(L)+2k(2) 

(3) BIC(Bayesian Information Criterion)

BIC는 AIC와 유사하게 모델 복잡성에 벌점을 부과하지만, 자료의 수(n)를 고려하여 더 엄격한 벌점을 적용하는 베이지안 정보 기준이다. 특히 표본 크기가 증가할수록, BIC는 AIC보다 더 엄격한 벌점을 부과하여 보다 간결한 모형을 선호하는 특성을 보인다. 정의는 다음과 같다.

BIC=-2ln(L)+Kln(n)(3) 

여기서 L은 최대우도(최대 적합도 추정치), k는 모델 매개변수의 수, n은 자료 개수이다.

최적 클러스터 수의 결정은 클러스터 수를 2개부터 14개까지 변화시키면서 각 정보 기준을 계산하고, 엘보우 방법(elbow method)과 함께 종합적으로 분석하여 최적 클러스터 수를 결정하였다. 실루엣 점수의 최대값, BIC 곡선에서의 엘보우 포인트(기울기 급변점), 그리고 연안 환경학적 해석 가능성을 종합적으로 고려하여 결정하였다.

2.2.4 가우시안혼합모델(GMM)을 이용한 클러스터링 구현

클러스터링 분석을 위해 선정된 GMM 모델을 Python 3.12.7 (Python Software Foundation, USA) 환경에서 scikit-learn 라이브러리의 가우시안혼합 클래스를 이용하여 구현하였다. GMM은 EM(Expectation-Maximization) 알고리즘에 기반한 확률 모델로서, 초기값에 따라 서로 다른 결과에 도달할 수 있는 특성이 있다. 이러한 문제를 해결하기 위해 랜덤시드(random_state)를 42로 고정하여 재현 가능한 결과를 확보하였으며, 다중 초기화 실행(n_init=5)을 통해 안정적인 결과를 도출하고자 하였다. 나머지 매개변수는 기본값을 사용하였다.

입력 데이터 전처리를 위해 StandardScaler를 사용하여 z-score 표준화를 수행하였는데, 이는 위치정보(위경도, 도 단위)와 니질함량(백분율 단위) 간의 스케일 차이를 보정하여 클러스터링 성능을 향상시키기 위함이었다. 표준화는 다음 공식에 따라 수행되었다.

z=(x-μ)σ(4) 

여기서 x는 원본 값, μ는 평균, σ는 표준편차이다.

2.3 공간상관성 분석

국내 연안 표층퇴적물 모니터링 자료의 공간적 자기상관성을 분석하기 위해 세미베리오그램(semi-variogram)을 활용하였다. 세미베리오그램은 공간통계학에서 두 지점 간의 거리와 측정값 차이의 변동성을 정량화하는 도구로, 공간적 상관관계의 강도와 범위를 파악하는데 효과적이다(Cressie[1993]). 세미베리오그램은 측정값이 거리에 따라 변화하는 양상을 정량적으로 분석하며, 공간적 자기상관을 수치화하여 서로 다른 변수나 지역 간 공간 구조를 객관적으로 비교하는 근거를 제공한다.

2.3.1 세미베리오그램(Semi-variogram)

연안퇴적환경에 대해 수집한 자료의 공간적 자기상관성을 분석하기 위해 실험적 세미베리오그램(Experimental Semi-variogram)을 Python 프로그램을 이용하여 계산하였다. 공간적 자기상관성은 거리 h를 갖는 지점쌍들의 관측값 차이의 제곱평균으로 정의된다(Lim et al.[2015]; Bae[2016]).

γ(h)=12N(h)i=1N(h)[Z(xi)-Z(xi+h)]2(5) 

여기서 Z(xi)는 지점 xi에서의 측정값, N(h)는 거리 h에 해당하는 지점쌍의 갯수이다. 이렇게 계산된 실험적 세미베리오그램의 공간 구조를 정량화하기 위해 이론적 모델을 적용한다. 이 모델들은 공간적 자기상관의 범위(Range), 분산(Sill), 측정오차 또는 미시적 변동성(Nugget)과 같은 주요 매개변수로 정의된다.

실험적 세미베리오그램에는 대표적인 세 가지 주요 이론적 모델인 구형(Spherical), 지수형(Exponential), 가우시안(Gaussian) 모델을 적용되었으며, 각 모델은 다음과 같이 정의된다(Pasini et al.[2014], Seiter et al.[2004]).

(1) 구형 모델(Spherical)

γ(h)={c0+c(3h2a-h32a3),if hac0+c, if h>a(6) 

(2) 지수 모델(Exponential)

γ(h)=c0+c(1-exp(1-3ha2))(7) 

(3) 가우시안 모델(Gaussian)

γ(h)=c0+c(1-exp(1-3h2a2))(8) 

여기서 c0은 Nugget(너겟), c는 Partial Sill(부분 문턱값), h는 Distance(두 지점 간의 거리), a는 Range(범위)를 의미한다.

2.3.2 최적 모델 선정 기준

각 클러스터에 대해서 세미베리오그램의 세 가지 모델을 적용시키고, 다음 기준을 통해 최적 모델을 선정하였다.

(1) 통계적 적합도: 평균제곱근오차(Root Mean Square Error, RMSE)를 이용하여 모델의 통계적 적합성을 평가하였다. RMSE는 모델 예측값과 실제 관측값 간의 차이를 측정하는 지표로서 다음과 같이 계산된다:

RMSE=1ni=1n(γempirical (hi)-γmodel (hi))2(9) 

(2) 물리적 타당성: 모델 매개변수가 물리적으로 타당한 값을 가지는지 다음의 기준에 따라 검증하였다.

① Range(범위): 0.01°(~1 km)에서 1.0°(~111 km) 범위 내의 값을 물리적으로 유의미한 것으로 판단하였다. 이는 연안 퇴적환경의 국지적 변동성(~1 km)부터 해양의 광역적 프로세스(~100 km)까지를 포괄하는 범위이다. Range < 0.01°인 경우 공간상관성이 거의 없는 것으로 간주하여 제외하였다.

② Nugget과 Sill: 분산을 나타내는 값이므로 반드시 양수(> 0) 조건을 만족해야 한다. Nugget = 0인 경우 측정 오차나 미시적 변동성이 전혀 없는 완벽한 공간 연속성을 의미하는데, 이는 실제 해양환경 자료에서는 비현실적이므로 제외하였다.

③ Nugget/Sill 비율: Nugget/Sill > 1.0인 경우 Nugget이 문턱값보다 크다는 것을 의미하며, 이는 공간적 상관구조가 매우 짧은 거리에서 소실되어 공간 구조를 설명하지 못하는 것으로 판단하여 제외하였다. 일반적으로 Nugget/Sill 비율이 0.25 미만이면 강한 공간적 자기상관, 0.25~0.75는 중간 수준의 공간적 자기상관, 0.75 이상이면 약한 공간적 자기상관을 의미하는 것으로 해석된다.

(3) 연안환경학적 해석 가능성: Nugget/Sill 비율을 통해 공간 변동성의 특성을 평가하였다. 이 비율이 낮을수록 공간적 자기상관이 강하며, 높을수록 국지적 변동성이 큰 것으로 해석된다.

통계적 적합도, 물리적 타당성 및 연안환경학적 해석 가능성과 같은 3가지 기준을 종합하여 물리적 타당성을 만족하는 모델 중에서 RMSE(평균 제곱근 오차)가 가장 낮은 모델을 클러스터링의 최적 모델로 선정하였다.

2.3.3 Kriging 공간보간

Kriging은 공간 통계학에서 가장 널리 사용되는 보간(interpolation) 기법 중 하나로, 관측 지점 간의 공간적 자기상관 구조를 기반으로 미관측 지점의 값을 추정하는 데 사용된다. Ordinary Kriging 기법을 적용하였으며, 이는 예측값이 편향되지 않는다는(unbiased) 조건 하에 예측오차의 분산이 최소가 되도록 가중치를 결정한다.

Ordinary Kriging에서의 예측값은 다음과 같이 정의된다.

Z^(x0)=i=1nλiZ(xi), , i=1nλi=1(10) 

여기서 λi는 각 관측점의 가중치이며, 세미베리오그램 모델을 기반으로 산출된다.

가우시안혼합모델(GMM) 클러스터링을 통해 구분된 각 클러스터별로 독립적인 kriging을 수행하였다. 이는 클러스터링을 통해 구분된 각 클러스터가 서로 다른 공간적 상관구조를 가지므로, 전체 해역에 단일 kriging을 적용하는 것보다 더 정확한 공간 예측이 가능하기 때문이다. 각 클러스터별 kriging 수행 과정은 다음과 같다.

  • 1. 자료 전처리: 각 클러스터별로 결측치를 제거하고, 중복 좌표가 있는 경우 해당 지점의 측정값들을 평균하여 하나의 대표값으로 처리하였다. 최소 3개 이상의 유효 데이터 포인트를 확보하여 kriging 수행을 위한 기본 조건을 만족시켰다.
  • 2. 세미베리오그램 모델 적용: 세미베리오그램 분석에서 도출된 최적 모델을 각 클러스터별로 적용하였다.
  • 3. 그리드(grid) 생성: 각 클러스터의 폴리곤 경계에 맞는 100×100 격자를 생성하고, 0.05도의 여유 공간을 추가하여 경계 효과를 최소화하였다.
  • 4. 폴리곤 마스킹(polygon masking): Kriging 결과를 해당 클러스터의 실제 분포 영역에만 제한하기 위해 폴리곤 기반 마스킹을 적용하였다. 이는 각 그룹의 경계를 넘어선 불필요한 외삽(extrapolation)을 방지하였다.

각 클러스터별 kriging 접근법을 통해 퇴적환경의 고유한 공간적 특성을 반영한 정밀한 공간보간 결과를 도출하였다.

2.4 통계분석

2.4.1 클러스터별 표층퇴적물 항목의 분포 특성 분석

클러스터별 표층퇴적물 환경변수인 측정항목(IL, COD, AVS, TOC, TN)의 분포 특성을 파악하기 위해 기술통계량(평균, 표준편차, 중앙값, 최소값, 최대값)을 산출하고, 박스플롯(Boxplot)으로 도시하였다(Fig. 7).

2.4.2 일원배치 분산분석(ANOVA) 및 사후검정

가우시안혼합모델(GMM)을 이용한 클러스터링과 kriging을 통해 구분된 각 클러스터별 표층퇴적물 측정항목의 통계적 차이를 검정하기 위해 일원배치 분산분석(One-way ANOVA)을 이용해 유의성을 검증하였다(Table 3). 사후검정(Post-hoc test)은 Tukey HSD(Honestly Significant Difference)를 이용하여 각 클러스터 간의 유의한 차이를 확인하였다(Fig. 7).

2.4.3 상관 분석

환경변수 간 상관관계 분석을 위해 Spearman 순위상관계수를 계산하고 히트맵(Heatmap)으로 도시하였다(Fig. 9). 연안환경 자료의 비정규 분포 특성과 이상치의 영향을 최소화하기 위해 Pearson 상관계수 대신 Spearman 상관계수를 적용하였다. Spearman 상관계수는 변수들의 순위를 기반으로 단조관계(monotonic relationship)를 측정하며, 다음과 같이 정의된다.

ρ=1-(6Σd2)/(n(n2-1))(11) 

여기서 d는 순위 차이, n은 표본 크기이다.

각 클러스터별 및 전체 자료를 이용하여 상관을 분석하였으며, 특히 총유기탄소(TOC)를 기준 변수로 하여 다른 환경변수들과의 상관을 비교하였다.

2.4.4 C/N 비를 통한 유기물 기원 분석

연안 표층퇴적물의 유기물 기원을 구분하기 위해 TOC (총유기탄소)와 TN (총질소)의 C/N 비(C/N ratio)을 분석하였다(Fig. 10). C/N 비는 식물플랑크톤이나 해조류와 같은 해산식물의 경우 4~10, 육상식물의 경우 ≥ 20의 값을 보이며(Meyers[1994]), 해양플랑크톤은 단백질이 풍부하여 낮은 비율(5~7)을, 육상식물은 셀룰로오스와 리그닌이 풍부하여 높은 비율(> 15)을 나타낸다(Chen et al.[2021]). Müller[1977]는 식물플랑크톤의 평균 C/N 비가 6정도이며, 육상 관속식물은 14~30으로 보고하였으며, Xing et al.[2011]은 해양 유기물을 6~8, 육상 유기물을 > 12로 구분하였다. 이를 종합하여 다음과 같은 기준을 적용하였다.

• C/N 비 5~9, 해양 기원(일반적인 해양 유기물)
• C/N 비 9~12, 혼합 기원(해양과 육상 유기물의 혼합)
• C/N 비 12~15, 육상 기원 초기(육상식물 유기물)
• C/N 비 15 이상, 육상 기원(셀룰로오스가 풍부한 육상식물)

이러한 구분은 해양과 육상 유기물의 화학적 조성 차이에 기반한다. 각 클러스터별 TOC와 TN의 농도에 기반한 C/N 비율을 산점도 분석을 통해 유기물 기원의 공간적 분포 경향을 평가하였다.


3. 결 과

3.1 지구통계학적인 공간분석을 활용한 연안 표층퇴적물의 퇴적특성 분류

3.1.1 공간분석을 위한 최적 클러스터링 알고리즘의 선정

국내 연안 표층퇴적물에 대해 측정된 다양한 항목에 대한 자료를 수집하고, 수집된 자료에서 위치정보(위경도)와 니질함량(Mud, %)을 입력변수로 하여 3가지 클러스터링 알고리즘(K-means, DBSCAN, GMM)을 이용해 분석하였다. 그 결과, K-means(k=4) 클러스터링 알고리즘은 그룹 간 경계의 모호성으로 인해 퇴적환경의 점진적 변화를 반영하는 데 한계가 있었다. 또한 밀도 기반의 DBSCAN(6개 클러스터 생성) 클러스터링 알고리즘의 경우, 다수의 자료를 노이즈(Fig. 2b의 회색점 표시) 처리하여 공간적 연속성을 표현하는데 제약이 있었다. 이에 반해, 가우시안혼합모델(GMM, k=4)은 각각의 자료가 특정 클러스터에 속할 확률을 제공함으로써, 연안 표층퇴적물 퇴적특성의 점진적이고 연속적인 전이 양상을 가장 효과적으로 모델링하였다(Fig. 2).

Fig. 2.

Clustering results using machine learning algorithm for (a) K-means (k=4), (b) DBSCAN (k=6), and (c) Gaussian Mixture Model (GMM, k=4) for grouping the Korean coastal depositional environment. Clustering was based on geographical coordinates (longitude and latitude) and mud content (%).

최적 그룹 수 결정을 위한 GMM 알고리즘이 k=4(클러스터 수)일 때, 클러스터 품질을 나타내는 실루엣 점수(Silhouette Score)가 최대 0.41을 기록하였다(Fig. 3). 동시에 모델의 복잡성과 자료의 적합도를 함께 고려하는 베이지안 정보 기준(BIC Score) 곡선에서도 k=4 지점에서 뚜렷한 엘보우 포인트(elbow point)가 나타나, 모델의 효율성과 설명력이 최적화되는 지점임을 확인하였다. 한편, AIC Score의 경우 그룹 수 증가에 따라 k=3까지 급격히 감소한 뒤, k=4부터는 완만한 감소 경향을 보였다. 이처럼 여러 정보 기준이 k=4를 최적의 그룹 수로 일관되게 지지함에 따라, GMM 알고리즘 분석 결과를 바탕으로 연안 표층퇴적물 퇴적환경을 4개의 그룹으로 분할하였다(Fig. 3).

Fig. 3.

Evaluation results of Gaussian Mixture Model (GMM) performance for determining the optimal number of clusters (k). The Silhouette Score, Akaike Information Criterion (AIC), and Bayesian Information Criterion (BIC) were calculated for k values from 2 to 14. The optimal number of clusters was identified as k=4 (indicated by the black dashed line), corresponding to the peak of the Silhouette Score and the “elbow point” of the BIC score curve.

3.1.2 퇴적상 특성 및 공간분포

가우시안혼합모델(GMM) 클러스터링을 통해 연안 표층퇴적물의 퇴적특성에 기반하여 4개의 그룹으로 구분하였다. 각 클러스터별 표층퇴적물 입도조성은 표 1에 요약하고, Folk[1968]이 제시한 삼각좌표계(ternary diagram)를 이용하여 도시하였다(Fig. 4). 그중 클러스터 1(n=533)은 평균 모래 함량이 66.3 ± 29.0%로 가장 높았으며, 실트질 모래(zS)로 분류되었다. 나머지 클러스터들은 모두 모래질 실트(sZ)로 분류되었으나, 세부적인 입자 조성에는 뚜렷한 차이를 나타내었다. 클러스터 3(n=546)은 실트(57.0 ± 22.5%)와 점토(20.8 ± 17.1%) 함량이 가장 높아, 4개의 클러스터 중 가장 세립한 퇴적특성을 보였다. 클러스터 2와 클러스터 4는 유사한 혼합 퇴적상을 보였지만, 클러스터 2(n=345)는 실트(43.8 ± 29.2%)와 모래(41.7 ± 32.4%) 함량이 거의 비슷한 반면, 클러스터 4(n=266)는 상대적으로 실트(46.8 ± 25.9%)와 점토(16.6 ± 15.1%)의 비율이 높아, 클러스터 2보다 다소 세립한 특성을 보였다(Table 1).

Summary of particle composition (average ± SD) by four clusters grouped by the Gaussian Mixture Model (GMM) clustering algorithm and depositional characteristics specified by the Folk (1968) diagram

Fig. 4.

Ternary diagram illustrating the sedimentary particle composition (sand, silt and clay) for each of the distinguished four clusters grouped by GMM clustering algorithm. The plot is showing the sedimentary characteristics of four clusters with classification based on the Folk (1968) diagram.

GMM 클러스터링 알고리즘으로 분류된 4개 클러스터의 공간 분포를 분석한 결과, 각 클러스터는 한국 연안의 해역별 표층퇴적물의 퇴적특성을 대체로 잘 반영하며 뚜렷하게 분리되었다(Fig. 5). 클러스터 1(청색)은 서해 연안의 한강하구에서 전남 고창연안까지 넓게 분포하는 양상을 나타냈다. 클러스터 2(적색)는 서해남부의 영광연안에서 남해서부의 강진연안과 제주도 연안을 포함하고 구획되어 독자적인 환경을 형성하고 있음을 보여주었다. 클러스터 3(녹색)은 남해서부의 전남 장흥연안에서 동해남부의 울산연안까지 집중되었으며, 클러스터 4(주황색)는 동해남부의 울산연안에서부터 동해북부의 강릉연안까지 선형으로 좁게 분포하여 명확한 해역별 차이를 나타냈다(Fig. 5).

Fig. 5.

Spatial distribution of four clusters grouped by Gaussian Mixture Model (GMM) clustering algorithm. Each color represents different cluster assignments; Cluster 1 (blue squares), Cluster 2 (red circles), Cluster 3 (green triangles), and Cluster 4 (orange diamonds). Gray dashed lines indicate cluster boundaries.

3.1.3 공간상관성 분석 결과

국내연안표층퇴적물을 4개의퇴적환경으로구분하였으며, 각각의 퇴적환경에서 공간 상관성 구조를 파악하기 위해 니질함량에 대한 세미베리오그램(semi-variogram) 분석을 수행하였다(Fig. 6). 3가지 이론적 모델인 구형(Spherical), 지수형(Exponential), 가우시안(Gaussian) 모델을 적용하여 물리적 타당성과 통계적 적합도를 함께 평가한 결과, 일부 모델은 물리적으로 타당하지 않은 결과를 보여 우선적으로 제외되었다. 구체적으로, 클러스터 1과 2의 지수형 모델 및 클러스터 2의 가우시안 모델은 너겟(Nugget) 값이 0으로 산출되었다(Table 2). 너겟 값 0은 측정 오차나 미시적 변동성이 전혀 없는 완벽한 공간 연속성을 의미하는데, 이는 실제 해양환경 데이터에서는 비현실적인 가정이다. 또한, 클러스터 3의 지수형 모델은 공간상관성이 거의 없는 것(Range ≒ 0°)으로 나타났으며, 클러스터 1, 3, 4의 가우시안 모델은 너겟(Nugget)이 문턱값(Sill)을 초과하여 (Nugget/Sill Ratio > 1) 공간 구조를 설명하지 못하는 것으로 분석되었다. 클러스터 4의 지수형 모델 역시 비현실적으로 큰 공간영향 범위(Range = 38.17°)를 보였다. 따라서 물리적 타당성을 만족하는 모델들 중에서 RMSE가 가장 낮은 구형모델이 모든 클러스터의 최적 모델로 채택되었다.

Fig. 6.

Model fitting results of experimental and theoretical semi-variograms for mud content grouped by Gaussian Mixture Model (GMM) clustering algorithm. Each subplot shows experimental data (black dots) fitted with spherical (red solid line), exponential (orange dashed line), and gaussian (green dashed line) models for (a) cluster 1, (b) cluster 2, (c) cluster 3 and (d) cluster 4.

Summary of semi-variogram model parameters (range, nugget, sill) with calculated nugget/sill ratio and Root Mean Square Error (RMSE) for each of the four clusters grouped by the Gaussian Mixture Model (GMM) clustering algorithm

세미베리오그램 분석을 통해 선정된 구형모델의 매개변수 분석 결과, 클러스터별 공간구조는 뚜렷한 차이를 보였다(Table 2). 공간적 자기상관의 강도를 나타내는 Nugget/Sill 비율(ratio)은 클러스터 2에서 0.19로 가장 낮아 공간적 자기상관이강했고, 클러스터 4의 경우 0.89로 가장 높아 국지적 변동성이 우세한 것으로 나타났다. 공간적 상관성이 유지되는 거리(Range)는 클러스터 2에서 0.12°로 가장 길게 나타났다. 클러스터 1과 3은 유사한 Range(0.07°)를 보였으나, Nugget/Sill 비율은 클러스터 3이 0.26으로 클러스터 1의 0.40보다 낮아 더 강한 공간적 자기상관을 갖는 것으로 나타났다. Nugget/Sill 비율의 뚜렷한 차이는 각각의 클러스터가 고유의 공간적 특성을 가진 퇴적환경임을 의미한다.

3.2 클러스터별 환경변수 분포 특성

위치정보(위경도)와 니질함량을 입력변수로 하여 가우시안혼합 모델(GMM) 클러스터링을 통해 구분된 4개의 클러스터가 갖는 지화학적 퇴적특성을 비교하기 위해, 구분된 클러스터별 주요 퇴적물 환경변수인 니질함량(Mud), 총유기탄소(TOC), 강열감량(IL), 화학적 산소요구량(COD), 산휘발성황화물(AVS), 총질소(TN) 분포의 통계적 유의한 차이를 검증하였으며, 그 결과 클러스터 간에 유의한 차이를 보였다(***p < 0.001, Table 3). 또한 사후검정(Tukey HSD)을 통해 환경변수 내에서 각각의 클러스터 쌍 간의 유의성을 검정하였으며, 대부분 유의한 차이를 확인하였다(Fig. 7).

One-way ANOVA result summarized on depositional environment variables for four clusters grouped by the Gaussian Mixture Model (GMM) clustering algorithm. Degrees of freedom (df), sum of squares, mean squares, F-statistics (F), and p-values (p) are shown for each variable

Fig. 7.

Comparison of depositional environment variables across four clusters grouped by Gaussian Mixture Model (GMM) clustering algorithm. Box plots depicts the distribution of (a) Mud, (b) TOC, (c) IL, (d) COD, (e) AVS, and (f) TN for each cluster, showing median, quartiles, and outliers. Asterisk(*) denotes a probability value (ns; not significant, *p < 0.05, **p < 0.01, ***p < 0.001).

퇴적물의 물리적 특성을 대표하는 니질함량(Fig. 7a)은 모든 클러스터 쌍 간에 통계적으로 유의한 차이를 보였으며(***p < 0.001 또는 **p < 0.01), 클러스터별 중앙값을 비교하면, 클러스터 1이 23.1%로 가장 낮았고, 클러스터 2(61.6%), 클러스터 4(73.3%), 클러스터 3(90.0%) 순으로 증가하는 경향을 보였다. 클러스터의 입도 특성은 클러스터 1이 조립질 퇴적환경, 클러스터 3이 세립질 퇴적 환경으로 뚜렷하게 구분되었음을 보여준다. 강열감량(IL, Fig. 7c)도 모든 클러스터 쌍 간에 유의한 차이를 보였으며(***p < 0.001 또는 **p < 0.01), 클러스터 1(3.5%), 클러스터 2(5.0%), 클러스터 4(5.7%), 클러스터 3(7.5%) 순으로니질함량과동일한경향을보였다. 이러한 특성은 해역구분(Fig. 8b)에 그대로 반영되어, 조립질 입도특성과 유기물 함량이 낮은 클러스터 1은 한강하구에서 전북 고창과 전남 영광까지의 서해 연안 해역이었으며, 세립질 입도특성과 유기물 함량이 높은 클러스터 3은 전남 장흥연안에서 동해 울산연안까지의 해역으로 구분되었다.

Fig. 8.

Spatial distribution of depositional environment variables in Korean coastal waters using Kriging interpolation. (a) Total Organic Carbon (TOC, %), (b) Ignition Loss (IL, %), (c) Chemical Oxygen Demand (COD, mg/g·dry), (d) Acid Volatile Sulfide (AVS, mg/g·dry), and (e) Total Nitrogen (TN, %).

총유기탄소(TOC, Fig. 7b)는 클러스터 3과 4간에 유의한 차이를 보이지 않았다는 것을 제외하고 다른 클러스터 쌍 간에는 유의한 차이가 있었다(***p < 0.001 또는 **p < 0.01). TOC 분포의중앙값을 비교하면 클러스터 1은 0.4%, 클러스터 2는 0.7%로 차이가 있었으나, 클러스터 3은 1.29%, 클러스터 4는 1.23%로 유사한 수준이었다. 총질소(TN, Fig. 7f)의 경우는 클러스터 1과 2, 1과 3, 2와 3 간에는 유의한 차이가 없었으나(ns), 다른 클러스터 쌍들 간에는 유의한 차이를 보였다(***p < 0.001). TN 분포의 중앙값은 클러스터 1과 2가 동일하게 0.07% 였으며, 클러스터 4(0.12%), 클러스터 3(0.14%) 순으로 증가하는 경향을 보였다. TOC와 TN 항목은 공간적으로도 남해 연안 중앙부에서 동해 울산까지의 해역(클러스터 3)에서 최고 농도를 보이는 등 유사한 분포를 나타냈다. 반면, TOC의 경우는 동해 남동부(울산-포항 연안)와 북부 해역, 그리고 제주도 주변 연안 해역에서도 국지적으로 높은 농도가 관찰되었다.

화학적산소요구량(COD, Fig. 7d)은 클러스터 1과 2 간에 유의한 차이가 낮았으나(*p < 0.05), 다른 클러스터 쌍들 간에는 높은 유의한 차이를 보였다(***p < 0.001). COD 분포의 중앙값은 클러스터 1(8.1 mg/g), 클러스터 2(9.8 mg/g), 클러스터 4(15.7 mg/g), 클러스터 3(18.5 mg/g) 순으로 증가하였다. 퇴적물의 환원 상태를 지시하는 산휘발성황화물(AVS, Fig. 7e)은 클러스터 1과 2 간에는 유의한 차이가 없었지만, 다른 클러스터 쌍들 간에는 높은 수준의 유의성을 보였다(***p < 0.001). AVS 분포의중앙값은클러스터 1(0.027 mg/g)과 클러스터 2(0.031 mg/g)가 매우 낮은 수준을 보인 반면, 클러스터 4(0.071 mg/g)와 클러스터 3(0.146 mg/g)은 상대적으로 높은 값을 나타냈다. COD와 AVS 두 항목의 공간적 분포(Fig. 8c, 8d) 역시 다른 퇴적지표와 유사하였으며, 특히 AVS는 남해 연안 중앙부에서 동부 해역에 걸쳐 국지적으로 매우 높은 값을 보여 해당 지역이 강한 환원 환경이 형성되어 있음을 시사했다.

종합적으로, 퇴적물의 입도 특성을 대표하는 니질 함량과 유기물 함량을 지시하는 모든 환경변수들(IL, TOC, COD, TN)의 클러스터별 농도 순위는 거의 동일한 경향을 보였다. 즉, 조립질 퇴적물이 우세한 클러스터 1에서 유기물 함량이 가장 낮았고, 세립질 퇴적물이 우세한 클러스터 3에서 가장 높은 유기물 함량을 나타냈다.

3.3 환경변수 상관관계 및 유기물 기원 분석

3.3.1 TOC 기준 상관관계 분석

퇴적물 환경을 구성하는 주요 변수들의 상호 연관성을 파악하기 위해, 대표적인 유기물 지표인 총유기탄소(TOC)와 다른 환경변수들 간의 스피어만(Spearman) 상관을 분석하고, 그 결과를 히트맵으로 도시하였다(Fig. 9). 상관분석 결과, TOC는 퇴적물의 물리적, 화학적 특성들과 매우 유의미한 상관관계를 보였다. 입도 특성의 경우, TOC는 니질함량(Mud, r = 0.60), 실트(Silt, r = 0.53), 점토(Clay, r = 0.63)와 같은 세립질 퇴적물 함량과 강한 양의 상관을 보였다(***p < 0.001). 반면, 자갈(Gravel, r = -0.20) 및 모래(Sand, r = -0.59)와 같은 조립질 퇴적물 함량과는 뚜렷한 음의 상관을 보였다(***p < 0.001).

Fig. 9.

Spearman correlation coefficients between Total Organic Carbon (TOC) and depositional environment variables and biodiversity indices (Shannon index, H’ for abundance and biomass) across different clusters. The heatmap shows the spearman correlations for the overall dataset and four individual clusters grouped by Gaussian Mixture Model (GMM) clustering algorithm.

다른 유기물 지표와의 관계에서, TOC는 총질소(TN, r = 0.70)와 강열감량(IL, r = 0.59)가 전체 데이터셋(Overall)에서 TOC와 가장 높은 양의 상관을 보여, 이들이 모두 유기물 함량을 효과적으로 제시하는 변수임을 확인하였다. 화학적산소요구량(COD, r = 0.35)과 산휘발성황화물(AVS, r = 0.33) 역시 전체 데이터셋에서는 유의미한 양의 상관관계를 보였으나, 클러스터별로 차이를 나타냈다. 특히 클러스터 2에서는 AVS(r = -0.10)와 COD(r = 0.00)가 TOC와 거의 상관성을 보이지 않았다.

대형저서동물의 생물다양성 지표(Shannon Index H')는 전체 데이터셋에서 총유기탄소(TOC) 함량과 뚜렷한 선형적 상관관계를 보이지않았다. 하지만클러스터별로 상반된경향을보였다. 클러스터 2에서는 TOC와 생물다양성 지수(풍부도 기준) 간에 유의한 양의 상관을 보였으며(r = 0.14, **p < 0.01), 반면, 클러스터 3에서는 유의한 음의 상관을 보였다(r = -0.20, ***p < 0.001).이는 TOC와 생물다양성의 관계가 비선형적임을 나타낸다.

3.3.2 C/N 비율을 통한 유기물 기원 분석

퇴적물 내 유기물의 기원을 추정하기 위해 총유기탄소와 총질소의 비(TOC/TN ratio 또는 C/N ratio)를 분석하였다(Fig. 10). 일반적으로 C/N 비는 유기물의 출처에 따라 뚜렷한 차이를 보이는데, 해양 기원 유기물(예를 들면, 식물성 플랑크톤)은 일반적으로 5~12의 값을 가지는 반면, 육상기원 유기물은 12 또는 15 이상의 높은 값을 가지는 것으로 알려져 있다(Meyers[1994]; Chen et al.[2021]; Müller [1977]; Xing et al.[2011]). 분석 결과, 각 클러스터는 유기물 기원에 따라 뚜렷한 차이를 보였다. 남해 동부 전남 장흥연안에서 동해 울산연안까지 구분되는 클러스터 3은 C/N 비가 12 이하인 시료가 전체의 71.8% (5~9 범위: 42.7%, 9~12 범위: 29.1%)를 차지하여, 해양 자체생성 유기물의 기여도가 압도적으로 높은 특성을 보였다. 한강하구에서 전남 고창 연안까지의 서해 연안 해역인 클러스터 1에서도 C/N 비가 5~9 범위의 비율이 50.3%로 가장 높아 해양 기원 유기물이 우세하였으나, 15 이상의 높은 C/N 비를 보이는 비율도 13.4%에 달해 육상기원의 영향이 혼재하는 것으로 나타났다.

Fig. 10.

Relationship between Total Organic Carbon (TOC) and Total Nitrogen (TN) by depositional environment clusters in Korean coastal waters. Different symbols represent cluster assignments; Cluster 1 (blue squares), Cluster 2 (red circles), Cluster 3 (green triangles), and Cluster 4 (orange diamonds). Ratio lines indicate TOC/TN values of 5, 9, 12, and 15 for distinguishing organic matter sources (marine vs. terrestrial origin). Total sample size is n = 2,837.

반면, 클러스터 2(서남해안과제주연안해역)와클러스터 4(동해)는 육상기원 유기물의 영향이 강하게 나타나는 유사한 경향을 보였다. 두 클러스터 모두 C/N 비 15 이상 범위의 비율이 각각 30.1과 29.9%로 가장 높게 나타났으며, 이는 다른 클러스터에 비해 육상에서 공급되는 유기물의 영향이 크다는 것을 의미한다.


4. 고 찰

4.1 지구통계학적 공간분석을 이용한 연안 퇴적환경 분류에 대한 고찰

4.1.1 클러스터링 알고리즘 성능 평가 및 GMM의 적합성

연안환경에 대한 측정자료는 일반적으로 공간적(지리적) 자기상관성과 함께 점진적으로 변화하는 경계, 그리고 불균등한 밀도 분포를 특징으로 한다(Jossart et al.[2020]). 클러스터링 알고리즘 중 K-means는 각 자료의 점들을 단 하나의 클러스터에만 할당하고 구형의 군집을 가정하므로, 해역 간의 점진적인 변화 경계를 표현하는 데 본질적인 한계를 가진다(Ahmed et al.[2020]; Khan et al.[2024]). 또한, 밀도 기반의 DBSCAN은 밀도가 불균일한 실제 연안환경 자료에 적용할 경우, 특정 지역의 데이터를 클러스터링에 적합하지 않은 노이즈(noise)로 오판하거나 공간적 연결성을 제대로 반영하지 못하는 문제를 야기할 수 있다(Ram et al.[2010]).

이러한 특성 때문에 국내 연안 퇴적환경 분류에서 가우시안혼합 모델(GMM)이 K-means나 DBSCAN보다 우수한 성능을 보인 것은 이론적으로 타당하다. GMM은 자료가 여러 정규분포의 혼합으로 이루어졌다고 가정하는 확률모델로, 각 자료가 특정 클러스터에 속할 확률을 제공한다. 따라서 서로 다른 퇴적환경의 특성이 혼합되어 나타나는 ‘전이대(transition zone)’의 특성을 효과적으로 모델링할 수 있다. 이러한 GMM 클러스터링 알고리즘의 유연성은 복잡한 해안선을 가진 국내 연안의 퇴적환경 특성을 분류하는 데 가장 적합했던 핵심적인 이유로 판단된다. 이는 최근 해양환경 특성 분류 연구에서 GMM의 활용 빈도가 높아지는 경향과도 일치한다(Du et al.[2025]; Ye and Zhou[2025]).

최적 클러스터 수를 결정하는 과정에서 이용된 정보기준 중 Silhouette Score가 0.41로나타난것은 Kaufman and Rousseeuw[1990]의 기준에 따르면 유의미한 구조로 해석될 수 있다(Fig. 3). 또한, 모델 복잡도에 더 엄격한 벌점을 부과하여 과적합(overfitting)을 방지하는 데 효과적인 BIC에서 클러스터 수가 증가함에 따라 명확한 엘보우 포인트가 관찰된 점(Akindejoye et al.[2025])은 k=4가 통계적으로 가장 안정적이고 공간(해역)의 특징에 따라 효율적으로 구분된 그룹 수임을 명확하게 보여주고 있다(Fig. 2).

4.1.2 연안 퇴적환경 분류의 해양학적 의미

가우시안혼합모델(GMM) 클러스터링으로 구분된 4개 클러스터의 연안 퇴적환경 그룹은 각 해역의 지배적인 물리적 프로세스를 명확히 반영하고 있는 것으로 보인다. 클러스터 1은 서해 한강하구에서부터 전남 고창연안까지를 구획하며, 조립질 모래 퇴적상이 광범위하게 분포하는 특성을 보인다. 이는 강한 조류 에너지와 넓은 조간대가 특징인 서해의 조석 우세 환경과 정확히 일치하고 있다(Kim et al.[2005]; Kim et al.[2008]). 특히 안면도 및 변산반도 조간대와 같이 높은 조류 에너지가 작용하는 환경에서는 세립한 입자의 재부유가 활발해져 상대적으로 무거운 모래 입자가 우세한 퇴적상을 형성하며, 이는 기존 연구 결과와도 부합하고 있다(Jang et al.[2010]; Jung et al.[2010]).

이와 반대로, 클러스터 3은 남해서부의 전남 장흥연안에서 동해남부의 울산연안까지로 구획되며, 세립질 퇴적상이 집중된 특징을 보인다. 이는 복잡한 리아스식 해안선과 다도해의 발달로 인해 파랑 에너지가 분산되고, 반폐쇄적인 만(bay) 내부에서는 유속이 느려져 세립질 입자가 쉽게 퇴적될 수 있는 저에너지 환경이 조성되기 때문이다. 또한, 주요 하천을 통한 육상기원 퇴적물의 공급 역시 남해 연안의 니질 퇴적물 형성에 기여하는 주요 요인이다.

클러스터 4는 동해남부의 울산연안에서 동해중부의 강릉연안까지 해안선을 따라 좁고 길게 분포하는데, 이는 동해의 파랑 우세 환경을 반영하고 있다. 동해안은 수심이 깊고 해안선이 단조로워, 특히 동계계절풍의 영향으로 높은 파랑 에너지가 직접 연안에 도달한다(Kim and Jang[2020]). 이 강한 파랑 에너지가 퇴적물의 분급과 이동을 제어하여 독특한 선형 분포를 형성한 것으로 해석된다.

클러스터 2는 지리적으로 서해남부와 남해서부의 해양학적 특성이 만나는 전이 환경으로, 굴곡이 심한 리아스식 해안과 다수의 섬으로 구성된 복잡한 지형적 특성을 가진다(Kim et al.[2005]; Oh et al.[2010]; Hwang et al.[2013]). 제주도의 경우, 투수성이 높은 화산암으로 구성된 지질학적 특성이 주변 퇴적환경에 영향을 미치는 것으로 보인다. 이처럼 클러스터 2는 서해의 조류 영향, 남해의 지형적 특성, 그리고 제주도의 고유한 지질 특성이 복합적으로 작용하여 지리적으로 구분된 독자적인 환경 단위를 형성하고 있는 것으로 보인다.

4.1.3 공간상관성 분석의 퇴적환경학적 해석

세미베리오그램 분석을 통해 정량화된 공간구조의 차이는 각 클러스터의 지배적인 퇴적 프로세스를 명확하게 나타낸다. 서해 연안과 남해 연안(클러스터 1, 2, 3)의 Nugget/Sill 비율은 동해안(클러스터 4)보다 낮게 나타났으며, 이는 인근지역 간 퇴적물 특성이 유사하여 공간적으로 규칙적인 패턴을 보인다는 것을 의미한다. 조석의 영향이 우세하고 복잡한 지형으로 에너지가 분산되는 환경에서는 퇴적물의 집적이 비교적 안정적으로 일어나 공간적 균질성이 높게 유지되는 것으로 판단된다.

특히 클러스터 2는 가장 강한 공간적 자기상관(Nugget/Sill: 0.19)과 긴 Range(0.12°)를 보였는데(Table 2), 이는 복잡한 지형에도 불구하고 다양한 수괴가 만나는 전선 형성 등 광역적이고 균질한 해양 프로세스가 퇴적환경을 지배하고 있음을 나타낸다(Kang and Choi[2003]).

이와 대조적으로, 동해안에 분포하는 클러스터 4는 매우 독특한 공간 구조를 보였다. Range가 0.15°로 길게 나타난 것은 동계 계절풍과 같은 광역적인 힘이 퇴적 과정을 주도함을 의미한다. 하지만 동시에 Nugget/Sill 비율이 0.89로 극단적으로 높게 나타난 것은, 그 광역적인 힘(파랑)이 퇴적물을 안정적으로 쌓는 대신 지속해서 교란하고 재동(reworking)시켜 단거리 내에서의 공간적 예측성을 파괴했음을 의미한다. 즉, 긴 Range와 높은 Nugget/Sill 비율의 조합은 ‘강한 에너지에 의해 광역적으로 통제되지만, 국지적으로는 매우 불규칙한’ 파랑 우세 연안의 전형적인 공간 특성으로 해석될 수 있다.

세미베리오그램 분석은 통계적 수치를 넘어 연안 퇴적환경의 동역학적 특성을 진단하는 강력한 도구임을 보여준다. 서·남해 연안이 비교적 안정적인 ‘퇴적(deposition)’ 중심의 환경이라면, 동해안은 지속적인 ‘교란(disturbance)’이 우세한 환경으로, 공간 상관성 분석을 통해 이러한 근본적인 프로세스의 차이를 명확히 구분할 수 있었다.

4.2 클러스터별 퇴적환경 변수 분포의 환경학적 의미

4.2.1 물리적 환경에 의해 결정되는 지구화학적 배경

가우시안혼합모델(GMM) 클러스터링으로 구분된 4개 퇴적환경은 니질함량(Mud), 총유기탄소(TOC)를 포함한 모든 환경변수에서 통계적으로 유의한 차이를 보였다(ANOVA, ***p < 0.001). 이러한 클러스터 간 지구화학적 특성의 근본적인 차이는 각 해역의 물리적 에너지 수준과 그에 따른 퇴적물 입도에 의해 일차적으로 제어되는 것으로 보인다. 이는 퇴적환경에서 입도와 유기물 함량 간의 상관관계가 매우 높다는 일반적인 원칙과 일치한다(Pelletier et al.[2011]).

조립질 퇴적상이 우세한 클러스터 1(서해 연안)은 높은 조석 에너지로 인해 유기물 축적이 제한되는 산화 환경을 대표한다. 이는 서해 연안으로 갈수록 유기탄소 함량이 낮아진다는 기존 연구와 부합한다(Sun et al.[2018]). 투수성이 높은 사질 퇴적물(클러스터 1)에서는 산화 환경이 유지되어 AVS가 거의 생성되지 않는다(Jung et al.[2010]).

반면, 저에너지 환경인 클러스터3(남해 연안)은 세립질 퇴적물 특유의 넓은 비표면적으로 유기물 흡착 및 보존이 용이하다(Kang and Choi[2003]). 이러한 환경에서는 유기물 함량이 높고, 이는 필연적으로 퇴적물의 강한 환원 상태를 유발한다. 유기물이 풍부한 니질 퇴적물(클러스터 3)에서는 미생물 분해에 의한 산소 고갈로 AVS가 높게 나타나며, 이는 물리적-지구화학적 연계(coupling)를 보여준다.

4.2.2 인위적 오염에 의한 자연적 현상의 교란

이러한 자연적인 배경 위에, 인위적인 오염원의 영향이 중첩되어 나타나고 있다. 특히 클러스터 3(남해 연안)에서 관찰되는 높은 유기물 함량과 AVS 농도는 반폐쇄적 만이라는 지형적 특성과 함께, 통영-거제 연안에 밀집된 어류가두리양식장의 영향이 크게 작용한 결과로 해석된다. 실제로 유기물 부하가 높은 어류양식장 퇴적물은 인근 해역보다 월등히 높은 유기물 함량과 어장환경기준을 초과하는 AVS 농도를 보이는 것으로 보고된 바 있다(Hwang et al.[2021]; Choi et al.[2023]). 흥미롭게도, 같은 남해 연안이라도 살포식 패류양식이 이루어지는 진주 연안은 상대적으로 유기물 오염도가 낮은 것으로 나타났다(Lee et al.[2020]). 이는 유기물의 분포 경향이 수산양식의 종류와 방식에 따라서도 크게 달라짐을 보여준다. 이러한 결과는 인위적 압력이 특정 지역의 지구화학적 특성을 자연 상태의 배경 수준 이상으로 증폭시키는 중요한 요인임을 의미한다.

4.2.3 국지적 요인에 의한 공간적 이질성

클러스터 2(서남해와 제주 연안)와 4(동해 연안)는 앞서 언급한 두 극단적 환경의 중간적 특성과 함께, 국지적 요인에 의한 공간적 이질성을 보여준다. 클러스터 4는 전반적으로 유기물 함량이 낮지만, 특정 지점에서 COD, TN 등의 농도가 높게 나타난다. 이는 광역적 경향만으로는 설명되지 않는 국지적 오염원의 존재가 있음을 나타낸다.

클러스터 2의 제주연안의 경우, 제주항 인근에서 선박 활동의 영향으로 오염물질 농도가 증가하는 것으로 보고된 바 있다(Kam et al.[2011]). 이는 항만 활동과 같은 특정 인간 활동이 지역 퇴적 환경의 지구화학적 특성에 미치는 영향을 보여준다. 특히 AVS와 같이 시공간적 변동성이 매우 큰 지표는 이러한 국지적 요인에 더욱 민감하게 반응할 수 있다(Hall and Anderson[2022]).

GMM 클러스터링을 통해 구분된 각 퇴적환경의 지화학적 특성은 (1) 해역의 물리적 에너지 수준과 입도라는 ‘자연적 배경’, (2) 양식장 등 ‘인위적 환경압력의 중첩’, 그리고 (3) 항만 활동과 같은 ‘국지적 요인’이라는 다층적인 제어 요인들의 복합적인 결과로 해석될 수 있다.

4.3 퇴적환경 변수 상관관계 및 유기물 기원의 환경학적 해석

4.3.1 TOC 기준 환경변수 상관관계

상관분석 결과, TOC와 세립한 입도 특성 간에 강한 양의 상관관계가 확인되었으며, 이는 퇴적환경에서 유기물 분포를 제어하는 기본적인 원리를 재확인하는 결과이다(Sun et al.[2018]; Pelletier et al.[2011]). 단순히 두 변수가 함께 움직인다는 것을 넘어, 세립한 입자가 가진 넓은 비표면적이 유기물 흡착을 위한 물리적 공간을 제공하고, 동시에 낮은 투수성으로 인해 퇴적물 내 저산소 환경을 조성하여 혐기성 분해를 유도함으로써 유기물 보존에 유리한 조건을 만들기 때문이다(Zhao et al.[2023]; Hwang and Kim[2013]). 이처럼 입도 특성은 연안 퇴적환경에서 유기물 분포를 결정하는 중요한 물리적 요인이다.

총유기탄소(TOC)와 다른 유기물 지표들(IL, TN, COD, AVS)이 높은 상관을 보이는 것은 일반적이지만, 클러스터 2에서 COD 및 AVS와 TOC 간의 상관성이 거의 나타나지 않은 것은 흥미로운 결과이다. 이는 해당 지역의 독특한 지구화학적 특성이나 상대적으로 적은 표본 수(n=92), 또는 각 분석법이 가진 한계점에서 그 원인을 찾을 수 있다.

COD는 유기물뿐만 아니라 황화물(S2-)과 같은 무기 환원 물질도 함께 산화시키므로, 특정 조건에서는 유기물 함량을 과대평가할 수 있다(Geerdink et al.[2017]). 또한 AVS는 시공간적 변동성이 매우 큰 지표로, 국지적 환경 조건에 따라 TOC와의 상관성이 달라질 수 있다. 따라서 특정 클러스터에서 나타난 상관성의 부재는, 해당 지역의 환경이 여러 유기물 지표 중 일부의 정확성을 저해하는 조건을 가지고 있음을 보여준다.

TOC와 대형저서동물의 다양성지수(Shannon index, H') 간의 관계는 전체적으로는 뚜렷하지 않았으나, 클러스터별로는 상반된 양상을 보였다. 클러스터 2에서는 양의 상관을, 클러스터 3에서는 음의 상관을 나타내어 유기물이 저서생태계에 미치는 영향이 단순한 선형 관계가 아님을 보여준다. 이러한 결과는 유기물 농도 구배에 따른 저서군집 반응을 설명하는 Pearson-Rosenberg 모델과 일치한다(Magni et al.[2009]). TOC와 생물다양성 간의 관계가 긍정적에서 부정적으로 전환되는 임계 구간은 클러스터 2와 클러스터 3의 TOC 농도 범위 사이에서 위치하는 것으로 판단된다.

구체적으로, TOC 농도가 0.7% 수준인 클러스터 2에서는 유기물이 먹이 공급원으로 작용하여 생물다양성을 증진시키는 반면, TOC 농도가 1.3%로 높은 클러스터 3에서는 분해 과정에서 발생하는 저산소와 황화수소의 독성이 스트레스 요인으로 작용하여 다양성을 감소시킬 것으로 추정된다(Hyun et al.[2003]; Hyland et al.[2005]). 결과적으로 클러스터별 상관관계의 차이는 각 퇴적환경이 유기물-생태계 반응 곡선상에서 어느 구간에 해당하는지를 나타내는 중요한 지표라 할 수 있다.

4.3.2 유기물 기원 분석

클러스터별 C/N 비의 분포 특성은 각 클러스터가 고유한 유기물 공급 및 순환 시스템을 가진 생지화학적 구역(biogeochemical province)임을 명확히 보여준다. 클러스터 1(서해 연안)은 넓은 조간대와 강한 조류가 특징인 조석 우세 환경으로, 높은 일차생산력을 보이는 동시에 조립질 퇴적상을 형성한다. 클러스터 2(서남해와 제주 연안)는 복잡한 리아스식 해안과 황해 남부 해류 순환계의 영향을 받는 전이 환경이다. 클러스터 3(남해 연안)은 반폐쇄적 만과 복잡한 다도해 지형으로 세립질 퇴적물이 우세하며, 섬진강·낙동강 등 여러 하천의 영향을 받는다. 클러스터 4(동해 연안)는 급한 경사의 짧은 하천과 협소한 대륙붕을 가진 파랑 우세 환경이다. 이러한 지형·퇴적학적 차이가 각 클러스터의 유기물 기원 특성을 결정한다.

클러스터 1은 해양기원을 지시하는 C/N 비 5~9 범위의 비율(50.3%)이 가장 높아, 연안의 높은 일차생산력에 기반한 해양 자체 생성 유기물의 기여도가 우세한 특성을 보였다. 육상기원을 나타내는 C/N 비 15 이상 범위의 비율은 13.4%로 상대적으로 낮게 나타나, 육상기원 유기물의 직접적인 영향은 제한적인 것으로 판단된다. 이는 태안 연안 갯벌의 C/N 비가 10 이하로 육지의 영향이 적다는 기존 연구 결과와도 일치한다(Choi et al.[2014]). 한국 서해 연안 양식장 지역에서 수행된 안전동위원소 연구에서도 여름철 댐 방류에 또는 육상 영양염 유입으로 자가생성 유기물의 기여도가 36.5%로 높게 나타나, 본 연구에서 확인한 해양기원 유기물 우세 특성과 일치하였다(Kim et al.[2024]).

클러스터 2는 육상기원 유기물의 영향이 지배적인 특성을 보였다(C/N > 15 비율이 30.1%). 특히 클러스터 2의 강한 육상기원 신호는, 황해가 양쯔강과 같은 대형 하천을 통해 막대한 양의 육상기원 유기물을 공급받는 거대한 시스템이라는 점으로 설명할 수 있다(Zhao et al., 2023). 황해 남부의 해류 순환을 통해 이러한 육상기원 유기물이 제주도 서남방 해역까지 운반되어 영향을 미친다는 기존 연구(Kang and Choi[2003])와도 부합한다.

클러스터 3은 해양기원 유기물의 기여도가 높은 동시에(C/N 5-9 범위: 42.7%), 해양성과 육상성의 혼합을 의미하는 9-12 범위의 비율(29.1%)이 높아 가장 뚜렷한 혼합 특성을 나타냈다. 이는 남해 연안의 복잡한 지형이 높은 생산력을 제공하는 동시에, 섬진강과 낙동강을 비롯한 여러 하천이 육상 유기물을 지속해서 공급하기 때문으로 해석되며, 진해만 입구에서 유기물이 혼재된 특성을 보인다는 기존 연구와도 일치한다(Hyun et al.[2003]). 남해 동부 연안 양식장 지역(진해만, 마산만 등)에서 수행된 안정동위원소 연구는 겨울철(Kim et al.[2022])과 여름철(Kim et al.[2024]) 모두 양식 분뇨 기원 유기물(biodeposits)의 우세한 퇴적과 활발한 황산염 환원 반응(SR)의 진행을 확인하였다. 특히 여름철 연구에서는 양식 분뇨 기여도가 44%로 높게 나타났으며, δ34S 값이 약 −7.2‰로 고갈된 패턴이 관찰되었다. 이러한 δ34S 고갈 현상은 겨울철에 최저 −16.1‰로 더욱 뚜렷하게 나타났는데, 이는 클러스터 3의 높은 유기물 함량(TOC 중앙값 1.3%)이 미생물의 활발한 유기물 분해와 황산염 환원을 촉진하고 있음을 뒷받침한다. 이와 대조적으로, 대형 하천의 영향이 적은 클러스터 4에서 육상기원 신호가 강하게 나타난 것(C/N > 15 비율이 29.9%)은 특히 주목할 만하다. 이는 동해안 유역의 급한 경사와 짧은 하천 길이로 인해, 산지에서 기원한 목질계(woody) 유기물이 충분히 분해되지 않은 채 빠르게 연안으로 운반되는 특성을 반영하는 것으로 해석된다. 즉, 유기물의 총량은 다른 해역에 비해 적더라도, 분해가 덜 진행된 육상식물 유기물의 고유한 C/N 비 특성이 명확히 드러나기 때문이다.

결론적으로, 클러스터별 C/N 비의 차이는 각 해역의 지형적 특성(해안선, 하천 시스템), 유역의 지질 및 식생, 그리고 해류 순환과 같은 거대 규모의 해양 프로세스가 복합적으로 작용한 결과이다. 이는 본 연구에서 제시한 퇴적환경 구분이 지구통계적 유의성을 넘어, 실제 물질 순환 시스템을 반영하는 실질적인 해역구분임을 최종적으로 확인하였다.


5. 결 론

국가 모니터링 프로그램을 통해 축적된 국내 연안 표층퇴적물에 대한 빅데이터를 활용하여 기계학습 기반의 클러스터링과 공간상관성을 분석하여 연안의 퇴적환경을 지리적으로 유형화하여 구분하고, 구분된 퇴적환경별 유기물 분포를 포함한 지화학적 특성의 관계를 파악하였다.

첫째, 위치정보와 니질함량을 입력변수로 한 가우시안혼합모델(GMM) 클러스터링은 수질환경 관리를 위한 기존 해양환경기준의 생태기반 해역별 수질에 기초한 생태구 구분보다 퇴적학적으로 의미한 4개의 퇴적환경으로 구분하였다. 클러스터 1(서해 연안), 클러스터 2(서남해와 제주 연안), 클러스터 3(남해 연안), 클러스터 4(동해 연안)로 구분된 퇴적환경은 각 해역의 지배적인 물리적 프로세스(조석, 파랑, 지형적 특성)를 효과적으로 반영하였다. 이는 데이터 기반의 비지도 학습이 전통적인 지리적 구분 또는 단순한 해양학적 기준에 따른 해역 구분을 넘어, 실제 퇴적 프로세스를 기반으로 한 환경구분의 새로운 방법론이 될 수 있음을 확인하였다.

둘째, 세미베리오그램 분석을 통해 정량화된 공간상관성 구조는 각 클러스터의 고유한 퇴적 동력학적 특성을 명확히 구분하였다. 서해 연안과 남해 연안은 상대적으로 안정적인 퇴적환경을, 동해 연안은 지속적인 교란이 우세한 환경임이 Nugget/Sill 비율과 Range 분석을 통해 확인하였다. 또한 각각의 클러스터는 퇴적물의 입도 조성, 지화학적 특성, 유기물 함량, 산화-환원 상태, 그리고 유기물 기원에 이르기까지 통계적으로 유의한 차이를 보였다. 특히 C/N 비(TOC/TN 비) 분석 결과, 각 클러스터는 서로 다른 유기물 공급원(해양 vs 육상기원)을 가진 독립적인 생지화학적 구역임을 확인하였다.

셋째, 총유기탄소(TOC)와 환경변수 간 상관분석은 퇴적물 내 유기물 분포가 입도와 같은 물리적 특성에 의해 일차적으로 제어된다는 기존 연구결과와 일치하는 결과를 확인하였다. 또한 유기물과 저서 생태계 간의 관계가 비선형적임을 확인하였다.

본 연구의 결과는 퇴적학적 특성이 근본적으로 이질적인 각 해역의 획일적인 유기물 관리 기준을 일괄적으로 적용하는 것이 과학적 근거가 부족하다는 것을 보여주었다. 따라서 퇴적물의 입도 분포와 같은 물리적 환경 및 퇴적특성을 우선 고려하여 해역을 지리적으로 구분하고, 구분된 해역의 자연적 배경 수준을 바탕으로 차별화된 환경 기준을 설정해야 할 것이다.

본 연구의 한계로는 시간적 변동성을 고려하지 못한 점과 일부 지역의 표본 밀도가 상대적으로 낮은 점을 들 수 있다. 향후 계절 및 연간 변동성을 포함한 시공간적 분석과 정밀한 공간 해상도의 자료를 활용한 후속 연구가 필요하다. 이를 통해 국내 연안의 퇴적물 관리를 위한 목표 및 정책수립의 과학적이고 실효성 있는 기반을 마련할 수 있을 것으로 기대한다.

Acknowledgments

본 연구는 2024년 해양수산부 재원으로 해양수산과학기술진흥원(과학기술기반 해양환경영향평가 기술개발, 20210427)과 한국에너지공단(해상풍력 생태계 영향 조사 및 분석 기반 구축, 21243174000)의 지원을 받아 수행하였습니다.

References

  • Ahmed, M., Seraj, R. and Islam, S.M.S., 2020, The k-means Algorithm: A Comprehensive Survey and Performance Evaluation, Electronics, 9, 1295. [https://doi.org/10.3390/electronics9081295]
  • Akindejoye, A., Viavattene, C., Priest, S. and Windridge, D., 2025, Identifying Social Vulnerability Profiles for Coastal Flood using Supervised and Unsupervised Machine Learning: A Case Study of Lekki Peninsula, Lagos, Nigeria, International Journal of Disaster Risk Reduction, 105693. [https://doi.org/10.1016/j.ijdrr.2025.105693]
  • Bae, T.S., 2016, Estimation of Spatial Coherency Functions for Kriging of Spatial Data, J. Korean Soc. Surv. Geod. Photogramm. Cartogr., 34(1), 91-98. [https://doi.org/10.7848/ksgpc.2016.34.1.91]
  • Bushra, A.A. and Yi, G., 2021, Comparative Analysis Review of Pioneering DBSCAN and Successive Density-based Clustering Algorithms, IEEE Access, 1-18. [https://doi.org/10.1109/ACCESS.2021.3089036]
  • Chen, Y., Hu, C., Yang, G.P., Gao, X.C. and Zhou, L.M., 2021, Variation and Reactivity of Organic Matter in the Surface Sediments of the Changjiang Estuary and Its Adjacent East China Sea, J. Geophys. Res. Biogeosci., 126, e2020JG005765. [https://doi.org/10.1029/2020JG005765]
  • Choi, M., Lee, D.S., Rho, T.K., Jang, W.K., Kim, S.S., Kim, S.G., Lee, J.H., Lee, C.H. and Kim, C.K., 2015, White Paper on Marine Environment Standards, Ministry of Oceans and Fisheries.
  • Choi, Y., Sim, B., Hong, S., Kim, H., Lee, W., Jung, H., Oh, S. and Lee, D., 2023, Diagnosis of Variation Characteristics of Geochemical Factors and Environmental Recovery according to Fallowing of Marine Fish Cage Farm in Southern Coast, Korea, J. Korean Soc. Mar. Environ. Energy, 26(2), 153-161. [https://doi.org/10.7846/JKOSMEE.2023.26.2.153]
  • Choi, Y.S., Song, J.H., Yoon, S.P., Chung, S.O., An, K.H. and Park, K.J., 2014, The Environmental Characteristics and Factors on the Cultured manila clam (Ruditapes philippinarum) at Hwangdo and Jeongsanpo of Taean in the West coast of Korea, Korean J. Malacol., 30(2), 117-126. [https://doi.org/10.9710/kjm.2014.30.2.117]
  • Cressie, N.A.C., 1993, Statistics for Spatial Data, John Wiley & Sons, Inc., New York. [https://doi.org/10.1002/9781119115151]
  • Diesing, M., Thorsnes, T. and Bjarnad?ttir, L.R., 2021, Organic carbon densities and accumulation rates in surface sediments of the North Sea and Skagerrak, Biogeosciences, 18, 2139-2160. [https://doi.org/10.5194/bg-18-2139-2021]
  • Du, R., Yang, Y., Yu, M., He, G., Yang, Y., Hong, S., Zhang, D., Xia, R. and Yang, S., 2025, A study of benthic habitat classification schemes in the northern equatorial Pacific based on a Gaussian mixture model, Journal of Environmental Management, 377, 124638. [https://doi.org/10.1016/j.jenvman.2025.124638]
  • Folk, R.L., 1968, Petrology of Sedimentary Rocks.Hemphill’s, Austin, Texas, 170 p.
  • Gaida, T.C., Snellen, M., van Dijk, T.A.G.P. and Simons, D.G., 2019, Geostatistical modelling of multibeam backscatter for full-coverage seabed sediment maps, Hydrobiologia, 845, 55-79. [https://doi.org/10.1007/s10750-018-3751-4]
  • Geerdink, R.B., van den Hurk, R.S. and Epema, O.J., 2017, Chemical oxygen demand: Historical perspectives and future challenges, Anal. Chim. Acta, 961, 1-11. [https://doi.org/10.1016/j.aca.2017.01.009]
  • Goff, J.A., Jenkins, C.J. and Williams, S.J., 2008, Seabed mapping and characterization of sediment variability using the usSEABED data base, Cont. Shelf Res., 28, 614-633. [https://doi.org/10.1016/j.csr.2007.11.011]
  • Hall, L.W. Jr. and Anderson, R.D., 2022, Historical Global Review of Acid-Volatile Sulfide Sediment Monitoring Data, Soil Syst., 6, 71. [https://doi.org/10.3390/soilsystems6030071]
  • Hwang, D.W. and Kim, P.J., 2013, Evaluation of Organic Matter and Trace Metal Contaminations of Intertidal Sediments from Coastal Islands in the Southern Region of Jeollanam Province, Kor J Fish Aquat Sci, 46(5), 626-637. [https://doi.org/10.5657/KFAS.2013.0626]
  • Hwang, D.W., Hwang, H.J., Lee, G., Kim, S.Y., Park, S.H. and Yoon, S.P., 2021, Organic Matter and Heavy Metals Pollution Assessment of Surface Sediment from a Fish Farming Area in Tongyoung-Geoje Coast of Korea, J. Korean Soc. Mar. Environ. Saf., 27(4), 510-520. [https://doi.org/10.7837/kosomes.2021.27.4.510]
  • Hwang, D.W., Kim, P.J., Jung, R.H. and Yoon, S.P., 2013, Distributions of Organic Matter and Trace Metals in Intertidal Surface Sediment from the Mokpo-Haenam Coast, Kor J Fish Aquat Sci, 46(4), 454-466. [https://doi.org/10.5657/KFAS.2013.0454]
  • Hyland, J., Balthis, L., Karakassis, I., Magni, P., Petrov, A., Shine, J., Vestergaard, O. and Warwick, R., 2005, Organic carbon content of sediments as an indicator of stress in the marine benthos, Mar Ecol Prog Ser, 295, 91-103. [https://doi.org/10.3354/meps295091]
  • Hyun, S., Choi, J.W., Choi, J.S. and Lee, T., 2003, Surface Sediment Characteristics and Benthic Environments in the Mouth of Jinhae Bay, Korea, J. Kor. Fish. Soc., 36(6), 700-707. [https://doi.org/10.5657/kfas.2003.36.6.700]
  • Jang, D.H., Kim, J.S. and Park, N.W., 2010, Characteristics Variation of the Sedimentary Environment in Winter Season around the Baramarae Beach of Anmyeondo Using Surface Sediment Analysis, J. Korean Geomorphol. Assoc., 17(1), 15-27.
  • Jessen, G.L., Lichtschlag, A., Ramette, A., Pantoja, S., Rossel, P.E., Schubert, C.J., Struck, U. and Boetius, A., 2017, Hypoxia causes preservation of labile organic matter and changes seafloor microbial community composition (Black Sea), Sci. Adv., 3(e1601897), 1-14. [https://doi.org/10.1126/sciadv.1601897]
  • Jossart, J., Theuerkauf, S.J., Wickliffe, L.C. and Morris, J.A. Jr., 2020, Applications of Spatial Autocorrelation Analyses for Marine Aquaculture Siting, Frontiers in Marine Science, 6, 806. [https://doi.org/10.3389/fmars.2019.00806]
  • Jung, R.H., Hwang, D.W., Kim, Y.G., Koh, B.S., Song, J.H. and Choi, H.G., 2010, Temporal Variations in the Sedimentation Rate and Benthic Environment of Intertidal Surface Sediments around Byeonsan Peninsula, Korea, Kor J Fish Aquat Sci, 43(6), 723-734. [https://doi.org/10.5657/kfas.2010.43.6.723]
  • Kam, S.K., Hu, C.G. and Lee, M.G., 2011, Contamination of Butyltin Compounds in Sediments inside Jeju Harbor of Jeju Island, J. Environ. Sci., 20(5), 655-665. [https://doi.org/10.5322/JES.2011.20.5.655]
  • Kang, M.G. and Choi, Y.C., 2003, The Characteristics of suspended particulate matter and surface sediment of C, N in the Northern East China Sea in summer, J. Korean Soc. Mar. Environ. Eng., 6(4), 13-23.
  • Kaufman, L. and Rousseeuw, P.J., 1990, Finding Groups in Data: An Introduction to Cluster Analysis, John Wiley & Sons, Inc., New York. [https://doi.org/10.1002/9780470316801]
  • Khan, I.K., Daud, H.B., Zainuddin, N.b., Sokkalingam, R., Abdussamad, Museeb, A. and Inayat, A., 2024, Addressing limitations of the K-means clustering algorithm: outliers, non-spherical data, and optimal cluster selection, AIMS Mathematics, 9(9), 25070-25097. [https://doi.org/10.3934/math.20241222]
  • Kim, D.K., Jo, H., Han, I. and Kwak, I.S., 2019, Explicit Characterization of Spatial Heterogeneity Based on Water Quality, Sediment Contamination, and Ichthyofauna in a Riverine-to-Coastal Zone, Int. J. Environ. Res. Public Health, 16(409), 1-17. [https://doi.org/10.3390/ijerph16030409]
  • Kim, D.K., Jo, H., Han, I. and Kwak, I.S., 2019, Explicit Characterization of Spatial Heterogeneity Based on Water Quality, Sediment Contamination, and Ichthyofauna in a Riverine-to-Coastal Zone, Int. J. Environ. Res. Public Health, 16(409), 1-17. [https://doi.org/10.3390/ijerph16030409]
  • Kim, G., Hwang, D.W., Ryu, J.W. and Lee, Y.W., 2005, Environmental and Ecological Consequences of Submarine Groundwater Discharge in the Coastal Areas of the Korea Peninsula, The Sea J. Korean Soc. Oceanogr., 10(4), 204-212.
  • Kim, J. and Kim, H., 2008, Clustering of change patterns using Fourier coefficients, Bioinformatics, 24(2), 184-191. [https://doi.org/10.1093/bioinformatics/btm568]
  • Kim, J.D., Jeong, S.T., Cho, H.Y., Jung, K.T. and Ko, D.H., 2008, Uncertainty Analysis of a Coastal Physical Model in Gyeonggi Bay and Han River Estuary, J. Korean Soc. Coast. Ocean Eng., 20(3), 321-331.
  • Kim, K. and Jang, C.J., 2020, Linear trend in the wave climate of the East Sea estimated from a 40-year high-resolution wave hindcast, J. Coast. Disaster Prev., 7(2), 73-83. [https://doi.org/10.20481/kscdp.2020.7.2.73]
  • Lee, G., Hwang, H.J., Kim, J.B. and Hwang, D.W., 2020, Pollution Status of Surface Sediment in Jinju Bay, a Spraying Shellfish Farming Area, Korea, J. Korean Soc. Mar. Environ. Saf., 26(4), 392-402. [https://doi.org/10.7837/kosomes.2020.26.4.392]
  • Lee, J., Kim, B., Noh, J., Lee, C., Kwon, I., Kwon, B.O., Ryu, J., Park, J., Hong, S., Lee, S., Kim, S.G., Son, S., Yoon, H.J., Yim, J., Nam, J., Choi, K. and Khim, J.S., 2021, The first national scale evaluation of organic carbon stocks and sequestration rates of coastal sediments along the West Sea, South Sea, and East Sea of South Korea, Sci. Total Environ., 793, 148568. [https://doi.org/10.1016/j.scitotenv.2021.148568]
  • Lee, J., Kwon, B.O., Kim, B., Noh, J., Hwang, K., Ryu, J., Park, J., Hong, S. and Khim, J.S., 2019, Natural and anthropogenic signatures on sedimentary organic matters across varying intertidal habitats in the Korean waters, Environ. Int., 133, 105166. [https://doi.org/10.1016/j.envint.2019.105166]
  • Lim, C.H., Ryu, D.H., Song, C.H., Zhu, Y.Y., Lee, W.K. and Kim, M.S., 2015, Estimating Precise Spatio-Temporal Distribution of Weather Condition Using Semi-Variogram in Small Scale Recreation Forest, J. Korean Assoc. Geogr. Inf. Stud., 18(3), 63-75. [https://doi.org/10.11108/kagis.2015.18.3.063]
  • Magni, P., Tagliapietra, D., Lardicci, C., Balthis, L., Castelli, A., Corno, S., Frangipane, G., Giordani, G., Hyland, J., Maltagliati, F., Pessa, G., Rismondo, A., Tataranni, M., Tomassetti, P. and Viaroli, P. 2009, Animal-sediment relationships: Evaluating the ‘Pearson–Rosenberg paradigm’ in Mediterranean coastal lagoons. Marine Pollution Bulletin, 58(4), 478-486. [https://doi.org/10.1016/j.marpolbul.2008.12.009]
  • Meyers, P.A., 1994, Preservation of elemental and isotopic source identification of sedimentary organic matter, Chem. Geol., 114, 289-302. [https://doi.org/10.1016/0009-2541(94)90059-0]
  • Middelburg, J.J. and Levin, L.A., 2009, Coastal hypoxia and sediment biogeochemistry, Biogeosciences, 6, 1273-1293. [https://doi.org/10.5194/bg-6-1273-2009]
  • Ministry of Oceans and Fisheries, 2022, Protocol of National Marine Ecosysterm Monitoring Program, 4rd Edition.
  • Müller, P.J., 1977, C/N ratios in Pacific deep-sea sediments: Effect of inorganic ammonium and organic nitrogen compounds sorbed by clays, Geochim. Cosmochim. Acta, 41, 765-776. [https://doi.org/10.1016/0016-7037(77)90047-3]
  • National Institute of Fisheries Science, 2023, Standard methods of marine environment in Korea.
  • Oh, K.H., Chung, C.H., Youn, S.T., Kim, H.G. and Koh, Y.K., 2010, Research on the Depositional Environments and Accumulation Rates in the Coastal Area of Beopseongpo, Korea, J. Korean Island, 22(3), 163-174.
  • Park, K., Choi, M., Joe, D., Jang, D. and Park, S., 2020, Trace Metals in Surface Sediments of Garolim Bay, Korea, J. Korean Soc. Oceanogr., 25(2), 9-25.
  • Park, M.O., Lee, Y.W., Park, J.K., Kang, C.S., Kim, S.G., Kim, S.S. and Lee, S.M., 2019, Evaluation of the Seawater Quality in the Coastal Area of Korea in 2013-2017, J. Korean Soc. Mar. Environ. Energy, 22(1), 47-56. [https://doi.org/10.7846/JKOSMEE.2019.22.1.47]
  • Park, N.W. and Jang, D.H., 2014, Comparison of Geostatistical Kriging Algorithms for Intertidal Surface Sediment Facies Mapping with Grain Size Data, Sci. World J., 2014(145824), 1-11. [https://doi.org/10.1155/2014/145824]
  • Pasini, M.P.B., Lúcio, A.D. and Filho, A.C., 2014, Semivariogram models for estimating fig fly population density throughout the year, Pesqui. Agropecu. Bras., 49(7), 493-505. [https://doi.org/10.1590/S0100-204X2014000700001]
  • Pelletier, M.C., Campbell, D.E., Ho, K.T., Burgess, R.M., Audette, C.T. and Detenbeck, N.E., 2011, Can sediment total organic carbon and grain size be used to diagnose organic enrichment in estuaries?, Environ. Toxicol. Chem., 30(3), 538-547. [https://doi.org/10.1002/etc.414]
  • Ram, A., Jalal, S., Jalal, A.S. and Kumar, M., 2010, A Density based Algorithm for Discovering Density Varied Clusters in Large Spatial Databases, Int. J. Comput. Appl., 3(6), 1-4. [https://doi.org/10.5120/739-1038]
  • Ram, A., Jalal, S., Jalal, A.S. and Kumar, M., 2010, A Density based Algorithm for Discovering Density Varied Clusters in Large Spatial Databases, International Journal of Computer Applications, 3(6), 1-4. [https://doi.org/10.5120/739-1038]
  • Ryu, S.O., 2003, Seasonal variation of sedimentary processes in a semi-enclosed bay: Hampyong bay, Korea, Estuar. Coast. Shelf Sci., 56, 481-492. [https://doi.org/10.1016/S0272-7714(02)00199-3]
  • Seiter, K., Hensen, C., Schröter, J. and Zabel, M., 2004, Organic carbon content in surface sediments-defining regional provinces, Deep-Sea Res. Part I Oceanogr. Res. Pap., 51, 2001-2026. [https://doi.org/10.1016/j.dsr.2004.06.014]
  • Sun, C.I., Park, G.W., Park, H.S., Park, J.K., Kim, S.G. and Choi, M.S., 2018, Distribution of Heavy Metal Concentrations in Surface Sediments of the eastern Yellow Sea, J. Korean Soc. Oceanogr., 23(4), 179-191.
  • Walker, J.B., Gillett, D.J. and Sutula, M., 2022, Establishing biologically relevant sediment organic matter thresholds for estuaries and embayments of the Southern California Bight, USA, Ecol. Indic., 143(109404), 1-12. [https://doi.org/10.1016/j.ecolind.2022.109404]
  • Xing, L., Zhang, H., Yuan, Z., Sun, Y. and Zhao, M., 2011, Terrestrial and marine biomarker estimates of organic matter sources and distributions in surface sediments from the East China Sea shelf, Cont. Shelf Res., 31, 1106-1115. [https://doi.org/10.1016/j.csr.2011.04.003]
  • Ye, X. and Zhou, W., 2025, Unsupervised Classification of Global Temperature Profiles Based on Gaussian Mixture Models, J. Mar. Sci. Eng., 13, 92. [https://doi.org/10.3390/jmse13010092]
  • Zhao, R., Dong, X., Liu, Q., Xu, M. and Zhao, Y., 2023, Distribution, sources and influencing factors of organic carbon in the surface sediments of the coastal tidal flats in Jiangsu Province, Front. Mar. Sci., 10, 1220923. [https://doi.org/10.3389/fmars.2023.1220923]

Fig. 1.

Fig. 1.
The map portrays the locationofeach data point gathered from National Marine Environment Monitoring Program (1997~2024), operated by the Ministry of Oceans and Fisheries. Colors ofcircles represent different monitoring programs: National Marine Ecosystem Survey (white, n=1,716), Marine Environment Monitoring Network(black, n=3,954), Fishery Environment Monitoring (blue, n=4,996), Contaminated Sediment Remediation Program (red, n=873). Red dashed line outlines the established ecological regions, based on Marine Environmental Quality Standard for water quality.

Fig. 2.

Fig. 2.
Clustering results using machine learning algorithm for (a) K-means (k=4), (b) DBSCAN (k=6), and (c) Gaussian Mixture Model (GMM, k=4) for grouping the Korean coastal depositional environment. Clustering was based on geographical coordinates (longitude and latitude) and mud content (%).

Fig. 3.

Fig. 3.
Evaluation results of Gaussian Mixture Model (GMM) performance for determining the optimal number of clusters (k). The Silhouette Score, Akaike Information Criterion (AIC), and Bayesian Information Criterion (BIC) were calculated for k values from 2 to 14. The optimal number of clusters was identified as k=4 (indicated by the black dashed line), corresponding to the peak of the Silhouette Score and the “elbow point” of the BIC score curve.

Fig. 4.

Fig. 4.
Ternary diagram illustrating the sedimentary particle composition (sand, silt and clay) for each of the distinguished four clusters grouped by GMM clustering algorithm. The plot is showing the sedimentary characteristics of four clusters with classification based on the Folk (1968) diagram.

Fig. 5.

Fig. 5.
Spatial distribution of four clusters grouped by Gaussian Mixture Model (GMM) clustering algorithm. Each color represents different cluster assignments; Cluster 1 (blue squares), Cluster 2 (red circles), Cluster 3 (green triangles), and Cluster 4 (orange diamonds). Gray dashed lines indicate cluster boundaries.

Fig. 6.

Fig. 6.
Model fitting results of experimental and theoretical semi-variograms for mud content grouped by Gaussian Mixture Model (GMM) clustering algorithm. Each subplot shows experimental data (black dots) fitted with spherical (red solid line), exponential (orange dashed line), and gaussian (green dashed line) models for (a) cluster 1, (b) cluster 2, (c) cluster 3 and (d) cluster 4.

Fig. 7.

Fig. 7.
Comparison of depositional environment variables across four clusters grouped by Gaussian Mixture Model (GMM) clustering algorithm. Box plots depicts the distribution of (a) Mud, (b) TOC, (c) IL, (d) COD, (e) AVS, and (f) TN for each cluster, showing median, quartiles, and outliers. Asterisk(*) denotes a probability value (ns; not significant, *p < 0.05, **p < 0.01, ***p < 0.001).

Fig. 8.

Fig. 8.
Spatial distribution of depositional environment variables in Korean coastal waters using Kriging interpolation. (a) Total Organic Carbon (TOC, %), (b) Ignition Loss (IL, %), (c) Chemical Oxygen Demand (COD, mg/g·dry), (d) Acid Volatile Sulfide (AVS, mg/g·dry), and (e) Total Nitrogen (TN, %).

Fig. 9.

Fig. 9.
Spearman correlation coefficients between Total Organic Carbon (TOC) and depositional environment variables and biodiversity indices (Shannon index, H’ for abundance and biomass) across different clusters. The heatmap shows the spearman correlations for the overall dataset and four individual clusters grouped by Gaussian Mixture Model (GMM) clustering algorithm.

Fig. 10.

Fig. 10.
Relationship between Total Organic Carbon (TOC) and Total Nitrogen (TN) by depositional environment clusters in Korean coastal waters. Different symbols represent cluster assignments; Cluster 1 (blue squares), Cluster 2 (red circles), Cluster 3 (green triangles), and Cluster 4 (orange diamonds). Ratio lines indicate TOC/TN values of 5, 9, 12, and 15 for distinguishing organic matter sources (marine vs. terrestrial origin). Total sample size is n = 2,837.

Table 1.

Summary of particle composition (average ± SD) by four clusters grouped by the Gaussian Mixture Model (GMM) clustering algorithm and depositional characteristics specified by the Folk (1968) diagram

Group No. of Samples (n) Gravel (%) Sand (%) Clay (%) Silt (%) Property
Cluster 1 553 1.4 ± 4.7 66.3 ± 29.0 5.9 ± 6.9 26.3 ± 24.0 zS(silty sand)
Cluster 2 345 3.5 ± 8.1 41.7 ± 32.4 11.0 ± 7.7 43.8 ± 29.2 sZ(Sandy silt)
Cluster 3 546 0.4 ± 1.9 21.8 ± 24.7 20.8 ± 17.1 57.0 ± 22.5 sZ(Sandy silt)
Cluster 4 266 1.8 ± 7.3 34.9 ± 31.6 16.6 ±15.1 46.8 ± 25.9 sZ(Sandy silt)

Table 2.

Summary of semi-variogram model parameters (range, nugget, sill) with calculated nugget/sill ratio and Root Mean Square Error (RMSE) for each of the four clusters grouped by the Gaussian Mixture Model (GMM) clustering algorithm

Cluster Model Type Range Nugget Sill Nugget/Sill Ratio RMSE
1 Spherical 0.07 248.38 616.59 0.40 66.21
Exponential 0.05 0 864.95 0 66.22
Gaussian 0.07 578.35 286.62 2.02 66.21
2 Spherical 0.12 173.65 909.61 0.19 136.35
Exponential 0.12 0 1081.49 0 139.07
Gaussian 0.09 0 1083.26 0 136.35
3 Spherical 0.07 129.19 505.53 0.26 45.72
Exponential 0.00 354.16 280.55 1.26 45.72
Gaussian 0.02 634.51 0.2 3155.22 45.72
4 Spherical 0.15 476.42 535.71 0.89 119.89
Exponential 38.17 815.23 3270.77 0.25 84.91
Gaussian 1.72 850.76 345.44 2.46 83.76

Table 3.

One-way ANOVA result summarized on depositional environment variables for four clusters grouped by the Gaussian Mixture Model (GMM) clustering algorithm. Degrees of freedom (df), sum of squares, mean squares, F-statistics (F), and p-values (p) are shown for each variable

Variables df Sum of squares Mean square F p
Mud (%) 3 587653.67 195884.56 216.89 < 0.001
TOC (%) 3 471.32 157.11 206.25 < 0.001
IL (%) 3 12652.75 4217.58 379.56 < 0.001
COD (mg/g·dry) 3 125929.28 41976.43 246.29 < 0.001
AVS (mg/g·dry) 3 455.97 151.99 96.34 < 0.001
TN (%) 3 68.33 22.78 24.21 < 0.001