과거와 비교해 다양한 의약품들이 인체 대사 작용을 거쳐 하·폐수 처리장으로 유입되고 있고, 미량물질의 양과 종류도 늘고 있다. 하·폐수 속 미량물질이 강과 바다 등으로 유입돼 상수원으로 활용되면 환경뿐 아니라 발암, 내분비계 장애 등 인간 건강에도 해로운 영향을 미칠 수 있다.
이러한 미량물질의 특성과 거동을 빠르고 정확하게 예측하는 기술이 필요하지만 알려지지 않은 미량물질을 분석하려면 비싼 장비를 숙련된 전문가가 써야 했다.
|
이후 새로운 미량물질의 특성과 농도 변화를 예측하기 위해 데이터를 여러 하위 집합으로 분류하는 머신러닝 기술인 랜덤 포레스트를 추가로 구축했다. 새로운 미량물질이 자기조직화지도 내 어떤 군집에 속한다면 해당 군집 내 다른 물질의 특성을 통해 미량물질의 특성과 농도가 어떻게 변화할지 예측할 수 있다.
연구팀이 군집화·예측 인공지능 모델을 새로운 13종의 신종 미량물질에 적용한 결과, 생물학 정보를 이용한 기존 인공지능을 활용한 기술의 예측정확도인 0.4를 넘는 약 0.75의 예측정확도를 보였다 예측정확도는 0에서 시작해 1에 가까울수록 높다.
홍석원 박사와 손문 박사는 “새로운 미량물질이 있는 대부분의 수처리 관련 시설에 적용하고, 관련 규제를 위한 정책결정 과정에서 빠르고 정확한 자료를 제공할 수 있다”며 “머신러닝 기술을 활용하기 때문에 데이터가 쌓일수록 예측정확도도 높일 수 있다”고 했다.
연구결과는 국제학술지 ‘네이처 포트폴리오 저널 클린워터(npj Clean Water)’ 10월호에 게재됐다.