KAIST는 김용대 전기전자공학부 교수 연구팀이 국가보안기술연구소와 한국어 AI 생성 댓글을 탐지하는 기술 ‘XDAC’를 개발했다고 23일 밝혔다. 연구에는 김용대 KAIST 교수를 비롯해 고우영 국가보안기술선임연구소 선임연구원, 김형식 성균관대 교수, 오혜연 KAIST 교수가 참여했다.
|
연구팀은 우선 AI 생성 댓글과 사람 작성 댓글을 사람이 구별할 수 있는지 실험했다. 총 210개의 댓글을 평가한 결과, AI 생성 댓글의 67%를 사람이 작성한 것으로 착각했고, 실제 사람 작성 댓글도 73%만 정확히 구분해냈다. 사람조차 AI 생성 댓글을 정확히 구별하기 어려운 수준에 이르렀다.
가령 AI는 “것 같다”, “에 대해” 등 형식적 표현과 높은 접속어 사용률을 보였다. 특수문자 사용에서도 AI는 전 세계적으로 통용되는 표준화된 이모지를 주로 사용했다. 특히, 서식 문자(줄바꿈, 여러 칸 띄어쓰기 등) 사용에서 사람 작성 댓글의 26%는 이런 서식 문자를 포함했지만, AI 생성 댓글은 단 1%만 사용했다. 반복 문자(ㅋㅋㅋㅋ, ㅎㅎㅎㅎ 등) 사용 비율도 사람 작성 댓글이 52%로, AI 생성 댓글(12%)보다 높았다.
그 결과, XDAC는 AI 생성 댓글 탐지에서 98.5% F1 점수로 기존 연구 대비 68% 성능을 높였다. 댓글 생성 LLM 식별에서도 84.3% F1 성능을 기록했다.
고우영 보안연 선임연구원은 “생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고, 생성 모델까지 식별하는 기술”이라며 “AI 기반 여론 조작 대응의 기술적 기반을 마련했다”고 말했다.
|