|
다크버트는 다크웹 상의 데이터로 학습한 다크웹 전용 인공지능(AI) 언어모델이다. 다크웹은 마약, 정보 유출, 랜섬웨어, 해킹 등 범죄 온상이 된 익명 기반 네트워크로 각종 불법 거래와 유해 콘텐츠가 유통되지만, 정보의 휘발성과 탈중앙화, 익명화 기술로 보호돼 범죄자 추적이나 출처 파악, 데이터 확보 등이 매우 어렵다. 다크버트를 활용하면 범죄와 관련된 다크웹 콘텐츠를 요약하거나 다크웹 내 공격자들이 자주 사용하는 신종 툴을 빠르고 정확하게 확인할 수 있다.
S2W는 지난 6월 세계 최고 수준의 자연어처리(NLP) 학술대회 ACL(Association for Computational Linguistics)에서 ‘다크버트: 인터넷의 어두운 단면을 위한 언어 모델(DarkBERT: A Language Model for the Dark Side of the Internet)’이라는 주제로 논문을 발표한 바 있다.
AI 권위자 랜스 엘리엇 박사, 구글 클라우드 필 베네이블스 CISO 등이 다크버트에 대해 언급하기 시작하면서 다크버트에 대한 트위터 누적 조회수는 현재까지 180만 건이 넘었으며, 유튜브에서도 다크버트에 대해 소개하는 콘텐츠가 100건 이상 쏟아졌다. S2W 홈페이지를 통해서는 30개국에서 50건 이상의 다크버트에 대한 데모 요청과 문의가 쇄도했다.
현재 다크버트는 일반 대중에게 공개되지는 않고 연구 및 개발 목적으로 사용을 요청하는 곳에 한해 선별해서 접근할 수 있도록 허용하고 있다.
S2W의 기술 관련 논문은 세계 최고 수준의 자연어처리 학술대회에서 2년 연속 논문이 채택됐으며 작년 NAACL(북미전산언어학회)에 이어 올해 5월 ACL에서 다시 한번 S2W의 기술력을 인정 받은 바 있다.