|
10일 AI 학습 데이터 플랫폼 크라우드웍스에 따르면 지난해 가입한 신규 회원수는 총 11만명으로 하루 평균 300명 이상 증가했다.
지난해 1월 10만명을 기록한 누적 회원수도 1년 사이 두배 이상 증가하며 20만명을 돌파했다. 이는 업계 추산 국내 데이터 라벨러의 80%를 차지하는 수준으로 국내 최대 규모이다.
데이터 라벨링은 AI가 학습할 수 있는 데이터를 만드는 작업이다. 사진을 보고 ‘개’인지 ‘고양이’인지, 웃는 표정인지 화가 난 표정인지를 구분해 표시하는 작업이다. 단순·반복 작업이 많아 4차 산업혁명 시대의 ‘인형 눈알 붙이기’에 비유되기도 했지만, 시간과 장소의 제약이 없고 전문적인 역량이 필요하지 않아 많은 관심을 받고 있다.
실제로 크라우드웍스에는 최연소 14세부터 최고령 93세까지 다양한 연령층의 회원이 데이터 라벨링에 참여하고 있다. 연령 뿐 아니라 거주지도 다양하다. 20만명의 데이터 라벨러는 국내 뿐 아니라 아시아와 유럽 등 전 세계에 분포돼 있는데, 가장 거리가 먼 국가에 사는 회원은 아르헨티나에 거주하고 있는 것으로 나타났다.
크라우드웍스에서 수집·가공한 데이터 수는 한국어 기초사전 371권 분량에 해당하는 1856만 건이다. 회원들이 데이터를 가공하며 발생한 일 평균 클릭 수는 약 5만3000 번에 달할 것으로 예측된다.
크라우드웍스는 불특정 다수가 참여하기 때문에 발생할 수 있는 데이터 퀄리티 문제를 100% 전수 검수로 해결하고 있으며, 이를 통해 데이터 품질을 고도화한다. 데이터 재가공을 요구하는 반려율은 평균 38%로 집계됐다.지난 한 해 동안 무려 8000번의 반려를 받은 회원도 있는 것으로 조사됐다.
박민우 크라우드웍스 대표는 “2020년은 크라우드웍스가 폭발적으로 성장하며 국내 대표 데이터 라벨링 플랫폼으로써의 입지를 다진 한 해였다”며, “올해는 국내 뿐 아니라 글로벌 AI 시장으로 진출할 발판 마련을 위해 서비스 고도화에 힘쓸 것”이라고 말했다.