;

할아버지부터 손자까지…“데이터 라벨러 하루 평균 300명 이상 증가”

AI 학습데이터 플랫폼 크라우드웍스, 서비스 지표 공개
지난해 신규가입자 11만명…총 회원수는 업계 80%
14세부터 93세까지…아르헨티나 거주 회원도
  • 등록 2021-01-10 오전 10:46:41

    수정 2021-01-10 오전 10:46:41

[이데일리 장영은 기자] 지난해 인공지능(AI) 학습용 데이터를 만드는 ‘데이터 라벨러’가 크게 주목을 받으면서 관련 플랫폼 회원 수도 크게 증가한 것으로 나타났다.



10일 AI 학습 데이터 플랫폼 크라우드웍스에 따르면 지난해 가입한 신규 회원수는 총 11만명으로 하루 평균 300명 이상 증가했다.

지난해 1월 10만명을 기록한 누적 회원수도 1년 사이 두배 이상 증가하며 20만명을 돌파했다. 이는 업계 추산 국내 데이터 라벨러의 80%를 차지하는 수준으로 국내 최대 규모이다.

크라우드웍스는 업계 최초로 일반인들을 대상으로 데이터 라벨러를 모집하는 ‘크라우드소싱’ 방식을 선보였다. 이에따라 시간과 제약이 없는 양질의 일자리를 창출하는 한편, AI 솔루션 고도화에 필요한 데이터를 국내외 시장에 제공할 수 있었다는 것이 회사측 설명이다.

데이터 라벨링은 AI가 학습할 수 있는 데이터를 만드는 작업이다. 사진을 보고 ‘개’인지 ‘고양이’인지, 웃는 표정인지 화가 난 표정인지를 구분해 표시하는 작업이다. 단순·반복 작업이 많아 4차 산업혁명 시대의 ‘인형 눈알 붙이기’에 비유되기도 했지만, 시간과 장소의 제약이 없고 전문적인 역량이 필요하지 않아 많은 관심을 받고 있다.

실제로 크라우드웍스에는 최연소 14세부터 최고령 93세까지 다양한 연령층의 회원이 데이터 라벨링에 참여하고 있다. 연령 뿐 아니라 거주지도 다양하다. 20만명의 데이터 라벨러는 국내 뿐 아니라 아시아와 유럽 등 전 세계에 분포돼 있는데, 가장 거리가 먼 국가에 사는 회원은 아르헨티나에 거주하고 있는 것으로 나타났다.

크라우드웍스에서 수집·가공한 데이터 수는 한국어 기초사전 371권 분량에 해당하는 1856만 건이다. 회원들이 데이터를 가공하며 발생한 일 평균 클릭 수는 약 5만3000 번에 달할 것으로 예측된다.

크라우드웍스는 불특정 다수가 참여하기 때문에 발생할 수 있는 데이터 퀄리티 문제를 100% 전수 검수로 해결하고 있으며, 이를 통해 데이터 품질을 고도화한다. 데이터 재가공을 요구하는 반려율은 평균 38%로 집계됐다.지난 한 해 동안 무려 8000번의 반려를 받은 회원도 있는 것으로 조사됐다.

박민우 크라우드웍스 대표는 “2020년은 크라우드웍스가 폭발적으로 성장하며 국내 대표 데이터 라벨링 플랫폼으로써의 입지를 다진 한 해였다”며, “올해는 국내 뿐 아니라 글로벌 AI 시장으로 진출할 발판 마련을 위해 서비스 고도화에 힘쓸 것”이라고 말했다.

소셜 댓글by LiveRe

많이 본 뉴스

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 발행인 곽재선 I 편집인 이익원

ⓒ 이데일리. All rights reserved