2018년 4월 창업한 휴멜로는 AI 기술을 음성합성에 활용해 단 2분의 샘플 녹음(기존 30분~1시간 샘플 녹음)으로 실제 성우가 녹음한 것과 유사한 TTS(Text to Speeech) 기술을 제공하는 솔루션을 개발했다. 기존 TTS가 억양없는 단순 텍스트 음성 전환에 그쳤다면 휴멜로의 기술은 음성의 감정 및 운율(음정, 속도)을 조절할 수 있도록 해 사람처럼 상황별로 어울리는 목소리를 낸다. 한국어로 녹음한 음성을 영어, 중국어, 일본어 등 외국어로도 변환할 수 있고, 기존 영상물에서 특정 목소리를 원하는 목소리로 변경할 수도 있다.
이번 투자를 진행한 최우석 KT인베스트먼트 팀장은 “콘텐츠 및 메타버스 시장이 급속도로 확장되어 인간을 모사하는 기술의 수요가 늘고 있는 상황에서 글로벌 시장에서도 경쟁력 있는 음성합성 기술력을 보유한 휴멜로가 크게 성장할 수 있을 것으로 기대한다”고 밝혔다.
이자룡 휴멜로 대표는 “인공지능을 활용한 음성합성 기술은 엔터테인먼트, 개인방송, 오디오북, IoT 기기 등 활용가능한 시장이 무궁무진하다”며 “해당 분야에서 기술 주도권을 유지할 수 있도록 신기술과 서비스 개발에 만전을 기하겠다”고 말했다.