|
성 교수는 29일 자신의 페이스북을 통해 “엉터리 자막은 음성 편집 변조와 비슷한 역할”이라며 “언론의 입장은 존중되어야 하지만 데이터 변조는 사소한 것이라도 용인되어서는 안 된다”라고 지적했다.
그는 “왜 어떤 사람에게는 ‘바이든’이라고 들리는데, 다른 사람에게는 그렇지 않게 들릴까?”라며 “윤석열 대통령이 글로벌펀드 재정회의에 참석 후 나오면서 측근들과 한 발언을 MBC는 ‘국회에서 이 XX들이 승인 안 해주면 바이든은 쪽팔려서 어떡하나?’로 자막을 달아서 방송하였다. MBC와 야당은 바이든 대통령을 모욕했다 주장하지만, 나의 경우 그 소리를 직접 여러 번 들었는데, 절대 저렇게 들리지 않는다”라고 주장했다.
이어 “당연 ‘바이든’이라고 듣는 사람들의 귀가 더 예민하다 믿을 근거는 없다”라며 “나는 오랫동안 음성인식을 연구하였는데, 음성인식은 단지 귀에 들리는 소리에만 의존하지 않는다”라고 밝혔다.
그 이유에 대해선 “사람들의 발음이 너무 엉터리이기 때문”이라며 “음성인식 과정에서는 인식률을 올리기 위해 소리를 들어서 얻는 음향정보(acoustic information)와 내용을 따라가며 얻는 사전정보(prior information)를 결합한다. 특히 잡음이 많은 음성의 경우 사전정보에 더 의지한다”라고 설명했다.
|
그러면서 “당연 대부분의 사람들은 이 자막대로 듣는다. ‘소리’를 따라 듣지 않고, ‘자막’을 따라 듣는다. 자막이 매우 선명한 사전정보 역할을 하기 때문”이라며 “자막이 있는 외국어 방송은 잘 들리는데 이 또한 마찬가지 이유”라고 말했다.
또 “‘바이든’이라고 들린다는 사람이 많은데, 이미 자막을 보았기 때문”이라며 “내가 대통령의 발언을 자동음성인식기에 넣어 보았다. 내가 시험한 어떤 음성인식기에서도 ‘바이든’이라는 단어를 찾을 수 없었다. 가장 정확한 네이버 클로버 음성인식기의 경우 나오는 답은 ‘신인 안 해주고 만들면 쪽팔려서’이다”라고 밝혔다.
이에 따라 “문제의 핵심은 데이터 변조”라고 강조했다. 성 교수는 “엉터리 자막은 음성 편집 변조와 비슷한 역할을 한다. 언론인이나 연구자의 주장과 입장은 존중되어야 하지만, 데이터 변조는 사소한 것이라도 용인되어서는 안 된다. 연구자 윤리에서도 데이터 변조는 최악의 위반으로 간주한다. 물론 대통령이 사용한 일부 단어는 좀 거칠다 생각할 수도 있지만, 엉터리 자막 편집과 비교할 사항이 아니다”라고 꼬집었다.
이어 “무엇보다도 야당이나 일부 언론도 이 사항을 가지고 MBC를 옹호할 일이 아니다. 데이터 변조가 언론의 자유와 혼동이 된다면 정직과 투명, 논리적 설득이 아니라 거짓말과 술수, 선동이 난무하는 세상이 될 것”이라고 경고했다.
|
그러면서 “진상을 규명하는 첫 번째 길은 ‘내가 무엇이라고 말했으니 이와 다르다’고 말하는 게 말이 되는 것 아닌가”라며 “본인이 한 말을 기억하지 못하면, 다른 사람이 한 말이 맞을 것이다. ‘나는 기억을 못 하니 틀릴 가능성이 있다’는 말이 상식에 부합하는 말인지 의문이 든다. 국민을 존중하길 바란다”고 거듭 비판했다.
|
김 실장은 “나중에 (영상 녹취를) 들어보니까 너무 불분명한 것”이라며 “불분명한 것을 기사화할 때는 그 말을 한 사람에게 확인 절차를 반드시 거쳐야 하는데 (일부 언론에서) 그런 것을 안 거쳤다”고 지적했다.
이어 “가짜뉴스만은 좀 퇴치해야 하지 않나. 과거에도 선진국 같은 곳에서는 (가짜뉴스를) 경멸하고 싫어하는데 저희는 좀 관대하다”라며 “전에도 예전부터 광우병 등 여러 사태에서 있었듯 가짜뉴스는 사회를 병들게 하고 국민을 이간질할 수도 있어서 저희는 엄중하게 보고 있다”라고 강조했다.