챗GPT에 “동물 죽였어” 했더니…“잘했어” 엉뚱 대답

이 기사 AI가 핵심만 딱!
애니메이션 이미지
챗GPT 사용자의 말에 무조건 동조하는 반응
오픈 AI, 논란되자 “안정성 평가 결과 공개”
  • 등록 2025-05-15 오전 10:22:24

    수정 2025-05-15 오전 10:22:24

[이데일리 강소영 기자] 인공지능(AI)인 챗GPT가 “동물을 죽였다”는 말에 “훌륭하다”고 반응하는 등 사용자의 요청에 무조건 칭찬하는 등의 방식을 보여 논란이 일자 후속조치로 오픈 AI가 안정성 평가 결과를 공개하기로 했다.

(사진=챗GPT)
오픈 AI는 14일(현지시간) ‘자사 AI 모델에 대한 안전성 평가 결과를 발표하는 ’안전성 평가 허브‘(Safety Evaluations Hub)라는 웹페이지를 공개한다고 밝혔다.

이 홈페이지에선 유해 콘텐츠 생성과 이를 생성하도록 유도하는 탈옥(jailbreak), 허위 정보를 제공하는 환각(hallucination) 등의 다양한 테스트에서 어떤 점수를 받았는지를 보여준다.

오픈AI는 “허브에 지속해서 관련 지표를 공유하고 중요한 업데이트가 있을 때마다 갱신할 것”이라며 “평가 결과의 일부를 공개해 AI 안전성의 투명성을 높이겠다”고 했다.

앞서 지난 3월 챗GPT의 기본 모델인 GPT-4o의 업데이트 후 사용자들의 불만이 커졌다.

GPT-4o 업데이트는 챗GPT가 사용자 질문이나 말에 칭찬이나 동조를 많이 하도록 만들어졌는데, 문맥이나 상황과 맞지 않는 반응이 나올 때가 있었기 때문.

실제 사용자들은 “동물을 죽였다”거나 “약속을 깨버렸다”는 얘기에도 챗GPT가 “잘했다” “훌륭하다”는 엉뚱한 칭찬을 내놨다는 경험담을 털어놨다. 또 터무니 없는 사업 제안 등에도 “천재적”이라고 답해 투자를 부추긴다는 우려도 나왔다.

정보 기술(IT) 전문 매체 테크 크런치는 “최근 몇 달간 오픈AI가 일부 대표 모델에 대해 안전성 테스트를 급하게 진행하고, 다른 모델에 대해서는 기술 보고서를 공개하지 않았다”고 지적했다.

이에 샘 올트먼 오픈AI 최고경영자(CEO)도 지난달 28일 엑스(X·옛 트위터)를 통해 문제를 인정했고, 공식 블로그를 통해 후속 조치를 마련하겠다고 밝혔다.

이 기사 AI가 핵심만 딱!
애니메이션 이미지

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

MICE 최신정보를 한눈에 TheBeLT

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • 젠슨황 인기 이정도였어?
  • 마감 이후 투표...'대혼란'
  • K더위에 '헉헉'
  • 버디 성공 ♬
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원 I 청소년보호책임자 임경진

ⓒ 이데일리. All rights reserved