|
문장 입력만으로 영상을 생성하는 T2V 모델이 빠르게 상용화되고 있지만 안전성 검증 연구는 아직 초기 단계에 머물러 있다. 연구팀은 이러한 문제의식에서 출발해 T2V 모델의 안전 필터를 우회할 수 있는 구조적 취약점을 분석했다.
예를 들어 ‘하늘로 퍼지는 연기’, ‘바닥에 누워 있는 사람들’, ‘붉은 액체’와 같이 각각은 문제 소지가 낮은 묘사를 순차로 결합할 경우 전체 영상 맥락에서는 폭발 현장을 연상시키는 결과물이 생성될 수 있다. 이는 현행 안전 필터가 단일 장면 중심으로 작동하면 전체 맥락을 충분히 고려하지 못할 수 있음을 시사한다.
연구팀은 음란물, 폭력, 불법행위 등 11개 안전 카테고리에 기반한 220개 프롬프트를 활용해 총 5개 T2V 모델을 평가했다. 그 결과 신스플릿 기반 공격은 70~80% 수준의 성공률을 보였다. 기존 단일 프롬프트 기반 공격의 성공률은 0~10% 수준이다. 즉 장면을 끊어서 아무 문제 없는 것처럼 속였지만 전체적인 맥락에서 고려하면 유해한 영상이 안전성 평가를 통과하는 것이다.
박하언 에임인텔리전스 최고기술책임자(CTO)는 “생성 AI가 이미지에서 영상, 나아가 멀티모달·피지컬 AI로 빠르게 확장되고 있는 만큼 안전성 검증 방식 역시 구조적·맥락적 평가로 진화해야 한다”며 “에임인텔리전스는 앞으로도 생성 AI 시스템에서 나타나는 구조적 취약점을 선제 연구하고 이를 방어할 수 있는 안전 기술을 고도화해 나가겠다”고 말했다.





![[포토]최가빈,버디위해 붙인다](https://spnimage.edaily.co.kr/images/Photo/files/NP/S/2026/03/PS26031500236t.jpg)
![[포토]'전쟁 여파' 주담대 금리 7% 근접...영끌족 '비상'](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/03/PS26031500327t.jpg)
![[포토]원·달러 평균 환율 1476원 돌파](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/03/PS26031500317t.jpg)
![[포토]BTS 컴백 앞두고 서울 북적](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/03/PS26031500296t.jpg)
![[포토]김재희,목표는 언제나 우승](https://spnimage.edaily.co.kr/images/Photo/files/NP/S/2026/03/PS26031400296t.jpg)
![[포토]정윤지-박현경,출발 인사하고 가자](https://spnimage.edaily.co.kr/images/Photo/files/NP/S/2026/03/PS26031300291t.jpg)
![[포토]김정관 장관, 최고가격제 첫날 주유소 방문](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/03/PS26031300854t.jpg)
![[포토] 굳은 표정의 오세훈 서울시장](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/03/PS26031300798t.jpg)
![[포토]최고가격제 관련 범부처 합동점검단 회의](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/03/PS26031300617t.jpg)



