오픈AI, 음성AI 모델에 이어 ‘AI SORA’ 공개
글로 명령해 고품질 영화같은 AI 영상 제작
CHATGPT로 유명한 OpenAI는 텍스트 기반 챗봇과 음성 인식 AI 모델 Whisper에 이어 새로운 AI 영상 생성 도구인 SORA를 공개했습니다. 이로 인해 세상은 또 한 번의 변화에 직면하게 되었습니다.
작년, 미국 영화 산업계의 파업이 있었습니다. OpenAI의 범용 영상 제작 도구 품질이 놀랍다면, 영화계의 전문 AI 모델은 그 이상의 능력을 발휘하고 있었다는 의미가 됩니다. 현재 수준을 고려하면, 그들의 파업이 이해되는 부분입니다.
SORA는 최대 1분 길이의 영상을 생성할 수 있는 OpenAI의 영상 제작 모델로, 기존의 스테이블 디퓨전보다 더 발전하고 고품질의 영상 샘플을 제공하여 관람자에게 놀라움을 주고 있습니다.
영상은 ►SORA 공식홈페이지를 통해 확인할 수 있다.
특히, 스테이블 디퓨전으로 영상을 제작하기 위해서는 RTX 4090과 같은 고성능 그래픽 카드가 필요하지만, 텍스트에서 비디오로 변환하는 AI 모델 분야의 강자인 Picaplex는 약 4초 정도의 영상 제작이 가능하다는 점을 고려할 때, 생태계에 변화가 올 수 있습니다.
샘플 영상은 여러 개가 공개되었으며 모두 영어로 된 텍스트로 명령을 받아 제작되었습니다. 그러나 최근 Google의 Geminai Ultra 모델 논란처럼, 아직 일반 사용자에게 공개되지 않은 테스트 영상이기 때문에 ‘실 사용에 대한 품질 수준’에 대해서는 지켜봐야 할 여지가 있습니다.
GPT-4 유료 사용자에게만 공개될 수 있으며, 이에 대해 하루 1분 등의 제한적인 옵션이 제공될 수 있어 모든 것이 일반인에게 공개되어야만 확실히 알 수 있습니다.
일각에서는 개인의 사진이나 딥페이크 피해 사례가 증가할 것을 우려하고 있고, 이 문제는 여전히 해결해야될 숙제 중 하나이다.