본문 바로가기
INNOVATION

짧은 텍스트 프롬프트를 사실적인 비디오로 변환하는 OpenAI의 Sora

by 아이디어박람회 2024. 3. 19.
반응형

 

 

인공지능(AI)의 발전 속도가 정말 빠르다는 건 누구나 인정하는 사실입니다. 얼마 전까지만 해도, 사람들이 상상하는 장면이나 이미지를 만들어내는 컴퓨터 프로그램에 대해 많은 창작자들이 신기해하고, 일부는 걱정도 많이 했습니다. 그런데 이제 기술은 한 걸음 더 나아가, 짧은 글귀만으로도 실제 같은 동영상을 만들어내는 새로운 단계에 이르렀습니다. 이런 기술의 새로운 발전을 이끈 주인공은 바로 OpenAI라는 회사가 개발한 'Sora'라는 프로그램입니다.

 

 

'Sora'는 사용자가 입력한 짧은 텍스트 프롬프트를 바탕으로 최대 1분 길이의 사실적인 동영상을 만들어내는 AI 모델입니다. 이러한 기능은 예술가들에게 새로운 창작의 기회를 제공함과 동시에, 일반 사용자들에게도 전에 없던 경험을 제공합니다. 예를 들어, '맑은 날 산책하는 고양이'라는 간단한 문장만으로도, 고양이가 산책하는 모습을 담은 동영상을 실제로 볼 수 있게 되는 것입니다.

 

Sora의 기술적 배경을 살펴보면, 이 프로그램은 '확산 모델'을 기반으로 합니다. 확산 모델은 초기에 잡음으로 가득 찬 이미지에서 시작하여, 점진적으로 목표 이미지로 변화시키는 과정을 거치게 됩니다. 이 과정을 통해, 사용자의 텍스트 프롬프트에 부합하는 동영상을 만들어낼 수 있습니다.

 

 

동영상 생성 과정에서는 여러 프레임을 동시에 고려하여, 장면 전환 시 캐릭터의 일관성을 유지하는 등의 복잡한 작업을 처리합니다. 그러나 Sora도 완벽하지는 않습니다. 복잡한 장면이나 세부적인 물리적 상호작용을 완벽하게 시뮬레이션하는 데 어려움을 겪을 수 있습니다. 예를 들어, 동영상 속 인물이 쿠키를 먹는 장면을 만들었을 때, 쿠키에 실제로 물린 자국이 나타나지 않는 경우가 발생할 수 있습니다. 이는 AI가 아직 인간의 섬세함을 완벽하게 재현하는 데에는 한계가 있음을 보여줍니다.

 

 

하지만, Sora의 강점 중 하나는 사용자의 텍스트 프롬프트를 정확하게 이해하고, 그에 따른 감정을 표현하거나 다양한 장면을 창조해낼 수 있다는 점입니다. 이는 Sora가 단순한 동영상 생성이 아닌, 이야기를 전달하고 감정을 표현할 수 있는 능력을 갖추고 있음을 말합니다.

 

이처럼 놀라운 기능을 가진 Sora이지만, 부정적인 영향을 미칠 가능성도 있습니다. 따라서 OpenAI는 이 기술이 안전하게 사용될 수 있도록 여러 조치를 마련하고 있습니다. 먼저, 부적절한 사용을 방지하기 위해 오해의 소지가 있는 콘텐츠를 탐지하고, 회사의 정책을 위반하는 텍스트 입력을 거부하는 기술적 방법을 도입했습니다. 또한, 이 기술이 긍정적으로 활용될 수 있는 방법을 모색하기 위해 정책 입안자, 교육자, 예술가들과 협력하고 있습니다. 기술의 발전은 우리에게 새로운 가능성을 열어주지만, 그것을 어떻게 활용할 것인지에 대한 신중한 고민도 필요합니다.

 


Open AI는 텍스트 프롬프트에서 동영상을 만들 수 있는 AI 모델인 Sora를 공개했습니다.

 

 

 


그 결과는 믿을 수 없을 정도로 현실적입니다.

 

 


사람, 동물, 그리고 풍경이 모두 실제처럼 움직이며 그려집니다.

 

 

VIA : mymodernmet

반응형