반응형
SMALL

video generation 2

[논문리뷰] HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation

🔗 https://arxiv.org/pdf/2505.04512.pdfHunyuanCustom 논문 요약: 이미지, 오디오, 영상, 텍스트로 원하는 주인공 영상 만들기최근 영상 생성 AI는 놀랍게 발전했지만, 사용자가 원하는 특정 대상(인물이나 사물)을 정확하게 제어하는 것이 큰 숙제였습니다.특히 영상이 진행되는 동안 주인공의 모습이나 특징이 일관되게 유지되지 않는 경우가 많았죠.이 논문은 이미지, 오디오, 영상, 텍스트 등 다양한 형태의 정보를 입력받아,사용자가 지정한 대상을 영상 속에서 완벽히 일관되게 유지하며 고품질 영상을 생성하는 획기적인 방법을 제시합니다.서론영상 생성 AI 기술은 빠르게 발전하고 있지만, 원하는 대로 영상을 '맞춤 제작'하는 것은 여전히 어렵습니다.'맞춤형 영상 생성'이란 특정..

AI논문 2025.05.09

[논문리뷰] Packing Input Frame Context in Next-Frame Prediction Models for Video Generation

FramePack: 비디오 생성 모델, 이제 '장기 기억' 능력 갖추다! (ft. 드리프트 방지 샘플링)🔗 https://arxiv.org/pdf/2504.12626.pdfAI가 만든 영상, 틱톡 릴스처럼 짧은 영상만 가능한 걸까요? FramePack은 더 긴 영상을 만들 때 생기는 문제를 해결한 놀라운 기술입니다.긴 영상을 만들 때 AI 모델은 과거 내용을 잊어버리거나(망각), 점점 횡설수설하는(드리프트) 문제**가 있었는데요.FramePack은 짐을 효율적으로 꾸리듯 과거 프레임을 압축하고, 양방향으로 맥락을 파악하여 이 두 가지 문제를 동시에 해결했습니다.덕분에 AI는 더 긴 영상도 '기억'하며 자연스럽게 만들 수 있게 되었고, 영상 품질도 훨씬 높아졌습니다. 마치 AI가 '장기 기억' 능력을 갖..

AI논문 2025.04.18
반응형
LIST