반응형
SMALL

이미지생성 2

[논문리뷰] Packing Input Frame Context in Next-Frame Prediction Models for Video Generation

FramePack: 비디오 생성 모델, 이제 '장기 기억' 능력 갖추다! (ft. 드리프트 방지 샘플링)🔗 https://arxiv.org/pdf/2504.12626.pdfAI가 만든 영상, 틱톡 릴스처럼 짧은 영상만 가능한 걸까요? FramePack은 더 긴 영상을 만들 때 생기는 문제를 해결한 놀라운 기술입니다.긴 영상을 만들 때 AI 모델은 과거 내용을 잊어버리거나(망각), 점점 횡설수설하는(드리프트) 문제**가 있었는데요.FramePack은 짐을 효율적으로 꾸리듯 과거 프레임을 압축하고, 양방향으로 맥락을 파악하여 이 두 가지 문제를 동시에 해결했습니다.덕분에 AI는 더 긴 영상도 '기억'하며 자연스럽게 만들 수 있게 되었고, 영상 품질도 훨씬 높아졌습니다. 마치 AI가 '장기 기억' 능력을 갖..

AI논문 2025.04.18

[논문리뷰] Have we unified image generation and understanding yet? An empirical study of GPT-4o’s image generation ability

GPT-4o, 이미지 생성만 잘하는 걸까? 속 빈 강정일지도 모르는 GPT-4o의 이미지 이해 능력 분석!🔗 https://arxiv.org/pdf/2504.08003.pdfOpenAI의 GPT-4o는 이미지 생성과 편집 분야에서 엄청난 성능을 보여주며 많은 기대를 모으고 있어요.하지만 이 논문은 겉으로 보이는 화려함 속에 숨겨진 GPT-4o의 진짜 능력에 대해 질문을 던집니다.단순히 프롬프트에 맞춰 이미지를 '그려내는' 것 이상으로, 세상의 이치를 제대로 이해하고 맥락에 맞게 이미지를 생성하는지 꼼꼼하게 따져본 것이죠.마치 그림은 화려하지만, 막상 중요한 내용을 물어보면 엉뚱한 답을 하는 '속 빈 강정'은 아닐지 확인해보는 중요한 연구입니다.서론최근 AI 기술 발전으로 텍스트를 입력하면 고품질 이미지..

AI논문 2025.04.16
반응형
LIST