清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Direct-a-Video: Customized Video Generation with User-Directed Camera Movement and Object Motion

计算机科学 计算机视觉 视频跟踪 人工智能 运动补偿 缩放 运动(物理) 对象(语法) 灵活性(工程) 摄像机自动校准 可控性 运动(音乐) 光学(聚焦) 摄像机切除 美学 哲学 统计 物理 数学 光学 应用数学 石油工程 工程类 镜头(地质)
作者
Shiyuan Yang,Liang Hou,Haibin Huang,Chongyang Ma,Pengfei Wan,Di Zhang,Xiaodong Chen,Jing Liao
标识
DOI:10.1145/3641519.3657481
摘要

Recent text-to-video diffusion models have achieved impressive progress. In practice, users often desire the ability to control object motion and camera movement independently for customized video creation. However, current methods lack the focus on separately controlling object motion and camera movement in a decoupled manner, which limits the controllability and flexibility of text-to-video models. In this paper, we introduce Direct-a-Video, a system that allows users to independently specify motions for multiple objects as well as camera's pan and zoom movements, as if directing a video. We propose a simple yet effective strategy for the decoupled control of object motion and camera movement. Object motion is controlled through spatial cross-attention modulation using the model's inherent priors, requiring no additional optimization. For camera movement, we introduce new temporal cross-attention layers to interpret quantitative camera movement parameters. We further employ an augmentation-based approach to train these layers in a self-supervised manner on a small-scale dataset, eliminating the need for explicit motion annotation. Both components operate independently, allowing individual or combined control, and can generalize to open-domain scenarios. Extensive experiments demonstrate the superiority and effectiveness of our method. Project page and code are available at https://direct-a-video.github.io/.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
半颗橙子完成签到 ,获得积分10
14秒前
hebhm完成签到,获得积分10
14秒前
蔡勇强完成签到 ,获得积分10
16秒前
zyp完成签到,获得积分10
17秒前
长孙归尘完成签到 ,获得积分10
19秒前
独特的秋完成签到 ,获得积分10
23秒前
天天快乐应助JLLi采纳,获得10
23秒前
juliar完成签到 ,获得积分10
28秒前
John完成签到 ,获得积分10
31秒前
CHEN完成签到 ,获得积分10
32秒前
48秒前
汉堡包应助飞翔的企鹅采纳,获得10
54秒前
挪威的森林完成签到,获得积分10
55秒前
58秒前
虚心的飞鸟完成签到 ,获得积分10
1分钟前
11完成签到 ,获得积分10
1分钟前
回首不再是少年完成签到,获得积分0
1分钟前
ceeray23发布了新的文献求助30
1分钟前
现代完成签到,获得积分10
1分钟前
Hiram完成签到,获得积分10
1分钟前
浮云完成签到 ,获得积分10
1分钟前
薄荷小新完成签到 ,获得积分10
1分钟前
鲤鱼听荷完成签到 ,获得积分10
2分钟前
zzhui完成签到,获得积分10
2分钟前
弧光完成签到 ,获得积分10
2分钟前
吐丝麵包完成签到 ,获得积分10
2分钟前
超男完成签到 ,获得积分10
2分钟前
kunny完成签到 ,获得积分10
2分钟前
LinglongCai完成签到 ,获得积分10
2分钟前
aowulan完成签到 ,获得积分10
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
malistm发布了新的文献求助10
2分钟前
发个15分的完成签到 ,获得积分10
3分钟前
malistm完成签到,获得积分10
3分钟前
上官若男应助博修采纳,获得10
3分钟前
3分钟前
lalala完成签到 ,获得积分10
3分钟前
高分求助中
Mass producing individuality 600
Разработка метода ускоренного контроля качества электрохромных устройств 500
A Combined Chronic Toxicity and Carcinogenicity Study of ε-Polylysine in the Rat 400
Advances in Underwater Acoustics, Structural Acoustics, and Computational Methodologies 300
Effect of deresuscitation management vs. usual care on ventilator-free days in patients with abdominal septic shock 200
Erectile dysfunction From bench to bedside 200
Advanced Introduction to Behavioral Law and Economics 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3825038
求助须知:如何正确求助?哪些是违规求助? 3367346
关于积分的说明 10445271
捐赠科研通 3086738
什么是DOI,文献DOI怎么找? 1698238
邀请新用户注册赠送积分活动 816657
科研通“疑难数据库(出版商)”最低求助积分说明 769907