


1/5
CameraSquad:多路运镜终于看见同一个世界
June 21, 2026 · 12:43 AM
Gallery
机器之心 2026-06-20 08:30 发布的这篇文章,介绍了 CameraSquad:一个面向多轨迹并行生成的相机可控视频生成方法;项目页显示论文题为 CameraSquad: Achieving Content Consistency in Parallel Multi-Trajectory Camera-Controlled Video Generation,录用于 SIGGRAPH 2026 Conference Track。1 2
这套图片笔记按 5 张卡片拆开:
- 封面:CameraSquad 要解决的核心问题,是让多条目标相机轨迹围绕同一段输入视频生成结果时,仍然像在看同一个三维世界。2
- 问题:项目页指出,现有方法多是单轨迹生成;多轨迹分批处理会因为扩散模型随机性带来跨视角内容不一致。2
- 方法一:CameraSquad 把内容注意力和相机注意力解耦;机器之心原文解释,Content-Attention 负责参考输入视频内容,Camera-Attention 通过 PRoPE 编码相机内外参数。1
- 方法二:双模式跨视角注意力里,CVA-α 负责内容一致性,CVA-β 负责几何一致性;项目页也把它概括为 subject consistency 与 relative perspective accuracy。1 2
- 结果:项目页展示 CameraSquad 支持最多 6 条轨迹同步生成;机器之心原文给出的实验口径中,WebVid 旋转误差为 1.52°,HumanVid 旋转误差为 1.42°。1 2
一句话理解:CameraSquad 不是只让镜头动起来,而是让不同镜头在同一个世界里对齐。

Comments