Angtian Wang

About Me

I am a Research Scientist at ByteDance working on GenAI. Previously, I earned my Ph.D. in Computer Science from Johns Hopkins University, advised by Bloomberg Distinguished Professor Alan L. Yuille. I have a board research experience in vairent computer vision / artificaial intellegence area, including but not limit to Video Generation 1 2 3, 3D vision 4 5 6, Robust Vision 7 8, Differible Rendering 9, and Medical Image Diagnosis 10 11.

Work Experience

ByteDance, Senior Research Scientist

I am currently working on Seedance Long Video / SeeWorld project, focus on develop video foundation models that achieves interactive controllable long video/audio generation. Previously on the large-scale post-training and fine-tuning of next-generation video models, including Seedance 2.0/1.0 and Wan 2.1/2.2. My work bridges the gap between foundational research and scalable implementation through three core pillars:

Controllable Synthesis: Developing high-quality, temporally consistent video generation models with a focus on precise user control.
World Modeling via Long Video Generation: Exploring agentic storytelling and continuous long-video generation to move toward robust, large-scale world modeling.
Architectural Optimization: Balancing the trade-offs between computational efficiency and generative quality by advancing foundational model architectures.
Autonomous Data Ecosystems: Scaling training datasets and labeling systems by leveraging agentic AI to automate and optimize the end-to-end data processing pipeline.

Publications

arXiv Preprint

HECTOR: Hybrid Editable Compositional Object References for Video Generation

Guofeng Zhang, Angtian Wang †, Jacob Zhiyuan Fang, Liming Jiang, Haotian Yang, Alan Yuille, Chongyang Ma

ArXiv, 2026.

PDF
arXiv Preprint

FSVideo: Fast Speed Video Diffusion Model in a Highly-Compressed Latent Space

FSVideo Team, Qingyu Chen, Zhiyuan Fang, Haibin Huang, Xinwei Huang, Tong Jin, Minxuan Lin, Bo Liu, Celong Liu, Chongyang Ma, Xing Mei, Xiaohui Shen, Yaojie Shen, Fuwen Tan, Angtian Wang, Xiao Yang, Yiding Yang, Jiamin Yuan, Lingxi Zhang, Yuxin Zhang

ArXiv, 2026.

PDF
CVPR

VIVA: VLM-Guided Instruction-Based Video Editing with Reward Optimization

Xiaoyan Cong, Haotian Yang, Angtian Wang, Yizhi Wang, Yiding Yang, Canyu Zhang, Chongyang Ma

CVPR 2026

PDF Project Page Code
arXiv Preprint

StoryMem: Multi-shot Long Video Storytelling with Memory

Kaiwen Zhang, Liming Jiang, Angtian Wang, Jacob Zhiyuan Fang, Tiancheng Zhi, Qing Yan, Hao Kang, Xin Lu, Xingang Pan

ArXiv, 2025.

PDF Project Page Code
CVPR

TGT: Text-Grounded Trajectories for Locally Controlled Video Generation

Guofeng Zhang, Angtian Wang †, Jacob Zhiyuan Fang, Liming Jiang, Haotian Yang, Bo Liu, Yiding Yang, Guang Chen, Longyin Wen, Alan Yuille, Chongyang Ma

CVPR 2026

PDF Project Page
arXiv Preprint

ATI: Any Trajectory Instruction for Controllable Video Generation

Angtian Wang, Haibin Huang, Jacob Zhiyuan Fang, Yiding Yang, Chongyang Ma

ArXiv, 2025.

PDF Project Page Code Model
NIPS

WorldWeaver: Generating Long-Horizon Video Worlds via Rich Perception

Zhiheng Liu, Xueqing Deng, Shoufa Chen, Angtian Wang, Qiushan Guo, Mingfei Han, Zeyue Xue, Mengzhao Chen, Ping Luo, Linjie Yang

Conference on Neural Information Processing Systems (NIPS), 2025.

PDF PDF Project Page Code
arXiv Preprint

MAGREF: Masked Guidance for Any-Reference Video Generation

Yufan Deng, Xun Guo, Yuanyang Yin, Jacob Zhiyuan Fang, Yiding Yang, Yizhi Wang, Shenghai Yuan, Angtian Wang, Bo Liu, Haibin Huang, Chongyang Ma

ArXiv, 2025.

PDF PDF Project Page Code Model
AAAI

HISR: Hybrid Implicit Surface Representation for Photorealistic 3D Human Reconstruction

Angtian Wang, Yuanlu Xu, Nikolaos Sarafianos, Robert Maier, Edmond Boyer, Alan Yuille, Tony Tung

AAAI Conference on Artificial Intelligence (AAAI), 2024.

PDF Project Page
WACV

Neural Textured Deformable Meshes for Robust Analysis-by-Synthesis

Angtian Wang, Wufei Ma, Alan Yuille, Adam Kortylewski

IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 2024.

PDF Project Page
ICLR

VoGE: A Differentiable Volume Renderer using Neural Gaussian Ellipsoids

Angtian Wang, Peng Wang, Jian Sun, Adam Kortylewski, Alan Yuille

IEEE/CVF International Conference on Learning Representations (ICLR), 2023.

PDF Code
NIPS

Neural View Synthesis and Matching for Semi-Supervised Few-Shot Learning of 3D Pose

Angtian Wang, Shenxiao Mei, Alan Yuille, Adam Kortylewski

Conference on Neural Information Processing Systems (NIPS), 2021.

PDF Code
ICLR

NeMo: Neural Mesh Models of Contrastive Features for Robust 3D Pose Estimation

Angtian Wang, Adam Kortylewski, Alan Yuille

International Conference on Learning Representations (ICLR), 2021.

PDF Code
CVPR

Robust Object Detection Under Occlusion With Context-Aware CompositionalNets

Angtian Wang*, Yihong Sun*, Adam Kortylewski, Alan Yuille

IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR), 2020.

PDF Code
CVPR

Structure-Aware Sparse-View X-ray 3D Reconstruction

Yuanhao Cai, Jiahao Wang, Alan Yuille, Zongwei Zhou, Angtian Wang

IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR), 2024.

PDF Code
ICLR

Semantic Flow: Learning Semantic Fields of Dynamic Scenes from Monocular Videos.

Fengrui Tian, Yueqi Duan, Angtian Wang, Jianfei Guo, Shaoyi Du

International Conference on Learning Representations (ICLR), 2024.

PDF Code
ICLR

Adding 3D Geometry Control to Diffusion Models

Wufei Ma, Qihao Liu, Jiahao Wang, Angtian Wang, Xiaoding Yuan, Yi Zhang, Zihao Xiao, Guofeng Zhang, Beijia Lu, Ruxiao Duan, Yongrui Qi, Adam Kortylewski, Yaoyao Liu, Alan Yuille

International Conference on Learning Representations (ICLR), 2024.

PDF Code Project Page
WACV

Robust Category-Level 3D Pose Estimation from Synthetic Data

Jiahao Yang, Wufei Ma, Angtian Wang, Xiaoding Yuan, Alan Yuille, Adam Kortylewski

IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 2024.

PDF
ICCV

3D-Aware Neural Body Fitting for Occlusion Robust 3D Human Pose Estimation

Yi Zhang, Pengliang Ji, Angtian Wang, Jieru Mei, Adam Kortylewski, Alan Yuille

International Conference on Computer Vision (ICCV), 2023.

PDF Code Project Page
WACV

CoKe: Localized Contrastive Learning for Robust Keypoint Detection

Yutong Bai*, Angtian Wang*, Adam Kortylewski, Alan Yuille

IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 2023.

PDF
ECCV

Robust Category-Level 6D Pose Estimation with Coarse-to-Fine Rendering of Neural Features

Wufei Ma, Angtian Wang, Alan Yuille, Adam Kortylewski

European Conference on Computer Vision (ECCV), 2022.

PDF Code
ECCV

OOD-CV: A Benchmark for Robustness to Individual Nuisances in Real-World Out-of-Distribution Shifts

Bingchen Zhao, Shaozuo Yu, Wufei Ma, Mingxin Yu, Shenxiao Mei, Angtian Wang, Ju He, Alan Yuille, Adam Kortylewski

European Conference on Computer Vision (ECCV), 2022.

PDF Project Page
IJCV

Compositional Convolutional Neural Networks: A Robust and Interpretable Model for Object Recognition under Occlusion

Adam Kortylewski, Qing Liu, Angtian Wang, Yihong Sun, Alan Yuille

International Journal of Computer Vision (IJCV), 2020.

PDF Code
MICCAI

Hyper-Pairing Network for Multi-Phase Pancreatic Ductal Adenocarcinoma Segmentation

Yuyin Zhou, Yingwei Li, Zhishuai Zhang, Yan Wang, Angtian Wang, Elliot Fishman, Alan Yuille, Seyoun Park

International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI), 2019.

PDF
ECCV

Weakly Supervised Region Proposal Network and Object Detection

Peng Tang, Xinggang Wang, Angtian Wang, Yongluan Yan, Wenyu Liu, Junzhou Huang, Alan Yuille

European Conference on Computer Vision (ECCV), 2018.

PDF
arXiv Preprint

Learning a Category-level Object Pose Estimator without Pose Annotations

Fengrui Tian, Yaoyao Liu, Adam Kortylewski, Yueqi Duan, Shaoyi Du, Alan Yuille, Angtian Wang

arXiv preprint 2024

PDF
arXiv Preprint

Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis

Yuanhao Cai, Yixun Liang, Jiahao Wang, Angtian Wang, Yulun Zhang, Xiaokang Yang, Zongwei Zhou, Alan Yuille

arXiv preprint 2024

PDF
arXiv Preprint

Robust 3D-aware Object Classification via Discriminative Render-and-Compare

Artur Jesslen, Guofeng Zhang, Angtian Wang, Alan Yuille, Adam Kortylewski

arXiv preprint 2023

PDF
arXiv Preprint

Benchmarking Robustness in Neural Radiance Fields

Chen Wang, Angtian Wang, Junbo Li, Alan Yuille, Cihang Xie

arXiv preprint 2023

PDF

About Me

Work Experience

ByteDance, Senior Research Scientist

Publications

Services

Reviewers