Agentic Reasoning

Selected All Agentic Reasoning Embodied Spatial Reasoning Safe Reasoning Tutorials

The list may not be up-to-date. Please find my latest publications on Google Scholar.

SkillCraft: Can LLM Agents Learn to Use Tools Skillfully? teaser

SkillCraft: Can LLM Agents Learn to Use Tools Skillfully? [Website][PDF][Code][tl;dr]
Shiqi Chen, Jingze Gai, Ruochen Zhou, Jinghan Zhang, Tongyao Zhu, Junlong Li, Kangrui Wang, Zihan Wang, Zhengyu Chen, Klara Kaleb, Ning Miao, Siyang Gao, Cong Lu, Manling Li, Junxian He, Yee Whye Teh

Tool UseSkill LearningLLM AgentsAgent Training

BAGEN: Are LLM Agents Budget-Aware? teaser

BAGEN: Are LLM Agents Budget-Aware? [Website][PDF][Code][Data][tl;dr]
Yuxiang Lin, Zihan Wang, Mengyang Liu, Yuxuan Shan, Longju Bai, Junyao Zhang, Xing Jin, Boshan Chen, Jinyan Su, Xingyao Wang, Jiaxin Pei, Manling Li

Budget-Aware AgentsLLM AgentsAgentic Reinforcement LearningTest-Time Compute

ROSETTA: Constructing Code-Based Reward from Unconstrained Language Preference teaser

ROSETTA: Constructing Code-Based Reward from Unconstrained Language Preference [Website][PDF][Data][Code][tl;dr]
Sanjana Srivastava*, Kangrui Wang*, Yung-Chieh Chan*, Tianyuan Dai, Manling Li, Ruohan Zhang, Mengdi Xu, Jiajun Wu, Li Fei-Fei
ICLR 2026
Best Paper Award at RSS 2025 on Continual Robot Learning from Humans

Reward ModelingCode-Based RewardsLanguage PreferencesAgentic Reinforcement Learning

RAGEN-2: Reasoning Collapse in Agentic Reinforcement Learning teaser

RAGEN-2: Reasoning Collapse in Agentic Reinforcement Learning [Website][PDF][Code][Experimental Logs][tl;dr]
Zenus Wang*, Chi Gui*, Xing Jin*, Qineng Wang*, Licheng Liu*, Kangrui Wang, Shiqi Chen, Linjie Li, Zhengyuan Yang, Pingyue Zhang, Yiping Lu, Jiajun Wu, Li Fei-Fei, Lijuan Wang, Yejin Choi, Manling Li
ICML 2026 Oral
Best Poster Award at MMLS 2025 (Midwest Machine Learning Symposium)
2.7k+ Github Stars, Featured by MIT Tech Review, Lambda Partner Spotlight, VentureBeat, Medium, AI News, MarkTechPost, Business Leaders Review, etc.

Agentic Reinforcement LearningMulti-Turn Reinforcement LearningLLM AgentsReasoning CollapseRL Training Stability

Federated Agent Reinforcement Learning teaser

Federated Agent Reinforcement Learning [Website][PDF]
Canyu Chen, Kangyu Zhu, Zhaorun Chen, Zhanhui Zhou, Shizhe Diao, Yiping Lu, Tian Li, Manling Li+, Dawn Song+
Best Paper Award at AAAI 2026 Workshop on Trustworthy Agentic Systems
Oustanding Paper Award at AAAI 2026 Workshop on Personalization in the Era of Large Foundation Models

Federated LearningAgentic Reinforcement LearningLLM AgentsPrivacy-Preserving Training

VAGEN: Reinforcing World Model Reasoning for Multi-Turn VLM Agents teaser

VAGEN: Reinforcing World Model Reasoning for Multi-Turn VLM Agents [Website][PDF][Blog][Code][tl;dr]
Kangrui Wang*, Pingyue Zhang*, Zihan Wang*, Yaning Gao*, Linjie Li*, Qineng Wang, Chi Wan, Hanyang Chen, Yiping Lu, Zhengyuan Yang, Lijuan Wang, Ranjay Krishna, Jiajun Wu, Li Fei-Fei, Yejin Choi, Manling Li
NeurIPS 2025
Featured by MIT Tech Review, Stanford AI Blog

World Model ReasoningWorld Model Reinforcement LearningMulti-Turn Reinforcement LearningRL for VisionVLM AgentsAgentic Reinforcement Learning

WorldAgen: Unified State-Action Prediction with Test-Time World Model Training teaser

WorldAgen: Unified State-Action Prediction with Test-Time World Model Training [PDF]
Chi Wan*, Kangrui Wang*, Yuan Si, Pingyue Zhang, Manling Li
AAAI 2026

World ModelsTest-Time TrainingState-Action PredictionEmbodied Agents

SyncMind: Measuring Agent Out-of-Sync Recovery in Collaborative Software Engineering teaser

SyncMind: Measuring Agent Out-of-Sync Recovery in Collaborative Software Engineering [Website][PDF][Code][Data]
Xuehang Guo, Xingyao Wang, Yangyi Chen, Sha Li, Chi Han, Manling Li, Heng Ji
ICML 2025

Software Engineering AgentsAgent CollaborationLLM AgentsBenchmark

Internalizing World Models via Self-Play Finetuning for Agentic RL teaser

Internalizing World Models via Self-Play Finetuning for Agentic RL [PDF][Code]
Shiqi Chen, Tongyao Zhu, Zian Wang, Jinghan Zhang, Kangrui Wang, Siyang Gao, Teng Xiao, Yee Whye Teh, Junxian He, Manling Li
2025

World ModelsSelf-Play Fine-TuningAgentic Reinforcement LearningLLM Agents

ERA: Embodied Reasoning Agents via Reinforcement Learning teaser

ERA: Embodied Reasoning Agents via Reinforcement Learning [Website][PDF][Code][Data]
Hanyang Chen, Mark Zhao, Rui Yang, Qinwei Ma, Ke Yang, Jiarui Yao, Kangrui Wang, Hao Bai, Zhenhailong Wang, Rui Pan, Mengchao Zhang, Jose Barreiros, Aykut Onol, ChengXiang Zhai, Heng Ji, Manling Li, Huan Zhang, Tong Zhang
2025

Embodied ReasoningReinforcement LearningRL for VisionEmbodied AgentsVLM Agents

Chain-of-Action: Faithful and Multimodal Question Answering through Large Language Models teaser

Chain-of-Action: Faithful and Multimodal Question Answering through Large Language Models [PDF]
Zhenyu Pan, Haozheng Luo, Manling Li, Han Liu
ICLR 2025

Multimodal Question AnsweringFaithful ReasoningLLM AgentsRetrieval-Augmented Generation

Embodied Agent Interface: Benchmarking LLMs for Embodied Decision Making teaser

Embodied Agent Interface: Benchmarking LLMs for Embodied Decision Making [Website][PDF][Code][Data][Docker][PyPi][Doc]
Manling Li^*, Shiyu Zhao^*, Qineng Wang^*, Kangrui Wang^*, Yu Zhou^*, Sanjana Srivastava, Cem Gokmen, Tony Lee, Li Erran Li, Ruohan Zhang, Weiyu Liu, Percy Liang, Li Fei-Fei, Jiayuan Mao, Jiajun Wu
NeurIPS 2024 Benchmark Track (Oral, Top 0.6%)
Best Paper Award at SoCal NLP 2024, Top 0.4%

Embodied Decision MakingLLM AgentsEmbodied AI BenchmarkReasoning and Planning

Non-Sequential Graph Script Induction via Multimedia Grounding teaser

Non-Sequential Graph Script Induction via Multimedia Grounding [PDF]
Yu Zhou^†, Sha Li, Manling Li, Xudong Lin, Shih-Fu Chang, Mohit Bansal and Heng Ji
ACL 2023 (^† denotes supervised undergraduate)

Graph Script InductionProcedural KnowledgeMultimedia Grounding

A Language First Approach to Procedure Planning teaser

A Language First Approach to Procedure Planning [PDF]
Jiateng Liu^†, Sha Li, Zhenhailong Wang, Manling Li, Heng Ji
ACL 2023 Findings (^† denotes supervised undergraduate)

Procedure PlanningTask PlanningLanguage Priors

Open-Domain Hierarchical Event Schema Induction by Incremental Prompting and Verification teaser

Open-Domain Hierarchical Event Schema Induction by Incremental Prompting and Verification [PDF]
Sha Li, Ruining Zhao^†, Manling Li, Heng Ji, Chris Callison-Burch and Jiawei Han
ACL 2023 (^† denotes supervised undergraduate)

Event Schema InductionHierarchical SchemasLLM Prompting

Multimedia Generative Script Learning for Task Planning teaser

Multimedia Generative Script Learning for Task Planning [PDF]
Qingyun Wang, Manling Li, Hou Pong Chan, Lifu Huang, Julia Hockenmaier, Girish Chowdhary and Heng Ji
ACL 2023 Findings

Script LearningTask PlanningProcedural Knowledge

Event Schema Induction with Double Graph Autoencoders teaser

Event Schema Induction with Double Graph Autoencoders [PDF] [Code]
Xiaomeng Jin^†, Manling Li and Heng Ji
NAACL'22

Event Schema InductionGraph AutoencodersEvent Graphs

The Future is not One-dimensional: Complex Event Schema Induction by Graph Modeling for Event Prediction teaser

The Future is not One-dimensional: Complex Event Schema Induction by Graph Modeling for Event Prediction [PDF] [Data]
Manling Li, Sha Li, Zhenhailong Wang, Lifu Huang, Kyunghyun Cho, Heng Ji, Jiawei Han and Clare Voss
EMNLP'21

Complex Event SchemasTemporal GraphsEvent Prediction

Connecting the Dots: Event Graph Schema Induction with Path Language Modeling teaser

Connecting the Dots: Event Graph Schema Induction with Path Language Modeling [PDF] [Code/Data]
Manling Li, Qi Zeng, Ying Lin, Kyunghyun Cho, Heng Ji, Jonathan May, Nathanael Chambers and Clare Voss
EMNLP'20: Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing.

Event Schema InductionPath Language ModelingEvent Graphs