Hong Wang

王泓

Model Training Team, CodeBuddy / WorkBuddy

Tencent, China

Email: wanghong1700@gmail.com • wanghong1700@mail.ustc.edu.cn
Google Scholar • Github

I work on model training in the Tencent CodeBuddy / WorkBuddy team, focusing on LLM post-training and reinforcement learning for code and reasoning. I earned my Ph.D. from the University of Science and Technology of China (USTC). My research spans LLM RL, agent harness and auto research, and AI for scientific computing (neural operators, learning-based numerical solvers, matrix computation acceleration). I welcome discussions and collaborations in these areas.

Materials: CV • Research Slides • Lab Discussion Slides

Latest News

2026.07 Our paper Rethinking Entropy Interventions in RLVR received an ACL 2026 Outstanding Paper Award! 🎉
2026.06 Joined the model training team of Tencent CodeBuddy / WorkBuddy, working on LLM post-training.
2026.05 Four papers accepted to ICML 2026, on large-scale eigensolvers, KV cache for tree-based reasoning, multi-turn LLM interactions, and agentic workflows.

Experience

Model Training Team, CodeBuddy / WorkBuddy

Tencent CodeBuddy / WorkBuddy, Shenzhen, 2026.06 - present

LLM post-training for code and reasoning; agent harness and auto research.

Research Intern (Qingyun Program, CSIG CodeBuddy)

Tencent CodeBuddy, Shenzhen, 2025.05 - 2025.12

LLM post-training for code and mathematical reasoning: reasoning-tree curriculum design, entropy dynamics in RLVR, and data curation for code RL.

Research Project: Fast Similar-Matrix Computation via Low-Rank Decomposition

Huawei contract No. TC20211015677, 2021.09 - 2022.06

Led the full pipeline from algorithm design and theory to experiments; achieved 1.2×–20× speedups in real scenarios.

Education

University of Science and Technology of China (USTC)

Ph.D., Artificial Intelligence, School of Information Science and Technology, 2023 - 2026

University of Science and Technology of China (USTC)

M.S., Computational Mathematics, School of Mathematical Sciences, 2021 - 2023

Advisor: Prof. Kuan Xu

University of Science and Technology of China (USTC)

B.S., Theoretical Physics & B.S., Mathematics (double degree), School of the Gifted Young, 2017 - 2021

Selected Honors & Awards

2026 Outstanding Graduate of Anhui Province top ~1%
2026 Outstanding Graduate, USTC top ~10%
2025 Doctorate National Scholarship, USTC top ~3%
2025 NeurIPS 2025 Financial Assistance
2024 ICLR 2024 Financial Assistance
2021 Outstanding Graduate, USTC top ~10%

Selected Publications

^* equal contribution • ^† corresponding author • full list on Google Scholar.

Large Language Models & Reinforcement Learning

Scheduling Your LLM Reinforcement Learning with Reasoning Trees

Hong Wang*, Zhezheng Hao*, Jian Luo, Chenxing Wei, Yao Shu, Lei Liu, Qiang Lin, Hande Dong†, Jiawei Chen†

ICLR 2026 • arXiv • Code • Tencent internship work

Rethinking Entropy Interventions in RLVR: An Entropy Change Perspective 🏆 ACL'26 Outstanding Paper Oral

Zhezheng Hao*, Hong Wang*, Haoyang Liu, Jian Luo, Jiarui Yu, Hande Dong†, Qiang Lin, Can Wang, Jiawei Chen†

ACL 2026 • arXiv • Code • Tencent internship work

Exploiting Edited Large Language Models as General Scientific Optimizers

Qitan Lv, Tianyu Liu, Hong Wang†

NAACL 2025 • arXiv

ReCreate: Reasoning and Creating Domain Agents Driven by Experience

Zhezheng Hao, Hong Wang, Jian Luo, Jianqing Zhang, Yuyan Zhou, Qiang Lin, Can Wang, Hande Dong†, Jiawei Chen†

ACL 2026 • arXiv • Code • Tencent internship work

Perturbation-Restrained Sequential Model Editing

Jun-Yu Ma, Hong Wang, Hao-Xiang Xu, Zhen-Hua Ling, Jia-Chen Gu†

ICLR 2025 • arXiv

Words & Weights: Streamlining Multi-Turn Interactions via Co-Adaptation

Chenxing Wei, Hong Wang, Ying He, Zhongxiang Dai, Bo Jiang, Fei Yu, Yao Shu†

ICML 2026 • arXiv

Energy-Regularized Sequential Model Editing on Hyperspheres

Qingyuan Liu*, Jia-Chen Gu*, Yunzhi Yao, Hong Wang, Nanyun Peng

ICLR 2026 • arXiv • Code

Plug-and-Play Data Module for Code RL: Adaptive Ambiguity Replay

Jianqing Zhang, Wei Xia, Zhezheng Hao, Hong Wang, Hande Dong, Qiang Lin, Yang Liu, Jian Cao, Qiang Yang

ACL 2026 Findings • Tencent internship work

EvoMAS: Heuristics in the Loop — Evolving Smarter Agentic Workflows

Yangbo Wei, Zhen Huang, Ronghao Xu, Hong Wang, Wei W. Xing†

ICML 2026

GAPO: Robust Advantage Estimation for Real-World Code LLMs

Jianqing Zhang, Zhezheng Hao, Wei Xia†, Hande Dong, Hong Wang, Chenxing Wei, Yuyan Zhou, Yubin Qi, Qiang Lin, Jian Cao

ACL 2026 Findings • arXiv • Code • Tencent internship work

LEPO: Latent Reasoning Policy Optimization for Large Language Models

Yuyan Zhou*, Jiarui Yu*, Hande Dong†, Zhezheng Hao, Hong Wang, Jianqing Zhang, Qiang Lin

ACL 2026 Findings • arXiv • Code • Tencent internship work

ArborKV: Structure-Aware KV Cache Management for Scaling Tree-based LLM Reasoning

Yeqiu Chen, Ziyan Liu, Zhenxin Huang, Runquan Gui, Hong Wang, Lei Liu†

ICML 2026

AI for Scientific Computing

SymMaP: Improving Computational Efficiency in Linear Solvers through Symbolic Preconditioning

Hong Wang, Minghao Ma, Haoran Shao, Haoyang Liu

NeurIPS 2025 • arXiv • Code

Accelerating Eigenvalue Dataset Generation via Chebyshev Subspace Filter

Hong Wang, Jian Luo, Huanshuo Dong, Yeqiu Chen, Runmin Jiang, Zhen Huang

ICLR 2026 • arXiv

Accelerating Data Generation for Neural Operators via Krylov Subspace Recycling Spotlight

Hong Wang*, Zhongkai Hao*, Zijie Geng, Zhen Wang, Bin Li, Feng Wu

ICLR 2024 • arXiv • Code

Mixture-of-Experts Operator Transformer for Large-Scale PDE Pre-Training

Hong Wang*, Haiyang Xin*, Xuanze Yang, Fei Zha, Huanshuo Dong, Yan Jiang

NeurIPS 2025 • arXiv • Code

STNet: Spectral Transformation Network for Solving Operator Eigenvalue Problems

Hong Wang*, Yixuan Jiang*, Xinyi Li, Jian Luo, Huanshuo Dong

NeurIPS 2025 • arXiv • Code

HGATSolver: A Heterogeneous Graph Attention Solver for Fluid-Structure Interaction Oral

Qin-Yi Zhang*, Hong Wang*, Siyao Liu, Haichuan Lin, Linying Cao, Xiao-Hu Zhou, Chen Chen, Shuangyi Wang†, Zeng-Guang Hou†

AAAI 2026 • arXiv • Code

Learning Neural Operators from Partial Observations via Latent Autoregressive Modeling

Jingren Hou*, Hong Wang*, Pengyu Xu, Chang Gao, Huafeng Liu, Liping Jing†

AAAI 2026 • arXiv

Self-Attention to Operator Learning-based 3D-IC Thermal Simulation

Zhen Huang*, Hong Wang*, Wenkai Yang, Muxi Tang, Depeng Xie, Ting-Jung Lin, Yu Zhang, Wei W. Xing, Lei He

DAC 2025 • arXiv

Learning-Guided Integration Contours Construction for Fast Large-Scale Generalized Eigensolvers

Yeqiu Chen, Ziyan Liu, Hong Wang†, Lei Liu

ICML 2026

Accelerating PDE Data Generation via Differential Operator Action in Solution Space

Huanshuo Dong, Hong Wang, Haoyang Liu, Jian Luo

ICML 2024 • arXiv

Neural Krylov Iteration for Accelerating Linear System Solving Spotlight

Jian Luo, Hong Wang, Huanshuo Dong, Zijie Geng, Hanzhu Chen, Yufei Kuang

NeurIPS 2024 • NeurIPS

Coordinate Transform Fourier Neural Operators for Symmetries in Physical Modelings

Wenhan Gao, Ruichen Xu, Hong Wang, Yi Liu†

TMLR 2025 • OpenReview • Code

Professional Services & Mentoring

Reviewer for ICLR, ICML, NeurIPS, AAAI, and other top AI venues.
Mentored 10+ students on research projects during graduate studies.