孙宏博 - Homepage

👨‍💻 孙宏博 [English Version]

孙宏博，2024年7月博士毕业于北京大学王选计算机研究所计算机应用技术专业，现任中电信人工智能科技有限公司视觉算法工程师。入选2025年度北京“高创计划”青年人才托举工程，获2024年北京图象图形学学会（BSIG）优秀博士学位论文奖。主要研究方向为多模态大模型、细粒度视觉分析，发表TIP、AAAI等IEEE Trans.和CCF A类论文7篇；参与多模态基座大模型TeleMM和万物布控系统TeleSearch2.0研发，TeleMM在国际权威评测MMMU、MME、国内权威评测OpenCompass（2024年总榜单）上分别排名第一、第二、第三；主持研发的多模态推理大模型TeleMM-2.0-Thinking在国内权威评测OpenCompass（2025年总榜单）上排名第二，在视觉推理、幻觉抑制等细分领域能力突出，在跨学科推理、数学计算、表格图表分析、空间推理中均表现出业界领先的模型能力，现已落地政务、工业、交通、安防等多类应用场景，提供高效、可靠的多模态智能解决方案。

TeleAI常年招收科研实习生！欢迎投递简历！（联系方式：sunhb3@chinatelecom.cn）

🔥 News

2026.01 – 中国电信多项成果在国际人工智能榜单及赛事中行业领先。
2025.12 – 星辰多模态大模型TeleMM-2.0-Thinking在OpenCompass学术榜单排名第二，银牌！
2025.12 – 发布多模态大模型指代理解Benchmark开源项目 RefBench-PRO 。
2025.11 – 1篇论文被AAAI 2026接收。
2025.10 – ICCV 2025多模态大模型视觉推理定位挑战赛第三名 MARS2: VG-RS 。
2025.09 – 发布视频理解大模型强化学习开源项目 TSPO ，在VideoMME、LVBench、MLVU等视频理解权威评测中均排名前五。
2025.07 – 入选2025年度北京“高创计划”青年人才托举工程（中国电信2025年共5人入选）。
2024.12 – 多模态大模型 TeleMM 在 OpenCompass 2024 总榜单排名第三，超过GPT-4o，作为基础大模型广泛应用于电信的社会安防、城市治理、交通管治等实际业务。
2024.09 – 1篇论文被TIP 2024接收。
2024.08 – 获2024年北京图象图形学学会（BSIG）优秀博士学位论文奖。
2024.07 – 加入中电信人工智能科技有限公司，担任视觉算法工程师，研发多模态基座大模型并开展其在下游垂直细分领域应用。
2024.07 – 北京大学计算机应用技术专业博士毕业，获理学博士学位。

📝 代表性论文

RefBench-PRO: Perceptual and Reasoning Oriented Benchmark for Referring Expression Comprehension

Tianyi Gao, Hao Li, Han Fang, Xin Wei, Xiaodong Dong, Hongbo Sun, Ye Yuan, Zhongjiang He, Jinglin Xu, Jingmin Xin, Hao Sun
arXiv preprint arXiv:2512.06276, 2025. [Paper] [Project]

TSPO: Temporal Sampling Policy Optimization for Long-form Video Language Understanding

Canhui Tang, Zifan Han, Hongbo Sun, Sanping Zhou, Xuchong Zhang, Xin Wei, Ye Yuan, Huayu Zhang, Jinglin Xu and Hao Sun
AAAI Conference on Artificial Intelligence (AAAI), 2026. (CCF A) (Accepted) [Paper] [Code] [TeleAI报导]

SIM-OFE: Structure Information Mining and Object-aware Feature Enhancement for Fine-Grained Visual Categorization

Hongbo Sun, Xiangteng He, Jinglin Xu and Yuxin Peng
IEEE Transactions on Image Processing (TIP), Vol. 33, pp. 5312–5326, 2024. (CCF A) [Paper]

FineFMPL: Fine-grained Feature Mining Prompt Learning for Few-Shot Class Incremental Learning

Hongbo Sun, Jiahuan Zhou, Xiangteng He, Jinglin Xu and Yuxin Peng
Proceedings of the 33rd International Joint Conference on Artificial Intelligence (IJCAI), Jeju, South Korea, Aug. 3-9, 2024. (CCF A)[Paper] [Code]

Dual-Modal Adaptive Online Prompting and Knowledge Retention for Test-Time Adaptation

Zichen Liu, Hongbo Sun, Yuxin Peng and Jiahuan Zhou
Proceedings of the 38th AAAI Conference on Artificial Intelligence (AAAI), Vancouver, Canada, Feb. 20-27, 2024. (CCF A) [Paper]

HCL: Hierarchical Consistency Learning for Webly Supervised Fine-Grained Recognition

Hongbo Sun, Xiangteng He and Yuxin Peng
IEEE Transactions on Multimedia (TMM), Vol. 26, pp. 5108–5119, 2024. (中科院SCI一区Top期刊) [Paper] [Code] [CCF多媒体专委会报导]

Fine-Grained Visual Prompt Learning of Vision-Language Models for Image Recognition

Hongbo Sun, Xiangteng He, Jiahuan Zhou and Yuxin Peng
Proceedings of the 31st ACM International Conference on Multimedia (ACM MM), Ottawa, Canada, Oct. 29-Nov. 3, 2023. (CCF A) [Paper]

SIM-Trans: Structure Information Modeling Transformer for Fine-grained Visual Categorization

Hongbo Sun, Xiangteng He and Yuxin Peng
Proceedings of the 30th ACM International Conference on Multimedia (ACM MM), Lisbon, Portugal, Oct. 10-14, 2022. (CCF A)(Oral, 5.9%) [Paper][Code]

📖 教育经历

2019.09-2024.07 北京大学计算机应用技术博士
2016.09-2019.01 天津大学信息与通信工程硕士
2012.09-2016.07 天津大学电子信息工程本科

🎖 奖励与荣誉

入选2025年度北京“高创计划”青年人才托举工程
获2024年北京图象图形学学会（BSIG）优秀博士学位论文奖
2019, 2020年国际视频分析权威评测TRECVID视频样例搜索比赛，均获第一名
京东方（BOE）创新挑战赛全国总决赛三等奖，京东方（BOE）创客实验室Special Offer

📝 学术服务

AAAI 2026、ACM MM 2026程序委员会委员
国际顶级会议和期刊（CVPR、ICCV、AAAI、IEEE TMM等）审稿人