👨‍💻 孙宏博

孙宏博,2024年7月博士毕业于北京大学王选计算机研究所计算机应用技术专业,现任中电信人工智能科技有限公司视觉算法工程师。入选2025年度北京“高创计划”青年人才托举工程,获2024年北京图象图形学学会(BSIG)优秀博士学位论文奖。主要研究方向为多模态大模型、细粒度视觉分析,发表TIP、TMM、IJCAI、AAAI、ACM MM等IEEE Trans.和CCF A类论文10余篇;参与多模态基座大模型TeleMM和万物布控系统Telesearch2.0研发,TeleMM在国际权威评测MMMU、MME、国内权威评测OpenCompass(2024年总榜单)上分别排名第一、第二、第三;参加2届由美国国家标准与技术研究院(NIST)举办的国际评测TRECVID视频语义搜索比赛,均获第一名。

🔥 News

  • 2025.09 – 发布视频理解大模型强化学习开源项目 TSPO ,在VideoMME、LVBench、MLVU等视频理解权威评测中均排名前五。
  • 2025.07 – 入选2025年度北京“高创计划”青年人才托举工程。
  • 2024.12 – 多模态大模型 TeleMM 在 OpenCompass 2024 总榜单排名第三,超过GPT-4o,作为基础大模型广泛应用于电信的社会安防、城市治理、交通管治等实际业务。
  • 2024.09 – 1篇论文被TIP接收。
  • 2024.08 – 获2024年北京图象图形学学会(BSIG)优秀博士学位论文奖。
  • 2024.07 – 加入中电信人工智能科技有限公司,担任视觉算法工程师,研发多模态基座大模型并开展其在下游垂直细分领域应用。
  • 2024.07 – 北京大学计算机应用技术专业博士毕业,获得理学博士学位。

📝 代表性论文

TSPO

TSPO: Temporal Sampling Policy Optimization for Long-form Video Language Understanding

Canhui Tang, Zifan Han, Hongbo Sun, Sanping Zhou, Xuchong Zhang, Xin Wei, Ye Yuan, Huayu Zhang, Jinglin Xu and Hao Sun
arXiv preprint arXiv:2508.04369, 2025. [Paper] [Code]

SIM-OFE

SIM-OFE: Structure Information Mining and Object-aware Feature Enhancement for Fine-Grained Visual Categorization

Hongbo Sun, Xiangteng He, Jinglin Xu and Yuxin Peng
IEEE Transactions on Image Processing (TIP), Vol. 33, pp. 5312–5326, 2024. (CCF A) [Paper]

FineFMPL

FineFMPL: Fine-grained Feature Mining Prompt Learning for Few-Shot Class Incremental Learning

Hongbo Sun, Jiahuan Zhou, Xiangteng He, Jinglin Xu and Yuxin Peng
Proceedings of the 33rd International Joint Conference on Artificial Intelligence (IJCAI), Jeju, South Korea, Aug. 3-9, 2024. (CCF A)[Paper] [Code]

Dual-Modal Adaptive Online Prompting

Dual-Modal Adaptive Online Prompting and Knowledge Retention for Test-Time Adaptation

Zichen Liu, Hongbo Sun, Yuxin Peng and Jiahuan Zhou
Proceedings of the 38th AAAI Conference on Artificial Intelligence (AAAI), Vancouver, Canada, Feb. 20-27, 2024. (CCF A) [Paper]

HCL

HCL: Hierarchical Consistency Learning for Webly Supervised Fine-Grained Recognition

Hongbo Sun, Xiangteng He, Jinglin Xu and Yuxin Peng
IEEE Transactions on Multimedia (TMM), Vol. 26, pp. 5108–5119, 2024. (中科院SCI一区Top期刊) [Paper] [Code] [CCF多媒体专委会报导]

Fine-Grained Visual Prompt Learning

Fine-Grained Visual Prompt Learning of Vision-Language Models for Image Recognition

Hongbo Sun, Xiangteng He, Jiahuan Zhou and Yuxin Peng
Proceedings of the 31st ACM International Conference on Multimedia (ACM MM), Ottawa, Canada, Oct. 29-Nov. 3, 2023. (CCF A) [Paper]

SIM-Trans

SIM-Trans: Structure Information Modeling Transformer for Fine-grained Visual Categorization

Hongbo Sun, Xiangteng He and Yuxin Peng
Proceedings of the 30th ACM International Conference on Multimedia (ACM MM), Lisbon, Portugal, Oct. 10-14, 2022. (CCF A, Oral) [Paper][Code]

📖 教育经历

  • 2019.09-2024.07  北京大学  计算机应用技术  博士
  • 2016.09-2019.01  天津大学  信息与通信工程  硕士
  • 2012.09-2016.07  天津大学  电子信息工程   本科

🎖 奖励与荣誉

  • 入选2025年度北京“高创计划”青年人才托举工程
  • 获2024年北京图象图形学学会(BSIG)优秀博士学位论文奖
  • 2019, 2020年国际视频分析权威评测TRECVID视频样例搜索比赛,均获第一名
  • 京东方(BOE)创新挑战赛全国总决赛三等奖,京东方(BOE)创客实验室Special Offer

📝 学术服务

  • AAAI程序委员会委员
  • 国际顶级会议和期刊(CVPR、ICCV、AAAI、IEEE TMM等)审稿人