关于我。

王斌，Apodex 研究科学家，现居新加坡。2021 年于南加州大学（USC）获博士学位，师从 C.-C. Jay Kuo 教授；2017 年于电子科技大学（UESTC）获工学学士学位。

他的研究沿着一条连续的主线展开：博士阶段聚焦于词、句与知识图谱的表示学习；在新加坡国立大学（NUS）任博士后研究员（Research Fellow）、在新加坡资讯通信研究院（I²R, A*STAR）任科学家期间，转向对话摘要与音频—语言模型；近期在 Apodex 研究智能体推理模型。迄今已在 ACL、EMNLP、NAACL、IEEE TASLP、IEEE TNNLS、ACM KDD 等国际期刊与会议发表六十余篇论文，并多次获得最佳论文奖与优秀论文奖。

他在山东济宁长大，先后在成都、香港、奥沙瓦与洛杉矶求学，最终定居新加坡，并于 2024 年成为新加坡永久居民。白天和晚上的时间投入在 Apodex；空闲时多半是健身、读书、维护两个开源资源库（音频 AI 与东南亚语言数据），以及对'把生活过得简单、熵低'的一种执念。

研究方向

智能体与推理模型

面向智能体研究的开源模型与框架，在模型规模、上下文长度与交互深度上持续扩展，致力于构建具备可靠工具使用、长程规划与可复现评估能力的通用推理模型。

MiroFlow · MiroThinker · MiroMind-M1 · 综述：100 Days After DeepSeek-R1

音频与多模态大模型

在 I²R, A*STAR 任职期间，曾担任 MERaLiON AudioLLM 团队技术负责人（数据和评测方向），聚焦英语、华语、马来语、泰米尔语及新加坡英语场景中的指令遵循、跨模态对齐与副语言信息理解。

MERaLiON-AudioLLM · AudioBench · MoWE-Audio · IFEval-Audio

多语言与跨文化大模型

面向东南亚语言的跨语言知识对齐、跨文化推理与数据整理研究，与本地及区域性学术和产业机构紧密合作展开。

SeaEval · SEACrowd · CRAFT · CrossIn

经历

工作

05/2025 – Present
AI Research Scientist · Apodex, Singapore→
智能体 AI 与推理模型方向的研究。
04/2023 – 04/2025
Scientist · Tech Lead (Evaluation & Data), MERaLiON Team · I²R, A*STAR, Singapore→
担任 MERaLiON AudioLLM 团队技术负责人（数据和评测方向），聚焦新加坡国家多模态大模型计划下的东南亚音频-语言模型。
09/2021 – 03/2023
Research Fellow · National University of Singapore (NUS)→
从事对话摘要、句子表示学习与嵌入评测研究。合作导师：李海洲教授。
05/2020 – 08/2020
Research Internship · JD AI Research, Mountain View, USA→
研究常识知识图谱的归纳式补全，与斯坦福大学 Jure Leskovec 课题组合作完成。
07/2016 – 10/2016
Research Internship · Ontario Tech University, Canada→
利用 Kinect 进行三维点云手势识别，用于人机交互；入选 Mitacs Globalink 项目。

教育

08/2017 – 05/2021
Ph.D. · University of Southern California (USC), Los Angeles, USA→
博士论文聚焦词、句及知识图谱的表示学习。导师：C.-C. Jay Kuo 教授。
09/2013 – 07/2017
Bachelor · University of Electronic Science and Technology of China (UESTC)→
获本科国家奖学金（2015、2016），四川省优秀毕业生（2017）。
08/2015 – 12/2015
Exchange Student · City University of Hong Kong (CityU HK)→
本科期间赴港交换一学期。

荣誉与服务

获奖

APSIPA Sadaoki Furui Prize Paper Award（2024）
APSIPA Sadaoki Furui Prize Paper Award（2022）
最佳论文奖，SUMEval Workshop（COLING 2025）
最佳论文奖，C3NLP Workshop（ACL 2024）
USC Graduate Student Government Research Travel Grant（2019）
四川省优秀毕业生（2017）
本科国家奖学金（2015、2016）
Mitacs Globalink 研究实习项目（2016）

学术服务

出版主席，EMNLP 2023
领域主席，ACL ARR（2024–2025）
编委，APSIPA Transactions on Signal and Information Processing，2023–2025
分会主席，IJCNN 2021
审稿：Nature Human Behaviour（2022）、IEEE/ACM TASLP、ACL、EMNLP、NAACL、ICASSP、ICME

学生指导

在 I²R（A*STAR）与新加坡国立大学期间指导 10 位以上研究生与实习生，研究方向包括音频大模型、指令微调、长视频理解；多人已进入知名博士项目或业界研究岗位。

发表

60+ 篇论文 · 2500+ 引用

MiroFlow: Towards High-Performance and Robust Open-Source Agent Framework for General Deep Research Tasks· arXiv 2026
MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling· Technical Report 2025
MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization· Technical Report 2025
MERaLiON-AudioLLM: Bridging Audio and Language with Large Language Models· ACL 2025
AudioBench: A Universal Benchmark for Audio Large Language Models· NAACL 2025
CoinMath: Harnessing the Power of Coding Instruction for Math LLMs· Findings of ACL 2025
Resilience of Large Language Models for Noisy Instructions· Findings of EMNLP 2024
SeaEval for Multilingual Foundation Models: From Cross-Lingual Alignment to Cultural Reasoning· NAACL 2024
Knowledge Graph Embedding: An Overview· APSIPA Transactions on Signal and Information Processing, 2024
An Overview on Language Models: Recent Developments and Outlook· APSIPA Transactions on Signal and Information Processing, 2023
Compounding Geometric Operations for Knowledge Graph Completion· ACL 2023
Analyzing and Evaluating Faithfulness in Dialogue Summarization· EMNLP 2022
Just Rank: Rethinking Evaluation with Word and Sentence Similarities· ACL 2022
Graph Representation Learning: A Survey· APSIPA Transactions on Signal and Information Processing, 2020
SBERT-WK: A Sentence Embedding Method by Dissecting BERT-based Word Models· IEEE/ACM TASLP 2020
Evaluating Word Embedding Models: Methods and Experimental Results· APSIPA Transactions on Signal and Information Processing, 2019

完整列表见 Google Scholar ↗

联系

bwang28c@gmail.com