关于我。
简历 ↗王斌,MiroMind AI 研究科学家,现居新加坡。2021 年于南加州大学(USC)获博士学位,师从 C.-C. Jay Kuo 教授;2017 年于电子科技大学(UESTC)获工学学士学位。
他的研究沿着一条连续的主线展开:博士阶段聚焦于词、句与知识图谱的表示学习;在新加坡国立大学(NUS)任博士后研究员(Research Fellow)、在新加坡资讯通信研究院(I²R, A*STAR)任科学家期间,转向对话摘要与音频—语言模型;近期在 MiroMind AI 研究智能体推理模型。迄今已在 ACL、EMNLP、NAACL、IEEE TASLP、IEEE TNNLS、ACM KDD 等国际期刊与会议发表六十余篇论文,并多次获得最佳论文奖与优秀论文奖。
他在山东济宁长大,先后在成都、香港、奥沙瓦与洛杉矶求学,最终定居新加坡,并于 2024 年成为新加坡永久居民。下班之后多半是健身、读书、休息,以及对'把生活过得简单、熵低'的一种执念。
智能体与推理模型
在 MiroMind AI 的研究方向,聚焦面向智能体研究的开源模型与框架,在模型规模、上下文长度与交互深度上持续扩展,致力于构建具备可靠工具使用、长程规划与可复现评估能力的通用推理模型。
MiroFlow · MiroThinker · MiroMind-M1 · 综述:100 Days After DeepSeek-R1
音频与多模态大模型
在 I²R, A*STAR 任职期间,曾担任 MERaLiON AudioLLM 团队技术负责人(数据和评测方向),聚焦英语、华语、马来语、泰米尔语及新加坡英语场景中的指令遵循、跨模态对齐与副语言信息理解。
工作
- 05/2025 – PresentAI Research Scientist · MiroMind, Singapore→
构建面向智能体研究的开源模型与推理框架(MiroFlow、MiroThinker、MiroMind-M1)。
- 04/2023 – 04/2025Scientist · Tech Lead (Evaluation & Data), MERaLiON Team · I²R, A*STAR, Singapore→
担任 MERaLiON AudioLLM 团队技术负责人(数据和评测方向),聚焦新加坡国家多模态大模型计划下的东南亚音频-语言模型。
- 09/2021 – 03/2023Research Fellow · National University of Singapore (NUS)→
从事对话摘要、句子表示学习与嵌入评测研究。合作导师:李海洲教授。
- 05/2020 – 08/2020Research Internship · JD AI Research, Mountain View, USA→
研究常识知识图谱的归纳式补全,与斯坦福大学 Jure Leskovec 课题组合作完成。
- 07/2016 – 10/2016Research Internship · Ontario Tech University, Canada→
利用 Kinect 进行三维点云手势识别,用于人机交互;入选 Mitacs Globalink 项目。
教育
- 08/2017 – 05/2021Ph.D. · University of Southern California (USC), Los Angeles, USA→
博士论文聚焦词、句及知识图谱的表示学习。导师:C.-C. Jay Kuo 教授。
- 09/2013 – 07/2017Bachelor · University of Electronic Science and Technology of China (UESTC)→
获本科国家奖学金(2015、2016),四川省优秀毕业生(2017)。
- 08/2015 – 12/2015Exchange Student · City University of Hong Kong (CityU HK)→
本科期间赴港交换一学期。
获奖
- APSIPA Sadaoki Furui Prize Paper Award(2024)
- APSIPA Sadaoki Furui Prize Paper Award(2022)
- 最佳论文奖,SUMEval Workshop(COLING 2025)
- 最佳论文奖,C3NLP Workshop(ACL 2024)
- USC Graduate Student Government Research Travel Grant(2019)
- 四川省优秀毕业生(2017)
- 本科国家奖学金(2015、2016)
- Mitacs Globalink 研究实习项目(2016)
学术服务
- 出版主席,EMNLP 2023
- 领域主席,ACL ARR(2024–2025)
- 编委,APSIPA Transactions on Signal and Information Processing,2023–2025
- 分会主席,IJCNN 2021
- 审稿:Nature Human Behaviour(2022)、IEEE/ACM TASLP、ACL、EMNLP、NAACL、ICASSP、ICME
学生指导
在 I²R(A*STAR)与新加坡国立大学期间指导 10 位以上研究生与实习生,研究方向包括音频大模型、指令微调、长视频理解;多人已进入知名博士项目或业界研究岗位。
- MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents· Technical Report 2025
- MERaLiON-AudioLLM: Bridging Audio and Language with Large Language Models· ACL 2025
- AudioBench: A Universal Benchmark for Audio Large Language Models· NAACL 2025
- SeaEval for Multilingual Foundation Models: From Cross-Lingual Alignment to Cultural Reasoning· NAACL 2024
- Just Rank: Rethinking Evaluation with Word and Sentence Similarities· ACL 2022
- SBERT-WK: A Sentence Embedding Method by Dissecting BERT-based Word Models· TASLP 2020
- Evaluating Word Embedding Models: Methods and Experimental Results· ATSIP 2019
bwang28c@gmail.com