|
个人信息Personal Information
副教授
教师拼音名称:liuzhenghao
电子邮箱:
入职时间:2021-07-12
职务:副教授
办公地点:信息学馆B233,浑南校区。
主要任职:清华大学自然语言处理实验室客座研究员
其他任职:东北大学计划财经处副处长(挂职)
毕业院校:清华大学
研究方向
研究方向主要自然语言处理与信息检索技术,具体但不限于如下方向:
1)大模型自主知识获取技术体系构建。以大模型为核心开展相关性数据合成研究,融合网页、知识库及多模态信息等丰富的外部资源,探索面向多源信息融合的相关性表示学习技术,形成面向多模态语料的向量检索、重排序以及大模型驱动的检索知识利用与检索训练方法体系,有力支持大规模语料环境下的高效检索与知识获取。依托相关研究成果,团队在美国国家标准与技术研究院组织的新冠肺炎文档级检索评测TREC-COVID第二轮任务中取得第一名,并被微软应用于其线上商业检索系统(https://blogs.microsoft.com/ai-for-business/biomedical-search/)。
2)多模态知识指导的大模型增强技术。围绕多模态数据增强机制开展系统研究,针对检索增强生成中外部知识与模型内部知识之间的冲突问题,提出多模态知识指导的大模型增强方法,通过混合知识库调度机制构建“1+1>2”的多模态检索增强融合范式;同时利用多模态大模型的OCR能力,提出首个基于纯视觉理解的检索增强生成方案,显著提升模型在复杂文档场景下的智能解析能力。相关研究成果获得谷歌、三星、Adobe等多家机构引用和应用。知名学者Yann LeCun(图灵奖获得者、美国国家科学院院士)以及Philip S. Yu(ACM/IEEE Fellow)在国际顶级会议中将该工作作为代表性研究进行评价与比较。托校企合作开展成果转化,相关研究显著提升阿里巴巴的文档智能推荐场景中推荐效果(线上A/B测试结果表明提升2.4%),并已应用于阿里巴巴ATA智能文章推荐系统线上平台,同时通过多模态知识指导大模型增强技术通过合成数据技术支持Qwen-3.5多模态基座模型训练,提升其在文档理解与智能处理方面的性能3%。
3)检索增强智能体协同优化框架。面向垂直领域数据稀缺与模型优化难题,构建检索增强生成训练一体化沙盒,实现以大语言模型为基础的数据合成与评测框架,通过数据差分奖励机制实现检索增强智能体的数据供需关系对齐,显著提升检索知识向生成能力的高效转化。依托相关研究成果,合作研发端侧大语言模型MiniCPM的检索增强生成组件,相关模型在HuggingFace平台累计下载量超过38万次。相关研究成果皆以UltraRAG开源工具形式进行发布,其为首个基于模型上下文协议的检索增强生成框架,累计获得超过5.5k星标。相关技术已成功转化应用于清华大学大模型驱动的学生AI成长助手“清小搭”中,显著提升大模型知识增强应用场景与应用范围。

