一、数据库系统
数据库系统是数据存放的载体,被用来存储和检索大量的数据信息,已成为当今每个企业必不可少的组成部分。研究组承担国家重点研发计划课题、华为高斯数据库技术合作项目、CCF-华为数据库创新研究计划、阿里巴巴达摩院AIR创新研究计划等项目。具体研究方向包括:云原生数据库、新硬件数据库、事务并发处理、图数据库等。在SIGMOD、VLDB、ICDE、PPoPP等CCF A类会议上发表论文30余篇。与华为、阿里巴巴等企业合作解决实际问题,攻关数据库系统的关键核心技术。
承担项目:
“基于非易失内存的数据库存储系统”,国家重点研发计划课题,2023YFB4503601,课题负责人,2023.12-2026.11
“单调图计算的理论与系统”,国家自然科学基金面上项目,项目负责人,2021.01-2024.12
“存算分离架构下分布式页面缓存管理策略的研究与实现”,CCF-华为胡杨林基金挑战课题,项目负责人,2023.06-2024.05
“基于无协调强一致性技术的多主架构云原生数据库”,CCF-华为胡杨林基金,项目负责人,2022.09-2023.10
“超大规模动态图数据的增量计算技术研究”,阿里达摩院AIR创新研究计划,项目负责人,2022.01-2023.12
“自动增量图计算框架的研究与实现”,阿里达摩院AIR创新研究计划,项目负责人,2021.01-2021.12
“面向跨区域高可用的Coordination-Free分布式事务处理机制”,CCF-华为数据库创新研究计划,项目负责人,2020.10-2023.9
二、大模型训练推理加速
对于以transformer decoder为基础架构的大模型来说,预训练任务是“根据输入的上文来预测下一个词”,该任务本质是一个分类任务,分类的类别数是词表中词的数量,通常是一个几万类分类任务。模型前向/反向传播一次只利用句子中的一个字计算loss。如果某个句子长度是n,那么需要对这个句子前向/反向传播n次,显然这种训练模式从计算量上来考虑是无法接受的。研究组承担国家万人计划青年拔尖人才资助项目、国家自然科学基金重点项目、华为中央研究院技术合作项目等项目。具体研究方向包括:大模型推理加速、大模型的图检索增强生成、基于新硬件的大模型加速、图模型的训练加速等。在SIGMOD、VLDB、ICDE等CCF A类会议上发表论文30余篇。与华为、阿里巴巴等企业合作解决实际问题,攻关大模型推理加速的关键核心技术。
承担项目:
“支撑大规模图神经网络模型的分布式训练系统”,国家级青年人才计划特殊支持项目,项目负责人,2022.11-2025.10
“面向图学习的分布式原生图存储和计算方法研究”,国家自然科学基金重点项目,子课题负责人,2023.1-2026.12
“统一图计算框架”,华为中央研究院技术合作项目,项目负责人,2021.7-2022.7
扫描查看移动版
校址:辽宁省沈阳市和平区文化路三巷11号 | 邮编:110819