研究方向
研究方向主要自然语言处理与信息检索技术,具体但不限于如下方向:
1、信息检索:基于少样本学习的神经网络信息检索方法、面向多模态数据的稠密向量检索方法、面向海量数据的高效索引建模方法;(与卡内基梅隆大学、清华大学合作)
2、知识增强的大语言模型:大语言模型工具智能、面向外源知识的向量建模方法;(与清华大学合作)
3、基于大模型的推荐系统研究:基于商品内容以及大模型实现多模态推荐、序列化推荐;(与阿里巴巴合作)
4、开放域自动问答、事实验证、法律智能:面向客观事实以及法律领域的大模型人类反馈对齐研究、面向大模型的受控生成研究;(与清华大学、微软亚洲研究院合作)
5、面向教育的大语言模型研究:基于教材数据训练面向中小学教育的大语言模型。(与清华大学、北京语言大学合作)
开源项目
1、信息检索开源平台以及应用OpenMatch(网址:https://github.com/OpenMatch)。汇总了组内开源研究。
2、其他部分开源项目(数据截止至2023年8月15日)
项目名称 |
项目地址 |
Star |
Fork |
EntityDUET |
https://github.com/thunlp/EntityDuetNeuralRanking |
152 |
20 |
BERT KPE |
https://github.com/thunlp/BERT-KPE |
424 |
78 |
KernelGAT |
https://github.com/thunlp/KernelGAT |
159 |
34 |
OpenMatch v1.0 |
https://github.com/thunlp/OpenMatch |
442 |
46 |
ConceptFlow |
https://github.com/thunlp/ConceptFlow |
118 |
19 |
