曾在意法半导体、UT斯达康等企业工作多年,曾在无锡(滨湖)国家传感信息中心挂职,曾在北卡罗来纳州立大学访学,曾任东北大学物联网工程研究所副所长。编著《物联网无线通信原理与实践》,著《机器学习原理与实践(微课版)》,著《深度强化学习原理与实践》,著《Transformer大模型:原理、实践及应用》。近来提出取代Transformer架构中自注意力机制的Extractor子层及其改进版,有望在缩短运行时长的同时显著提高大语言模型的性能;并解释Transformer架构。
硕士生导师
教师拼音名称:Chen Zhe
联系方式:ml_iot@163.com
学位:博士
毕业院校:Tennessee Tech University
所属院系:计算机科学与工程学院