数据是大模型知识与能力的根源,大模型工程实践的本质是数据工程。高质量训练数据、优质指令集、优质评测集在大模型研制与应用过程中扮演着重要角色。建立面向大模型的数据科学是打开大模型黑盒的关键,是引领大模型从只知其然的前牛顿时代走向知其所以然的牛顿时代的关键。大模型的数据科学研究包括语料采集、标注、清洗、合成;建立数据分布、质量与模型性能的内在关系;建立大模型数据质量的理论框架。大模型数据科学具有鲜明的跨学科特色,需要从人文社科领域,如教育学、社会学、认知心理学寻求理论指引。
复旦大学肖仰华教授课题组在国内外较早开展大模型数据科学研究与落地工作,与头部企业建立了紧密的合作关系,研究资源充足。我们诚邀具有优秀学术背景的博士后研究人员加入我们的团队,进行大模型数据科学相关的前沿研究,从数据源头打开大模型黑盒,推动大模型从前牛顿时代发展到牛顿时代。
招聘信息
01招聘岗位
岗位名称:博士后研究人员
研究方向:大模型语料工程(语料分类、评估、合成、配比与优化);大模型指令工程(指令评价、分级、合成、验证与优化);大模型能力溯源与认知诊断;大模型持续学习;大模型复杂推理与思维增强;人文社会科学与大模型交叉研究。
招聘人数:3-5名
工作地点:复旦大学江湾校区
02招聘要求
学历要求:具有计算机科学、人工智能、数学、统计学等相关领域的博士学位,且博士毕业不超过三年。
学术背景:在数据挖掘、数据驱动的AI、自然语言处理、机器学习、深度学习等领域具有扎实的理论基础,熟悉大模型的研究进展及其应用,有发表高水平论文经验或者较强的工程实现能力者优先。
技术能力:熟悉深度学习框架,有大规模语言模型的训练、调优、部署和应用开发经验;有较强的论文写作能力和学术表达能力,能够独立撰写科研论文
其他要求:具有团队协作精神,能够在多学科团队中有效合作;具有较强的学习能力,富有创新精神,能在压力下工作并完成任务。
03岗位待遇
基础年薪30万,入选复旦超级博后或上海市超级博后者基础年薪不低于50万,在此基础上根据研究绩效配比丰厚的奖金(上不封顶),具体待遇根据个人经验和能力面议。
支持申请各种企业、国家、上海市、学校针对博士后的课题资金、研究经费及长期职业发展机会,累计基金预期可达百万。
具有较丰富的算力资源,按承担项目支持所需算力。
支持产出丰富的学术论文成果,预计产出10篇 CCF-A类会议论文,提供充足的funding可支持国内外学术交流与合作。
提供的大量产业合作机会,团队与华为、阿里、蚂蚁等国内一线大模型团队具有密切合作,研究成果落地预期产生巨大商业价值。
提供团队支持,每名博士后配套复旦大学优秀硕士生或本科生8人左右。
04应聘方式
有意向者请将应聘材料电子版(个人简历含近照、学历学位证明)发送至邮箱:zhuli@fudan.edu.cn【邮件标题请注明“博士后应聘+姓名”。】