高级/资深算法工程师 (J250627017)
Didi
Beijing, China
Posted on Jul 1, 2025
职位描述
参与滴滴智能客服的对话算法工作,需要具备扎实的算法功底,结合业务场景,构建下一代客服 Agent,驱动服务体验与效率提升。
工作内容:
1、负责滴滴智能客服 Agent 底层的模型设计与训练工作,与产品、工程团队合作;
2、实施客服领域大模型的后训练工作,如大规模数据建设、Post-Training、偏好对齐等技术;
3、应用 Post-Training 方向前沿算法和框架,持续提升现有算法的效率与效果,解决领域模型的指令遵循、话术偏好、幻觉问题等;
4、关注行业前沿,推进有价值的技术与业务场景的结合,探索创新方法,推动技术创新。
任职要求
1、计算机科学、数学、统计学或相关领域的硕士及以上学历,良好的 Python 工程能力,精通数据结构和常用算法;
2、有丰富的 Post-Training 经验,熟悉主流大模型训练框架,并具备二次开发能力(如 Pytorch、Megatron、DeepSpeed 等),能根据领域算法建模实现合适的工作流和训练方法;
3、具备一定的强化学习经验,能实现对奖励信号的建模并能结合场景灵活应用,熟悉 OpenRLHF、verl 等强化学习框架;
4、对前沿新兴科技有高度好奇心与洞察力,学习能力强,能够主动发现问题并自主推进研究,从全局深度思考问题。
加分项:
1、主导过大模型实际落地应用项目者尤佳;
2、熟悉评测工程、数据合成等技术者尤佳;
3、有智能客服、对话系统、语音机器人等经验者尤佳。