大模型算法工程师

社招上海Full-time

职位概述

作为大模型算法工程师,您将负责设计和优化大规模语言模型,为不同行业客户提供定制化的AI解决方案。您需要深入理解深度学习技术,并能够根据云端和私有化部署的不同需求,设计高效的模型架构。

工作职责

  1. 主导大模型架构设计与选型,依据云端和私有化部署的不同特性,量身定制高效运行的模型方案。

  2. 深入开展模型训练优化工作,凭借对深度学习前沿技术的深刻理解,灵活运用超参数调整、创新预训练任务设定等手段,不断提升模型的准确性、召回率等关键指标,以满足不同行业客户的精准需求。

  3. 设计与开发数据采集与标注管线,保障数据与模型的完美适配。

任职要求

基本要求

  1. 本科及以上学历,计算机科学、数学、统计学等相关专业背景,具备扎实的数学基础和算法理论知识。

  2. 精通至少一种主流深度学习框架,如 TensorFlow 或 Transformer。

  3. 对大模型领域有浓厚兴趣,熟悉常见大模型架构及其应用场景,并有实际的大模型项目实践经验。

加分项

  1. 有相关领域的开源项目、竞赛获奖、顶会论文发表经历。
申请方式

立即填写在线申请表单:

立即填写表单

我们期待与您一起打造下一代 AI 技术!