商汤科技招聘大语言模型算法研究员

导语该岗位需要计算机科学、数学、统计学或相关领域的硕士学位,至少3年相关工作经验。具体报名方式,详见正文。

  【岗位职责】

  作为大语言模型算法研究员,你将参与“商量SenseChat”基座模型的核心关键技术研发,持续提升模型的通用人工智能能力,并支持重点行业头部客户的大模型业务落地;在这里你也会有与行业内顶尖专家交流合作的机会,共同挑战通用人工智能的技术边界。

  与数据团队合作,筛选、清理与标注用于训练的数据集。

  通过模型预训练、SFT、RLHF等流程持续提升模型的性能与安全性。

  跟踪最新的LLM等通用大模型研究,以改进和创新模型架构和应用场景。

  与产品开发团队紧密合作,将训练好的模型集成到公司产品中。

  编写技术文档,记录模型架构、训练过程及性能评估。

  【岗位要求】

  计算机科学、数学、统计学或相关领域的硕士学位。

  至少3年相关工作经验,具有在生产环境中训练深度学习模型的经验。

  熟悉Python编程语言以及深度学习框架,如TensorFlow或PyTorch。

  对NLP和机器学习算法有深入理解,包括但不限于BERT、GPT、Transformer等。

   具有使用大规模数据集进行分布式训练的经验。

   良好的数据分析和问题解决能力。

   强大的沟通技巧和团队合作精神。

  【优先条件】

  博士学位持有者或具有相关领域的研究背景。

  有进行超大规模机器学习任务的经验。

  具备生产级别系统设计和架构的知识。

  发表过相关领域的研究论文或参与过开源项目。

  报名邮箱:zhangjunyu@sensetime.com

  base:深圳,香港,北京,上海

温馨提示:微信搜索公众号【本地宝深圳招聘】,关注后在对话框内回复【上市公司】可获取深圳上市公司最新招聘信息、报名+附件下载入口、岗位表等。

点击关注本地宝
返回首页

推荐排行

最新阅读


反馈 提问