商汤科技招聘大语言模型算法研究员
导语该岗位需要计算机科学、数学、统计学或相关领域的硕士学位,至少3年相关工作经验。具体报名方式,详见正文。
【岗位职责】
作为大语言模型算法研究员,你将参与“商量SenseChat”基座模型的核心关键技术研发,持续提升模型的通用人工智能能力,并支持重点行业头部客户的大模型业务落地;在这里你也会有与行业内顶尖专家交流合作的机会,共同挑战通用人工智能的技术边界。
与数据团队合作,筛选、清理与标注用于训练的数据集。
通过模型预训练、SFT、RLHF等流程持续提升模型的性能与安全性。
跟踪最新的LLM等通用大模型研究,以改进和创新模型架构和应用场景。
与产品开发团队紧密合作,将训练好的模型集成到公司产品中。
编写技术文档,记录模型架构、训练过程及性能评估。
【岗位要求】
计算机科学、数学、统计学或相关领域的硕士学位。
至少3年相关工作经验,具有在生产环境中训练深度学习模型的经验。
熟悉Python编程语言以及深度学习框架,如TensorFlow或PyTorch。
对NLP和机器学习算法有深入理解,包括但不限于BERT、GPT、Transformer等。
具有使用大规模数据集进行分布式训练的经验。
良好的数据分析和问题解决能力。
强大的沟通技巧和团队合作精神。
【优先条件】
博士学位持有者或具有相关领域的研究背景。
有进行超大规模机器学习任务的经验。
具备生产级别系统设计和架构的知识。
发表过相关领域的研究论文或参与过开源项目。
报名邮箱:zhangjunyu@sensetime.com
base:深圳,香港,北京,上海
温馨提示:微信搜索公众号【本地宝深圳招聘】,关注后在对话框内回复【上市公司】可获取深圳上市公司最新招聘信息、报名+附件下载入口、岗位表等。