职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责
紧跟业界大模型与文本生成技术,推进公司大模型工程化及业务场景落地,包括但不限于:
1. 跟进和探索大模型相关的前沿研究;进行大模型在领域上的实际场景研究、效果提升等;
2. 深度参与公司大规模预训练模型研发,包括相关的数据处理与构造,架构设计、训练、微调和推理等环节的系统性研究;
3. 模型预训练;大模型性能测试;推动相关算法在公司项目中实际落地;
4.
参与预训练大模型(如 prompt 调优、大模型指令微调、多机多卡训练、模型蒸馏与量化等)、可控文本生成(如大纲生成、报告生成、文案辅助写作等)、智能问答与对话生成(如多轮对话、机器阅读理解、文档智能问答等)
任职要求
1. 硕士及以上学历,计算机相关专业,熟练掌握NLP和ML基础理论和算法,有NLP相关科研经历,熟练掌握Transformer系列模型架构和原理;
2. 熟练使用Python语言进行编程开发,熟练使用PyTorch、TensorFlow、JAX等至少一种深度学习框架;有较强的算法工程能力;熟悉生成式大模型及文本生成算法原理,有算法落地实践经验;
3. 熟练使用Megatron-LM、DeepSpeed、Colossal-AI等至少一种模型训练框架,掌握模型并行、流水线并行、数据并行和ZeRO等并行训练技术;
4. 熟悉大模型推理优化技术,包括但不限于layer fusion、kernel fusion和量化等技术;
5. 具备优秀的分析和解决问题的能力,良好的沟通、学习及自驱能力;敢于挑战,有创新精神和研发热情;
6. 在ACL、EMNLP、SIGIR等相关顶会有论文发表及竞赛获奖者优先;
工作地点
地址:深圳福田区深圳-福田区万利工业大厦2期A座
![](http://img.jrzp.com/jrzpfile/rcw/SearchJob/images/jg.png)
![](https://img.jrzp.com/images_server/comm/nv1921.png)
职位发布者
李玉花HR
香港优充技术有限公司
![](http://img.jrzp.com/jrzpfile/provincercw/images/sfrz_yrz.png)
-
行业未知
-
1-10人
-
外商独资·外企办事处
-
Room D,10/F, Tower A, Billion Centre,1 Wang Kwong