職位描述:
1. 負(fù)責(zé)公司的整體AI能力的基礎(chǔ)建設(shè),針對(duì)特定場(chǎng)景對(duì)大模型進(jìn)行微調(diào),大模型訓(xùn)練和效果優(yōu)化;
2. 負(fù)責(zé)AI大模型在各業(yè)務(wù)的應(yīng)用場(chǎng)景適配;
3. 負(fù)責(zé)AIGC相關(guān)的應(yīng)用研發(fā)工作,包括大模型微調(diào)、指令精調(diào)、RAG、AI Agent等,并且負(fù)責(zé)相關(guān)算法的應(yīng)用落地;
4. 管理和處理大規(guī)模數(shù)據(jù)集,用于模型訓(xùn)練和評(píng)估;
5. 持續(xù)監(jiān)控和優(yōu)化系統(tǒng)性能,根據(jù)實(shí)際使用反饋進(jìn)行迭代改進(jìn);
6. 部署和維護(hù)AI應(yīng)用系統(tǒng),確保其穩(wěn)定性、安全性和可擴(kuò)展性;
7. 關(guān)注前沿技術(shù)發(fā)展,緊跟AI相關(guān)領(lǐng)域最新論文及著述,并將最新的研究成果應(yīng)用于實(shí)際項(xiàng)目中;
職位要求:
1. 計(jì)算機(jī)、人工智能或相關(guān)專業(yè)研究生及以上學(xué)歷,有微調(diào)、強(qiáng)化學(xué)習(xí)等相關(guān)研究或項(xiàng)目經(jīng)驗(yàn);
2. 深入理解AI大模型,對(duì)大模型技術(shù)及數(shù)據(jù)有深刻認(rèn)知,對(duì)數(shù)據(jù)質(zhì)量和模型性能的影響敏感;
3. 掌握訓(xùn)練大模型的訓(xùn)練流程(SFT/RW/RLHF);
4. 熟練掌握TensorFlow、PyTorch、Paddle等深度學(xué)習(xí)框架,有豐富的調(diào)參和調(diào)優(yōu)經(jīng)驗(yàn);
5. 熟悉數(shù)據(jù)數(shù)據(jù)的標(biāo)注和質(zhì)檢工作,根據(jù)標(biāo)準(zhǔn)規(guī)則對(duì)模型結(jié)果進(jìn)行標(biāo)注、質(zhì)檢、驗(yàn)收;
6. 扎實(shí)的理論學(xué)習(xí)功底,熟悉主流強(qiáng)化學(xué)習(xí)算法,如DQN、PPO、SAC等;
7. 了解數(shù)據(jù)并行,張量平行等相關(guān)分布式訓(xùn)練方法,熟悉常用大模型分布式框架例如deepspeed,Megatron-LM;
8. 有NLP或大模型相關(guān)項(xiàng)目經(jīng)驗(yàn),有大模型推理優(yōu)化相關(guān)經(jīng)驗(yàn),了解ChatGLM、LLaMA等相關(guān)模型原理;
9. 使用框架(如Langchain、Llama、Qwen-Agent等)整合智能體(Agent)與大模型檢索增強(qiáng)生成技術(shù)(RAG)的開發(fā);
10. 具備良好的團(tuán)隊(duì)合作精神和溝通能力,有醫(yī)療領(lǐng)域項(xiàng)目經(jīng)驗(yàn)、發(fā)表過頂會(huì)論文者優(yōu)先;