職位描述:
1. 負責公司的整體AI能力的基礎建設,針對特定場景對大模型進行微調(diào),大模型訓練和效果優(yōu)化;
2. 負責AI大模型在各業(yè)務的應用場景適配;
3. 負責AIGC相關的應用研發(fā)工作,包括大模型微調(diào)、指令精調(diào)、RAG、AI Agent等,并且負責相關算法的應用落地;
4. 管理和處理大規(guī)模數(shù)據(jù)集,用于模型訓練和評估;
5. 持續(xù)監(jiān)控和優(yōu)化系統(tǒng)性能,根據(jù)實際使用反饋進行迭代改進;
6. 部署和維護AI應用系統(tǒng),確保其穩(wěn)定性、安全性和可擴展性;
7. 關注前沿技術發(fā)展,緊跟AI相關領域最新論文及著述,并將最新的研究成果應用于實際項目中;
職位要求:
1. 計算機、人工智能或相關專業(yè)研究生及以上學歷,有微調(diào)、強化學習等相關研究或項目經(jīng)驗;
2. 深入理解AI大模型,對大模型技術及數(shù)據(jù)有深刻認知,對數(shù)據(jù)質(zhì)量和模型性能的影響敏感;
3. 掌握訓練大模型的訓練流程(SFT/RW/RLHF);
4. 熟練掌握TensorFlow、PyTorch、Paddle等深度學習框架,有豐富的調(diào)參和調(diào)優(yōu)經(jīng)驗;
5. 熟悉數(shù)據(jù)數(shù)據(jù)的標注和質(zhì)檢工作,根據(jù)標準規(guī)則對模型結果進行標注、質(zhì)檢、驗收;
6. 扎實的理論學習功底,熟悉主流強化學習算法,如DQN、PPO、SAC等;
7. 了解數(shù)據(jù)并行,張量平行等相關分布式訓練方法,熟悉常用大模型分布式框架例如deepspeed,Megatron-LM;
8. 有NLP或大模型相關項目經(jīng)驗,有大模型推理優(yōu)化相關經(jīng)驗,了解ChatGLM、LLaMA等相關模型原理;
9. 使用框架(如Langchain、Llama、Qwen-Agent等)整合智能體(Agent)與大模型檢索增強生成技術(RAG)的開發(fā);
10. 具備良好的團隊合作精神和溝通能力,有醫(yī)療領域項目經(jīng)驗、發(fā)表過頂會論文者優(yōu)先;