崗位職責:
1.參與設計大語言模型應用的技術方案并在交易系統(tǒng)中落地。具型場景包括但不限于多輪對話,DBGPT、結(jié)構化信息抽取、私有函數(shù)調(diào)用、AI Agent等;
2.負責大語言模型應用的端到端研發(fā),包括但不限于方案設計、數(shù)據(jù)準備及處理,行業(yè)模型訓練、指令精調(diào)、模型效果測評等;
3.跟蹤并分析業(yè)內(nèi)最新研究成果和技術動態(tài),復現(xiàn)相關公開研究成果。持續(xù)優(yōu)化和改進相關技術方案
任職要求:
1.計算機相關專業(yè)本科及以上學歷,學歷要求為本科3年/研究生1年以上,有AI項目落地經(jīng)驗;
2.熟練掌握Java、Python等編程語言,具備良好的編碼能力;
3.熟悉大模型基本原理,熟悉多種自然語言處理任務,如問答系統(tǒng)、序列標注、摘要生成及抽取、知識圖譜等,有自然語言處理任務的工程經(jīng)驗;
4.了解NLP主流預訓練語言模型(GPT/LLAMA/T5/PaLM/GLM/Bloom/BERT);
5.了解GPU集群多卡訓練的基本原理,了解高性能GPU集群的部署和調(diào)試;
6.有團隊意識,有良好的文檔習慣和合作意識。
加分項:
1.熟悉transformers算法優(yōu)先;
2.有大模型訓練框架使用經(jīng)驗者優(yōu)先;
3.熟悉Langchain或其他大模型應用開發(fā)框架優(yōu)先。