崗位職責(zé):
1、負(fù)責(zé)通用認(rèn)知大模型和多模態(tài)大模型(包括十億、百億、千億等參數(shù)量)的設(shè)計、開發(fā)和優(yōu)化,包括但不限于預(yù)訓(xùn)練、SFT、指令微調(diào)、RLHF、Prompt工程、模型評估、模型推理等。
2、緊跟業(yè)界多模態(tài)大模型等方向的進(jìn)展,探索前沿技術(shù),探索前沿技術(shù),形成系統(tǒng)算法/大模型解決方案,指導(dǎo)算法團(tuán)隊研發(fā)落地工作,參與核心認(rèn)知/多模態(tài)大模型的產(chǎn)品開發(fā)(包含但不限于智能客服、智慧營銷等),推動認(rèn)知/多模態(tài)大模型效果達(dá)到行業(yè)前沿,包括智能問答、圖文內(nèi)容生成等。
3、積極探索大語言模型技術(shù)在落地場景中的應(yīng)用,包括但不限于大模型RAG、大模型BI、Multi-Agent智能體應(yīng)用等內(nèi)容。
崗位要求:
1、認(rèn)知/多模態(tài)大模型理解/生成、機(jī)器學(xué)習(xí)/深度學(xué)習(xí)等計算機(jī)相關(guān)專業(yè)獲得碩士學(xué)位,博士優(yōu)先,發(fā)表過大模型相關(guān)研究AI定會論文優(yōu)先;
2、對大模型和生成式AI有濃厚興趣,對主流模型的原理與應(yīng)用具有深入了解;
3、精通CNN,RNN,Transformer,Bert,ViT等深度學(xué)習(xí)理論算法和優(yōu)化;
4、對認(rèn)知/多模態(tài)大模型訓(xùn)練等有深入理解和實踐,有多機(jī)多卡大模型訓(xùn)練、大模型微調(diào)、從0到1構(gòu)建多模態(tài)大模型(百億參數(shù)以上)等經(jīng)驗者優(yōu)先;
5、精通一種或多種編程語言,如Python,C語言等,熟練掌握主流深度學(xué)習(xí)框架、Python,Tensorflow等;
6、具備較強(qiáng)的團(tuán)隊寫作能力和溝通能力,有較強(qiáng)的學(xué)習(xí)能力和業(yè)務(wù)分析及問題解決能力。
業(yè)務(wù)特性:涉及通用認(rèn)知大模型和多模態(tài)大模型(十億、百億、千億等參數(shù)量)的全流程開發(fā),包括預(yù)訓(xùn)練、SFT、指令微調(diào)、RLHF、Prompt 工程、模型評估、模型推理等。
緊跟多模態(tài)大模型前沿技術(shù),形成系統(tǒng)算法 / 大模型解決方案,參與產(chǎn)品開發(fā)(如智能客服、智慧營銷等),實現(xiàn)智能問答、圖文內(nèi)容生成等功能。
探索大語言模型技術(shù)在不同落地場景(大模型 RAG、大模型 BI、Multi - Agent 智能體應(yīng)用等)中的應(yīng)用。
業(yè)務(wù)挑戰(zhàn):需要不斷追蹤業(yè)界快速發(fā)展的多模態(tài)大模型技術(shù),確保所開發(fā)的模型處于行業(yè)前沿。
處理不同參數(shù)量級的大模型開發(fā)和優(yōu)化工作,對計算資源和技術(shù)能力要求高。
在不同落地場景中應(yīng)用大模型技術(shù)時,需要解決場景適配性和性能優(yōu)化問題