1.負(fù)責(zé)大型語(yǔ)言模型(LLM)的訓(xùn)練和效果優(yōu)化工作,包括但不限于預(yù)訓(xùn)練、微調(diào)、對(duì)齊、數(shù)據(jù)工程、模板工程、解碼優(yōu)化、O1等;
2.與數(shù)據(jù)工程、后端工程等其他團(tuán)隊(duì)密切合作,確保項(xiàng)目高質(zhì)量落地;
3.探索跨模態(tài)的信息對(duì)齊方法,探索多模態(tài)大模型的預(yù)訓(xùn)練、指令微調(diào)、 RLHF等技術(shù),探索多模態(tài)的數(shù)據(jù)質(zhì)量評(píng)估和清洗方法;
4.跟蹤多模態(tài)大模型的前沿探索,將研究成果轉(zhuǎn)化為可落地的產(chǎn)品,推動(dòng)模型效果達(dá)到業(yè)界領(lǐng)先水平。
1.計(jì)算機(jī)科學(xué)、信號(hào)處理、數(shù)學(xué)、軟件工程、電子與通信、自動(dòng)化或相關(guān)領(lǐng)域碩士及以上學(xué)歷,1年以上工作經(jīng)驗(yàn),且具有扎實(shí)的NLP、人機(jī)交互等領(lǐng)域的研究或開(kāi)發(fā)經(jīng)驗(yàn),對(duì)于個(gè)別具備較強(qiáng)NLP/NN技術(shù)能力的應(yīng)聘者不受專業(yè)限制。
2.對(duì)NLP主流預(yù)訓(xùn)練語(yǔ)言模型(如BERT、GPT、T5、PaLM、GLM、Bloom、LLaMA等)有深入了解。
3.熟悉BLIP2、LLaVA、MiniGPT、VisualGLM、Qwen-VL等LMM模型結(jié)構(gòu)及訓(xùn)練方法。
4.熟練掌握Python、C++等至少一種編程語(yǔ)言,熟悉Linux下的編程開(kāi)發(fā)環(huán)境,以及數(shù)據(jù)結(jié)構(gòu)和常見(jiàn)算法。
5.熟悉深度學(xué)習(xí)框架TensorFlow或PyTorch,具有使用Megatron-LM、Deepspeed等大模型訓(xùn)練框架的經(jīng)驗(yàn)者優(yōu)先。
6.具備深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、知識(shí)圖譜等方面的研究經(jīng)驗(yàn)和基礎(chǔ)。
7.熟練掌握Linux基礎(chǔ)命令和操作,能夠獨(dú)立完成集群運(yùn)行環(huán)境的搭建。
8.具有良好的學(xué)習(xí)能力、溝通能力、團(tuán)隊(duì)協(xié)作精神和責(zé)任心。
合肥 - 蜀山
中軟國(guó)際合肥 - 蜀山
中紹宣科技集團(tuán)有限公司合肥 - 蜀山
科大訊飛合肥 - 蜀山
中紹宣科技集團(tuán)有限公司合肥 - 蜀山
科大訊飛合肥 - 蜀山
科大訊飛