崗位職責
1、負責大模型的數據構建、訓練調優(yōu)及評測迭代,推進大模型技術在業(yè)務場景落地。
2、跟進大模型領域的前沿技術,并將其應用于企業(yè)研發(fā)生產中,持續(xù)提升大模型通用和專用能力。
3、負責大語言模型(LLM)中的對齊技術研究,研究大模型在多模態(tài)和智能體方面的技術創(chuàng)新。
招聘要求
1、自然語言處理/機器學習/模式識別/人工智能/計算機等相關專業(yè)碩士以上學歷,并且具有三年以上人工智能或機器人相關領域的研究開發(fā)工作經驗。
2、在NLP、LLM、深度學習、強化學習方面有一定研究基礎,熟悉主流模型和算法,并有一定的實踐經驗。
3、較強的工程實現(xiàn)能力,熟練掌握C/C++,Python等至少一種語言,熟悉DeepSpeed、Megatron等分布式訓練框架,熟練使用至少一種深度學習框架(如tensorflow,pytorch等)
4、有高質量論文發(fā)表者優(yōu)先(如ACL、EMNLP、NeurIPS、ICML、ICLR等)
5、具備強烈的進取心、自驅力及團隊合作精神,熱衷于追求技術創(chuàng)新