【崗位職責(zé)】:
1、負(fù)責(zé)強(qiáng)化學(xué)習(xí)算法的研究、開發(fā)和應(yīng)用,解決實(shí)際問題并提升業(yè)務(wù)效果;
2、設(shè)計(jì)和實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)模型,包括但不限于價(jià)值迭代、策略梯度、模型預(yù)測控制等算法;
3、對(duì)現(xiàn)有強(qiáng)化學(xué)習(xí)算法進(jìn)行優(yōu)化和改進(jìn),提高算法的穩(wěn)定性和收斂速度;
4、與數(shù)據(jù)工程師和產(chǎn)品團(tuán)隊(duì)合作,將強(qiáng)化學(xué)習(xí)算法集成到產(chǎn)品和服務(wù)中;
5、跟蹤強(qiáng)化學(xué)習(xí)領(lǐng)域的最新研究進(jìn)展,不斷探索和創(chuàng)新,推動(dòng)公司技術(shù)發(fā)展;
6、參與撰寫技術(shù)文檔,為團(tuán)隊(duì)提供算法知識(shí)和技能培訓(xùn);
7、參與項(xiàng)目的需求分析、方案設(shè)計(jì)和技術(shù)評(píng)審。
【任職要求】:
1、計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)或相關(guān)專業(yè)碩士及以上學(xué)歷,有3年以上強(qiáng)化學(xué)習(xí)算法開發(fā)經(jīng)驗(yàn);
2、熟悉強(qiáng)化學(xué)習(xí)的基本理論和算法,如Q-Learning、SARSA、Deep Q-Network (DQN)、Policy Gradient等;
3、具備扎實(shí)的數(shù)學(xué)基礎(chǔ),包括概率論、統(tǒng)計(jì)學(xué)、線性代數(shù)等;
4、熟練掌握至少一種編程語言,如Python,并熟悉TensorFlow、PyTorch等深度學(xué)習(xí)框架;
5、具備良好的科研能力,有在相關(guān)領(lǐng)域發(fā)表過論文者優(yōu)先;
6、具備良好的邏輯思維能力和問題解決能力,能夠獨(dú)立分析和解決復(fù)雜問題;
7、有實(shí)際應(yīng)用強(qiáng)化學(xué)習(xí)算法解決復(fù)雜問題的經(jīng)驗(yàn),如游戲、機(jī)器人控制、自動(dòng)駕駛等;
8、具備良好的團(tuán)隊(duì)合作精神和溝通能力,能夠與不同部門有效協(xié)作;
9、對(duì)技術(shù)創(chuàng)新有熱情,愿意不斷學(xué)習(xí)新知識(shí),適應(yīng)快速變化的技術(shù)環(huán)境。
【公司亮點(diǎn)】:
國企背書、發(fā)展穩(wěn)定、五險(xiǎn)一金、月度補(bǔ)貼、企業(yè)年金、法定假期、項(xiàng)目獎(jiǎng)金、年終獎(jiǎng)金