工作內(nèi)容:
1、數(shù)據(jù)處理:迭代及維護(hù)數(shù)據(jù)清洗、數(shù)據(jù)加工、數(shù)據(jù)轉(zhuǎn)換流程,監(jiān)控流程中的異常情況,及時(shí)響應(yīng)并解決問題。
2、算子部署:負(fù)責(zé)數(shù)據(jù)生產(chǎn)過程相關(guān)算子部署及pipeline的構(gòu)建。
3、算子研發(fā):負(fù)責(zé)構(gòu)建啟發(fā)式規(guī)則算子解決指定問題,迭代優(yōu)化至可用;參與模型算子研發(fā),支持調(diào)優(yōu)實(shí)驗(yàn)。
4、數(shù)據(jù)分析:分析文本/多模數(shù)據(jù)中的質(zhì)量問題,分析算子在文本/多模數(shù)據(jù)上的效果,支持算子研發(fā)/優(yōu)化的決策指定。
崗位要求:
1、計(jì)算機(jī)相關(guān)專業(yè)本科及以上學(xué)歷,1年以上Python開發(fā)經(jīng)驗(yàn)。
2、熟練掌握Python語言,了解Python的常用框架和庫,如Django、Flask、Pandas等。
3、熟悉Hadoop及其生態(tài)圈組件,包括但不限于HDFS、MapReduce、Spark等。
4、熟悉Linux操作系統(tǒng),能夠使用Shell腳本進(jìn)行日常運(yùn)維。
5、有1年以上NLP項(xiàng)目或大數(shù)據(jù)項(xiàng)目開發(fā)經(jīng)驗(yàn)。
6、有機(jī)器學(xué)習(xí)算法、NLP算法、多模態(tài)算法經(jīng)驗(yàn)者優(yōu)先。
7、熟練使用Git等版本控制工具,具備良好的代碼管理習(xí)慣。