崗位職責(zé):
1. 根據(jù)業(yè)務(wù)需求,研究爬蟲策略和防屏蔽規(guī)則,設(shè)計和開發(fā)分布式爬蟲,支持高并發(fā)多平臺抓取;
2. 負(fù)責(zé)網(wǎng)頁信息抽取、簡單清洗、數(shù)據(jù)入庫等開發(fā);
3. 提升爬蟲穩(wěn)定性及可擴(kuò)展性,充分利用資源,優(yōu)化爬蟲效率和質(zhì)量。
任職資格:
1. 計算機(jī)軟件及相關(guān)專業(yè)本科畢業(yè);
2. 1-3年爬蟲項目開發(fā)經(jīng)驗,優(yōu)秀應(yīng)屆生亦可;
3. 熟悉爬蟲原理及常見的反爬蟲技術(shù),如cookie、js加密、base64等;
3. 熟練運(yùn)用python及多進(jìn)程、多線程開發(fā);
4. 熟練使用scrapy、requests、selenium、pyppeteer等爬蟲包;
5. 熟悉html,正則、xpath等提取技術(shù);
6. 熟悉Mysql、Redis等數(shù)據(jù)庫及相關(guān)操作;
7. 熟悉Linux基礎(chǔ)命令;
8. 有Django/Flask等web框架開發(fā)經(jīng)驗者優(yōu)先。
職位福利:五險一金、年底雙薪、績效獎金、餐補(bǔ)、通訊補(bǔ)助、帶薪年假、補(bǔ)充醫(yī)療保險、定期體檢