爬蟲(chóng)工程師
1.5-2.5萬(wàn)元/月崗位職責(zé):
1、設(shè)計(jì)分布式網(wǎng)絡(luò)爬蟲(chóng)系統(tǒng),支持多平臺(tái)廣告素材的抓?。ㄈ缇W(wǎng)頁(yè)、APP、API接口)。
2、開(kāi)發(fā)廣告素材解析模塊,提取關(guān)鍵信息
3、優(yōu)化爬蟲(chóng)算法,提升抓取效率、數(shù)據(jù)處理與清洗
4、對(duì)抓取的廣告素材進(jìn)行結(jié)構(gòu)化處理(如分類、去重、標(biāo)簽化)
5、清洗低質(zhì)量數(shù)據(jù)(如模糊圖片、重復(fù)文案),確保數(shù)據(jù)準(zhǔn)確性。
任職標(biāo)準(zhǔn)
1、編程語(yǔ)言:精通Python(主流選擇)或Java,熟悉異步編程(如asyncio)及多線程/多進(jìn)程技術(shù)。
2、爬蟲(chóng)框架:熟練使用Scrapy、WebMagic等開(kāi)源框架,或具備自主研發(fā)框架經(jīng)驗(yàn)。
3、數(shù)據(jù)處理:掌握Pandas、NumPy等庫(kù),熟悉MySQL、MongoDB、Redis等數(shù)據(jù)庫(kù)操作。
4、反爬技術(shù):了解TCP/IP、HTTP協(xié)議,熟悉JS逆向、加密算法破解(如RSA、AES)、驗(yàn)證碼識(shí)別(如OCR、深度學(xué)習(xí)模型)。
5、分布式系統(tǒng):熟悉消息隊(duì)列(如Kafka、RabbitMQ)、分布式調(diào)度(如Celery、Airflow)及緩存技術(shù)(如Redis)。

北京朝陽(yáng)區(qū)尚韻文創(chuàng)園2棟
相關(guān)推薦查看更多 >
北京房山區(qū)招長(zhǎng)期工,零工吳擾
200-300元/天北京通州區(qū)招貼磚,5-6十平這樣,大塊的
面議北京通州區(qū)招貼磚,5-6十平這樣,大塊的
100-500元/天北京大興區(qū)招給排水
面議北京通州區(qū)招空調(diào)安裝/維修、通風(fēng)安裝/維修、工地小工/雜工
面議朝陽(yáng)區(qū)
相同職位推薦
企業(yè)招聘
精選職位推薦
北京海淀區(qū)招暖氣管道改造工人加微信了解詳情
1-1.2萬(wàn)元/月北京昌平區(qū)招多聯(lián)機(jī)銅管安裝人員
面議北京石景山區(qū)招管道/通風(fēng)保溫、鐵皮/白鐵保溫
面議北京海淀區(qū)有2個(gè)漏點(diǎn),要求以及,今晚干
面議北京順義區(qū)招安裝車庫(kù)門,卷簾門大工
100-500元/天北京昌平區(qū)日結(jié),不熱,地下室打電錘
面議