注意该招聘信息在 100 天前已发布,有可能已失效
0
申请人
【邮储银行】网络爬虫工程师
于 翰竺科技(北京)有限公司 (不限地址)
职位描述:负责爬虫系统的架构设计与开发,负责设计和开发多平台信息的抓取和分析,设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量,实现大规模文本抓取、抽取,网页去重、分类,垃圾过滤,质量识别、解析入库等工作。
任职要求:
熟悉linux平台操作,有2年以上Java开发经验。
使用过spring、spring mvc、mybatis等框架,有扎实的java编程开发基础,有爬虫开发经验。
一年以上Python开发和部署经验,熟悉Mysql/MongoDB/Redis/Rabbitmq开发,基础扎实,编码能力强。
熟悉信息抓取和整合技术,从结构化的和非结构化的数据中获取信息。
有nutch+hbase、heritrix、webmagic抓取经验或者分布式抓取经验者优先,
具备Web挖掘,搜索引擎相关知识,有从事网络爬虫、网页信息抽取工作经验者优先。
有自然语言处理和数据挖掘相关经验的优先。
请注意,暂时不招应届毕业生,谢谢
近期的职位 翰竺科技(北京)有限公司
SPARK开发工程师 at 翰竺科技(北京)有限公司 in 北京
2016-09-21
【邮储银行】hadoop开发 at 翰竺科技(北京)有限公司 in 北京
2016-09-21
【邮储银行】文本挖掘工程师 at 翰竺科技(北京)有限公司 in 北京
2016-09-21
【邮储银行】数据可视化界面展现开发工程师 at 翰竺科技(北京)有限公司 in 北京
2016-09-21