注意该招聘信息在 100 天前已发布,有可能已失效
0
申请人
爬虫工程师
于 systex.com in 广州
岗位职责:
1、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析;
2、负责网页信息抽取、数据清洗等研发和优化工作;
3、负责抓取数据和信息深度提取&挖掘。
任职资格:
1、2年以上工作经验,熟悉linux平台开发,熟悉Python/Java,热爱python编程;
2、熟悉网页抓取原理及技术,熟悉正则表达式,从结构化的和非结构化的数据中获取信息;
3、了解hbase/Mongodb/Redis,有过海量数据存储经验优先;
4、有Lucene、Solr相关技术研发经验者优先;
5、具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先;
近期的职位 systex.com
Spark大数据工程师 at systex.com in 广州
2016-09-06
Java技术经理 at systex.com in 广州
2016-09-06
自然语言处理 实习岗 at systex.com in 广州
2016-09-06