申请人
【datapark数据公园】诚招数据抓取和处理工程师
于 datapark数据公园 (不限地址)
数据抓取和处理工程师
数据公园简介:
1. 快速发展的创业型公司
2. 做最专业的设计创新趋势大数据分析平台
3. 均是硕博以上学位的研究团队
我们需要你:
1. 负责设计和开发分布式的网络爬虫应用,包括调度、抓取、入库等内容,进行互联网相关信息的抓取和分析;
2. 实现大规模文本、图像数据的抓取、抽取,去重、分类,垃圾过滤,质量识别、解析入库等工作 ;
3. 网络爬虫架构设计、功能开发及优化;
4. 网页信息抽取等核心算法的研究和优化。
我们希望你:
1. 本科及以上学历,计算机相关专业,具备2年及以上开发项目经验;
2. 掌握网络爬虫开发原理,对互联网各种类型数据交互模式熟悉,知道如何处理需登录网站、动态网页等各种情况下的数据采集方法;
3. 精通html语言,熟悉开源工具,熟悉基于正则表达式、XPath等的信息抽取技术;
4. 有网络爬虫开发经验、有scrapy等开源抓取工具开发经验优先;
5. 至少精通Java/Python一种语言;
6. 熟悉至少一种关系型数据库(Mysql等),熟悉Nosql,hbase等技术优先。
你将加入这样一群人:
1. 很年轻,我们喜欢挑战,总在不断自我超越
2.有理想,为了共同的价值观我们一直在努力
3. 爱技术,我们对技术充满热情
4.爱分享,我们追求自由、开放、透明化.
工作环境:
1. 妹纸多,美女多,才华与气质并存
2. 丰富的活动(羽毛球、踢毽子、奥林匹克夜跑)
3. 美味零食、果盘
4. 轻松工作环境、弹性工作制度
我们的福利:
1. 振奋人心的发展机会,难以抗拒的福利条件
2. 透明化的工资制度,每年两次加薪升职机会
3. 五险一金,带薪假期、免费体检等等
薪资:12-20k,外加期权
简历请投zhouyixin@datapark.cn
近期的职位 datapark数据公园