申请人
触宝科技 BigData Team 开放职位
于 触宝科技 in 上海
触宝大数据组公开职位
触宝的产品每时每刻都在服务于全球数以亿计的用户。触宝大数据组的工作就是将流动在产品和服务中的数据加以利用、产生积极价值。数据能够帮助我们改善设计、做出决定、提升增长从而构建更好的产品。最终,我们坚信数据和技术结合在一起足够让我们从积极的方面改变世界!
在此过程中,大数据组每一个人都有机会在工作中触及计算机科学几乎所有重要的分支:机器学习、数据分析、信息检索、自然语言处理、人工智能、分布式计算、大规模系统设计、网络、数据压缩、信息安全以及用户界面设计等。
以下所有的职位描述仅供参考,因为只要你和我们有一样的目标,以及具备足够的激情、毅力和专业技能,那么我们就需要谈一谈:-D
职位描述
自然语言处理工程师(高级)
职责
• 设计并构建NLP基础平台,用于处理各类NLP任务。
• 构建NLP相关的预测模型,服务于用户画像、推荐、广告等系统。
• 处理海量原始文本数据,提炼文本相关特征。
• 为几乎所有重要语言构建语言模型。
• 测试、评估、监控现有系统和产品的表现。
• 探索、利用最前沿的NLP技术来解决现有的和新的NLP相关问题。
最低需求
• 计算机或相关专业的学士学位。
• 三年以上NLP工业界工作经验。
• 在至少一项NLP任务上有深入经验。
• 有大规模、分布式NLP系统的经验。
• 有使用NLP工具和系统的经验。
• 有数据分析和机器学习的经验。
• 有使用Linux或类似POSIX系统的经验。
• 有Python和Shell的编程经验。
• 流利掌握中文或英文。
• 很强的自我驱动力、结果导向并极具责任感。
• 有激情、毅力,正能量。
• 有良好沟通能力和团队协作精神。
• 有合格的英文能力。
锦上添花的需求
• 有构建输入法引擎、推荐系统或者计算广告系统的经验。
• 有构建分布式计算系统的经验。
• 有神经网络和深度学习方面的经验。
• 有很强的数据结构和算法知识。
• 在NLP,机器学习、信息检索等相关领域有硕士或博士学位。
说明
和其他类型的数据不同,自然语言数据和对它的处理,本身就可以被视为是计算机科学的一个重要分支。使用、处理和理解自然语言也一直是触宝科技的核心任务之一。尽管处理文本数据通常比处理其他数据要难上一个数量级,但文本数据所能揭示的信息比其他数据更有用、更具内涵。随着我们产品和用户的增长,我们需要更多在NLP领域的优秀人才和我们一道更好的利用文本数据,来构建更加智能的系统。
团队或角色:大数据组,工程/研究
工作类型:全职
工作地点:中国上海徐汇区
数据科学家
职责
• 通过分析大规模的数据,发现可以指导产品执行的认知和机会。
• 设计科学合理的指标来衡量产品、服务、特性是否成功。
• 使用数据挖掘和机器学习方法设计和开发能够驱动用户增长、留存、和变现的产品。
• 开发和实施可并行的分类、回归、排序和优化算法。
• 和数据工程师以及其它相关同事一起保证数据驱动的产品的正常运转。
• 负责常规和随机的数据分析需求,并把分析结果用清晰、可执行的语言沟通给相关同事。
最低需求
• 统计、计算机、数学或相关专业的学士学位。
• 2年以上的机器学习、数据挖掘、推荐系统等领域的科研/开发经验。
• 极强的编程能力:具备迅速处理复杂的数据和实现复杂的算法的能力;具备和系统工程师一起迅速实现原型的能力。
• 熟悉或者愿意学习大规模并行计算的方法和工具(如MapReduce, Hadoop, Hive)
• 流利掌握中文或英文。
• 很强的自我驱动力、结果导向并极具责任感。
• 有激情、毅力,正能量。
• 有良好沟通能力和团队协作精神。
• 有合格的英文能力。
锦上添花的需求
• 统计、计算机科学、数学或相关学科的博士或硕士。
• 精通R或Python。
• 熟悉开源机器学习工具、平台或作为贡献者参与过它们的开发。
• 作为第一作者在顶级会议或期刊上发表论文。
团队或角色:大数据组,工程/研究
工作类型:全职
工作地点:中国上海徐汇区
数据工程师
职责
• 构建数据仓库,服务于用户画像、推荐、广告系统等系统。
• 支持运营、销售对业务上相关的需求,提供数据驱动和决策的能力。
• 对用户数据进行高效的ETL,通过数据挖掘构建用户画像。
• 核心类数据的可视化展示。
• 客户端数据收集的相关工作。
最低需求
• 统计、计算机或相关专业的学士学位。
• 2年以上的大数据处理、数据挖掘等相关领域的科研/开发经验。
• 有数据分析的相关工作经验。
• 熟练使用Linux或者类似POSIX系统。
• 熟悉MapReduce, Hadoop, Pig, Spark, HBase, Hive等分布式相关的技术及组件。
• 极强的编程能力:熟练掌握Python,具备迅速处理复杂的数据和实现复杂的算法的能力。
• 流利掌握中文或英文。
• 很强的自我驱动力、结果导向并极具责任感。
• 有激情、毅力,正能量。
• 有良好沟通能力和团队协作精神。
• 有合格的英文能力。
锦上添花的需求
• 数据可视化相关的技术。
• 有机器学习相关方面的经验。
• 有很强的数据结构和算法知识。
• 熟悉Hadoop生态圈的各开源系统。
• 统计、计算机及相关专业的硕士或博士学位。
• 有一定的Android或iOS的开发经验。
团队或角色:大数据组,工程/研究
工作类型:全职
工作地点:中国上海徐汇区
爬虫工程师
职责
• 负责触宝爬虫spider的核心技术研究和开发
• 研究各种网站、网页、链接的形态,发现它们的特点和规律
• 设计各种策略和算法,提升spider的抓取效果
• 分析spider的技术缺陷,对spider做出合理地调整或改进
• 负责spider系统的升级和维护
最低需求
• 具有spider方向工作经验
• 热爱互联网,对探索未知领域,发掘有价值数据有浓厚的兴趣
• 优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情
• 精通Python,熟悉Linux平台、Shell编程
• 对数据结构和算法设计有较为深刻的理解
• 流利掌握中文或英文
• 很强的自我驱动力、结果导向并极具责任感
• 有激情、毅力,正能量
• 有良好沟通能力和团队协作精神
• 有合格的英文能力
锦上添花的需求
• 解析/信息挖掘/统计分析工作经验
团队或角色:大数据组,工程/研究
工作类型:全职
工作地点:中国上海徐汇区
计算广告工程师
职责
• 负责搭建和优化在线广告系统整体架构,能够处理高并发、稳定性的实时海量请求;
• 基于大规模用户行为分析,以效果为目标,建立并优化推荐系统的算法和策略;
• 应用搜索引擎、信息检索、机器学习等技术,针对海量信息建模,挖掘潜在商业价值;
• 提高在线广告的相关性、用户体验、投放效果及变现能力;
• 研究并解决的在线广告生态体系中涉及的各种问题,更好地服务国内外用户和客户;
最低需求
• 计算机或相关专业本科及以上学历;
• 善于学习新知识,动手能力强,良好的沟通能力和推动能力,强烈的进取心;
• 良好的逻辑思维能力和数据敏感度,能够从海量数据中发现有价值的规律;
• 精通任何一种面向对象编程语言,如Python,C/C++或Java;
• 对数据结构和算法设计有较为深刻的理解,具备编写复杂算法的能力;
• 优秀的分析和解决问题的能力,对挑战性问题充满激情;
• 熟悉大规模并行、实时计算的方法和工具(如Hadoop, Hive, Storm等);
• 流利掌握中文或英文;
• 很强的自我驱动力、结果导向并极具责任感;
• 有激情、毅力,正能量;
• 有良好沟通能力和团队协作精神;
• 有合格的英文能力;
锦上添花的需求
• 具备搜索引擎、广告投放相关技术的知识和经验;
• 熟悉大规模数据挖掘、机器学习、分布式计算等相关技术,具备实际工作经验;
• 具有互联网公司数据挖掘、推荐、广告、自然语言处理等相关工作经验;
团队或角色:大数据组,工程/研究
工作类型:全职
工作地点:中国上海徐汇区
算法工程师(输入法引擎)
职责
• 设计并实现客户端和服务器端的输入法引擎。
• 设计评价输入法引擎效率和性能的方法。
• 使用用户体验数据提取引擎相关的数据,并使用数据来提升输入法引擎的用户体验。
• 设计并实现输入法引擎的测试方法和测试框架。
• 提供多语言,多个国家地区的输入法引擎功能。
最低需求
• 计算机或相关专业的学士学位。
• 至少两年C/C++编程经验。
• 具有复杂数据结构和算法的设计、实现能力,至少具备一次相关项目经验。
• 具有一定的数据分析,建模的能力,至少具备一次应用数据解决问题的经验。
• 熟练使用Linux。
• 熟练使用Python和Shell。
• 流利掌握中文或英文。
• 很强的自我驱动力、结果导向并极具责任感。
• 有激情、毅力,正能量。
• 有良好沟通能力和团队协作精神。
• 有合格的英文能力。
锦上添花的需求
• 具备自然语言处理,机器学习的相关知识,深刻理解相关基础算法。
• 具有设计,实现输入法引擎的经验。
• 对语言模型有深入的理解。
职位描述
服务器后端工程师
职责
• 负责设计触宝大数据平台相关子系统的架构及其实现
• 针对触宝大数据业务需求,修改hadoop生态环境的开源组件
• 优化触宝大数据平台数据产品的安全性、存储效率、吞吐量、平响等业务指标
• 负责数据服务的分布式实现,满足可扩展性等业务指标
最低需求
• 计算机或相关专业的学士学位。
• 有使用Linux或类似POSIX系统的经验。
• 熟练使用Python、java和Shell编程。
• 熟悉操作系统底层,熟悉网络编程
• 流利掌握中文或英文。
• 很强的自我驱动力、结果导向并极具责任感。
• 有激情、毅力,正能量。
• 有良好沟通能力和团队协作精神。
• 有合格的英文能力。
锦上添花的需求
• 具有数据分析、挖掘的经验
• 具有分布式开发的经验
• 参与贡献过开源项目
• 对hadoop/storm/hbase/pig/drill等有很深的理解
• geek
TouchPal BigData Team Job Openings
TouchPal serves hundreds of millions of people all over the world around the clock. TouchPal’s BigData team leverages for good huge amount of data flowing through the services and experience of TouchPal products. Data helps us improve our design, make decisions, increase growth, and build better products. Ultimately, we believe in that data, combined with technology, can enable us to impact the world in a positive way.
By doing such, our people have the opportunities to work with a scope that just touches every major area in computer science, including machine learning, data analysis, information retrieval, natural language processing, artificial intelligence, distributed computing, large-scale system design, networking, data compression, security, user interface design, etc.
All of the following job descriptions are just for your reference: if only you happen to share the same goal with us and have good passion persistence, and expertise, we need to talk :-D
Job descriptions
Engineer, Natural Language Processing
Responsibilities
• Design and build NLP infrastructure for all the fundamental NLP tasks.
• Build NLP related inferential models for user profiling, recommendation, advertising systems and etc.
• Handle and process huge amount of raw textual data for feature engineering.
• Build language models for almost all the significant languages people write.
• Test, evaluate, and monitor the performance of existing systems and products.
• Explore and utilize cutting-edge NLP technologies to form solutions to existing and new NLP related problems.
Minimum Qualifications
• BA/BS in Computer Science or related technical field or equivalent practical experience.
• More than three years industry experience in natural language processing.
• In-depth experience in at least one of NLP tasks such as parsing, language modeling, word embedding and so forth.
• Experience in large-scale/distributed NLP systems.
• Experience in natural language processing tools and systems.
• Experience in data analysis and machine learning.
• Experience in GNU/Linux or similar POSIX systems.
• Experience in programming in Python and shell.
• Fluency in at least one of the languages: Chinese, English.
• Strongly self-driven, result-oriented and responsible.
• Passionate, persistent, and positive.
• Good communication skill and team player.
• Qualified level of English.
Preferred Qualifications
• Experience in input method editors, recommendation systems or computational advertising.
• Experience in building distributed computing systems.
• Experience in Neural Networks and Deep Learning.
• Strong knowledge in algorithms and data structures.
• MSc/PhD degree in NLP, Machine Learning, Information Retrieval or related Computer Science.
Area
Unlike other types of data, natural language data and its processing tasks can be regarded as a branch of computer science in its own right. Using, processing, and understanding natural languages has always been one of the core tasks in TouchPal. Although processing textual data is orders of magnitude more difficult than processing most types of data, it can reveal much more useful and insightful information while other data can’t. As our products and users keep growing, we need more talents in NLP to help us make better use of textual data and build more intelligent systems.
Team or role: BigData, Engineering/Research
Job type: Full-time
Job location: Xuhui, Shanghai, China
Engineer, Backend
Engineer, Data
Engineer, Web Crawling
Engineer, Computational Advertising
Engineer, Algorithms
Data Scientist
Responsibilities
• Analyze large datasets to glean actionable insights and identify emerging opportunities
• Create metrics to measure the success of products, services, and features.
• Use data mining and machine learning skills to design and develop products which drive engagement, growth, retention, and monetization.
• Develop and deploy scalable classification, regression, ranking, and optimization algorithms.
• Work with data engineers and other stakeholders in data products pipeline to enable automation of the data-driven products.
• Communicate both routine and ad-hoc data analysis results in a clear, insightful and actionable way.
Minimum Qualifications
• BA/BS in Statistics, Computer Science, Math or other related technical fields.
• 2+ years prior research, data science, or engineering experience in building and implementing recommender systems, machine learning models/algorithms, etc.
• Excellent programming skills – ability to prototype effective simple or complex algorithms and collaborate with engineering team to implement them in the production system
• Familiarity with or willingness to learn large-scale distributed computing tools (Hadoop, Hive, etc.)
Preferred Qualifications
• PhD or MSc degrees in Statistics, Computer Science, Math or other related technical field.
• Proficient in R or Python.
• Familiar with or have contributed to open source machine learning tools/platforms.
• First author publications in top-tier conferences or journals.
近期的职位 触宝科技