申请人
【字节跳动】搜索算法/nlp/spider/架构实习生招聘
于 字节跳动 in 北京, 上海
字节跳动搜索部门直招,公司重点业务,大量hc,可转正
搜索算法实习生
【职位介绍】
1、参与ByteDance搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
2、参与今日头条/抖音/TikTok等核心产品的搜索研发工作,服务数亿全球用户;
3、参与搜索核心算法改进,可能的方向包括:
(1)NLP:将业界最先进的NLP技术应用到搜索算法改进中,包括纠错、分词、改写、Term Weighting、意图识别;
(2)Ranking:解决千亿级网页的排序问题,攻克基础检索、相关性、意图理解、权威性、时效性等世界难题;
(3)页面分析和摘要:从千亿网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验;
(4)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。
【职位要求】
1、出色的分析问题、解决问题能力,扎实的代码能力、数据结构和基础算法功底;
2、有机器学习、NLP和数据挖掘基础和开发经验者优先;
3、熟悉Llinux开发环境,熟练使用C++和Python语言;
4、如果你绝顶聪明,总是能7天深入一个全新的领域成为专家,则可以忽略以上所有要求;
5、2020年及以后毕业,实习时间不少于4个月,每周不少于4天;我们希望能有充足的时间培养你,也希望你能充分参与业务做出卓越的贡献。
——————————————————————————
自然语言处理工程师实习生
【职位介绍】
1、监督式学习:分类/匹配/序列标注等,对训练语料收集,清理,标注,特征选择,特征提取,类别体系修改,训练算法改进等;
2、非监督式学习:聚类/词向量/语言模型等,大数据集的处理,应用到线上任务(比如分类训练书记筛选/基础特征等);
3、基础数据结构与核心算法的实现与调优:包括Trie树/自动机/LSM Tree/倒排索引/等基础数据结构,常用算法的C++实现。
【职位要求】
1、对职位描述中的一项或多项工作感兴趣且熟悉,有具体相关经验者优先;
2、具备强悍的编码能力,熟悉Linux开发环境,熟悉Python/C++/Java/Scala语言;
3、优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;
4、2020年毕业者优先,实习时间3个月及以上,每周至少4天。
——————————————————————————
数据抓取实习生
【职位介绍】
1、负责搜索Spider系统的架构设计和核心模块开发;
2、负责搜索Spider分布式计算、调度、抓取、压力控制等模块的设计开发;
3、负责蜘蛛程序的开发优化,基于webkit内核的js渲染引擎;
4、负责网页特征抽取,利用模版或自动化抽取网页特征;
5、负责搜索Spider数据可视化,日常数据分析和监控。
职位要求
【职位要求】
1、计算机或相关专业,本科及以上学历,2020年及以后毕业;
2、优秀的编码与代码控制能力, 有扎实的数据结构和算法功底 ;
3、精通C/C++语言编程,熟悉linux平台、shell编程;
4、每周实习至少3天,可以连续实习3个月以上。
——————————————————————————
搜索架构研发实习生
【职位介绍】
1、参与ByteDance搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
2、参与头条/抖音/TikTok等核心产品的搜索研发工作,服务数亿全球用户;
3、参与搜索核心架构改进,可能的方向包括:
(1)设计开发千亿级网页搜索的数据流、分布式建库、在线检索系统,设计业内领先的检索架构;
(2)设计开发万亿级Spider系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务;
(3)设计开发高可用的搜索引擎稳定性解决方案、自动测试和运维平台;
4、在这里你可以毫无历史包袱地实现自己的架构梦想。
【职位要求】
1、出色的分析问题、解决问题能力;
2、出色的代码能力,出色的数据结构和基础算法功底;
3、有分布式系统基础和开发经验者优先;
4、精通linux开发环境、C++语言、网络和多线程编程;
5、如果你绝顶聪明,总是能7天深入一个全新的领域成为专家,则可以忽略以上所有要求;
6、2020年及以后毕业,实习时间不少于4个月,每周不少于4天;我们希望能有充足的时间培养你,也希望你能充分参与业务做出卓越的贡献。
——————————————————————————
简历投递邮箱:lizhaoxi@bytedance.com
近期的职位 字节跳动