1、深入理解数据数据研发的各个系统环节,理解在大规模海量的数据研发工程中的痛点和难点,针对数十万机器的集群和数十万的任务调度,利用机器学习、强化学习的方法优化整个全链路系统,提高系统能力,降低成本; 2、深入理解数据应用系统,包括数据分析、数据决策、数据智能化服务等,利用机器学习和强化学习算法来整体优化大规模海量数据查询请求的执行与计算,降低数据的查询成本,提升数据查询的响应效率; 3、灵活运用和实现类似搜索、推荐、优化等子系统,完成机器学习的模型构建、数据采集和整理、特征抽取以及各种代码编写。不仅能够完成离线的模型训练,而且能够完成线上数据收集、模型部署和系统维护,最终实现各种智能化需求。 职位要求: 1、计算机相关专业硕士及以上学历,6-8年以上互联网行业研发经验; 2、精通Java,熟悉分布式系统开发者优先,熟悉至少一种大规模数据处理平台Hadoop/Spark/ODPS内部工作原理者优先; 3、精通常用机器学习算法,有着丰富的使用机器学习优化系统的经验,熟悉强化学习的优先。 4、具备很强的自我驱动与结果导向意识,具备创新能力,具备很强的团队协作意识和能力。