1、采集互联网上的信息,使用阿里大数据工具,对业务中的各类文本数据(图书内容、评论、搜索词等)进行挖掘、建模; 2、负责NLP基础算法研究工作,包括并不限于文本分类、主题/关键词/标签抽取、纠错、语义标注、自动摘要生成、知识图谱、基础知识库整理等; 3、参与NLP算法模型的构建、维护、部署和评估,通过自然语言处理、深度学习等技术提升文学产品内外部用户阅读和写作的体验。 职位描述 1、熟悉常用机器学习算法。自然语言处理、文本挖掘、机器学习、深度学习等相关专业的硕士/博士硕士,在该方向有3年以上经验。 2、扎实的编程基础,精通java或Python等,熟悉大规模数据处理平台Hadoop/Spark/ODPS等,熟悉主流深度学习工具TensorFlow/Caffe/MXNet/等; 3、具备很强的自我驱动与结果导向意识,具备创新能力,具备很强的团队协作意识和能力。 4、在顶级机器学习和AI领域会议和期刊有论文发表的优先