1. 利用自然语言处理技术和机器学习算法对结构化或非结构化文本数据进行挖掘和分析,包括但不限于新词发现、信息抽取、命名实体识别与消歧、文档摘要、文本分类等。 2. 利用机器学习方法进行垂直领域知识图谱的表达与构建。 3. 从算法角度出发对产品特性提出建议或直接驱动和参与产品的设计和规划,持续将算法能力产品化。 职位要求: 1. 1-3 年自然语言处理、机器学习相关工程或研究经验,熟悉常见算法与模型。 2. 具备较强的编码能力,扎实的数据结构和算法功底。 3. 英文文献阅读能力。 加分项: 1. ACM/ICPC,Topcoder 等比赛获奖者。 2. 在 ACL, EACL, NAACL, EMNLP, NIPS, ICML 等会议上发表过学术论文。 3. 熟悉 Apache Hadoop/Spark/Storm 等至少一种分布式系统。
1. 收集和分析行业数据,通过聚类、标注分析等方法提取细分领域特征,理解特定行业场景,结合行业知识与技术团队共同优化算法,指定算法产出效果衡量标准。 2. 参与算法模型搭建和测评体验,能够对算法整体输出效果提出建议。 3. 与产品团队合作,准确把握产品特性与算法效率之间的差异,并参与方案制定。 职位要求: 1. 具备优秀的逻辑能力和数据分析能力,掌握基础的数据分析工具与方法论。 2. 具备出色的沟通能力和执行力,能够与不同背景的人打交道。 3. 具备灵活的数据检索及信息收集能力,以及出色的学习能力。 加分项: 1. 有新闻编辑或信息管理背景。 2. 有基本的脚本语言编程能力,熟悉正则表达式。 3. 有海量数据清洗、标注或处理经验。 4. 英文文献阅读能力。
1. 利用深度学习技术,基于垂直领域海量数据,进行 NLP、IR、数据挖掘等领域深度学习模型构建。 2. 从算法角度出发对产品特性提出建议或直接驱动和参与产品的设计和规划,持续将算法能力产品化。 职位要求: 1. 有大规模文本处理的深度学习实践经验,有 TensorFlow、Caffe、MXNet、Torch 等深度学习框架之一的使用经验。 2. 1-3 年机器学习、深度学习相关工程或研究经验,熟悉基本概念与框架。 3. 具备较强的编码能力,扎实的数据结构和算法功底。 4. 英文文献阅读能力。 加分项: 1. ACM/ICPC,Topcoder 等比赛获奖者。 2. 在 ACL, EACL, NAACL, EMNLP, NIPS, ICML 等会议上发表过学术论文。 3. 熟悉 Apache Hadoop/Spark/Storm 等至少一种分布式系统。
1. 设计和实施构建系统、持续集成系统、自动化测试平台、代码质量管理等系统。 2. 完善服务监控体系,做好报警通知和报表可视化。 3. 负责线上的基础运维,提升业务稳定性。 4. 研发自动化运维平台,提高运维、开发协作效率,规范操作流程。 职位要求: 1. 两年以上开发运维经验, 熟悉至少一种开发语言, 如:Python、Golang,如果是 Python,优先。 2. 深入理解 Linux 系统,具备丰富的 Linux 系统管理经验。 3. 熟悉 Docker 容器技术。 4. 熟悉常用 DevOps 工具,如:Jenkins、Ansible、SaltStack 等。 5. 熟悉常见 Web 系统架构及其优化。 6. 具备使用阿里云、UCloud、腾讯云等国内主流云平台的经验。 加分项: 1. 熟悉容器化编排工具,如 Kubernetes、Docker Swarm 等。 2. 熟悉 gRPC 框架。 3. 熟悉 Sonar 代码质量管理系统。 4. 有类数据库运维经验,如 PostgreSQL、Redis 等,或是有 ElasticSearch 运维经验。 5. 有分布式追踪系统的实施经验,如 Jaeger、Zipkin 等。 6. 有技术博客,在开源社群活跃并有积极贡献者优先。
1. 运用搜索引擎技术,从事系统搜索软件的架构设计及研发,并持续改进相关算法,提高搜索速度和精度。 2. 研究数据的存储、传输,优化系统架构,不断提升系统灵活性及性能。 职位要求: 1. 具备 2 年以上搜索引擎相关的研发经验。 2. 深入理解全文搜索,熟悉倒排索引、中文分词、排序和自然语言处理、Query 分析等相关技术。 3. 熟悉 Lucene/Solr/Elasticsearch 其中一种开源搜索引擎代码结构。 4. 熟悉分布式系统、高并发处理,并有相应的设计开发经验,能够高效地分析计算大量数据。 5. 熟悉 C/C++/Java/Golang 语言中的一种或者多种,对数据结构和算法设计有较为深刻的理解。 加分项: 1. 有大型搜索引擎系统研发经验。 2. 可以对 Lucene/Solr/Elasticsearch 其中一种引擎源码做深入的二次开发。 3. 熟悉 Apache Hadoop/Spark/Storm 等至少一种分布式系统。