职责
1. 负责字节跳动数据平台Clickhouse/Doris等OLAP产品的SLA系统、灾备系统构建、故障自愈等工作,确保业务的持续可用性。
2. 为所有字节跳动集团用户使用Clickhouse/Doris的业务提供服务,持续提高服务质量和用户体验。
3. 优化oncall服务效率,直接与生产和研发团队合作,推动解决客户问题,并持续优化产品。
4. 负责字节跳动大数据产品的SRE研发、自动化构建和持续迭代,引导产品运维模式向数字化和智能化方向发展。
资格
1. 计算机相关专业,本科及以上学历。
2. 在大数据OLAP领域拥有3年或以上的SRE运维工作经验,熟悉OLAP运维系统构建和稳定性保障。熟悉一个或多个开源组件,如:Clickhouse/Doris/StarRocks/K8s/Spark/Presto/Hadoop等,有实际的大数据商业应用开发和运维经验者优先。
3. 熟悉Linux、网络和其他系统操作。
4. 具有解决大数据产品问题的实际工作经验,对在线大数据产品问题有清晰的故障排查思路,能够快速定位问题。
5. 熟悉至少一种编程语言,包括但不限于:Shell、Python、Java、Scala等。
6. 具备良好的沟通、团队合作和自我驱动能力,推动跨团队合作。
原始职位:大数据SRE运维专家,发布于GrabJobs ©。如有任何问题,请使用GrabJobs上的“举报职位”按钮。