软件开发工程师 – 软件开发运维与持续集成团队

多伦多 12天前全职 网络
64.1万 - 96.2万 / 年
在AMD,你所做的一切改变一切 在AMD,我们的使命是打造出色的产品,加速下一代计算体验——从人工智能和数据中心到个人电脑、游戏和嵌入式系统。基于创新和协作的文化,我们相信真正的进步来自大胆的想法、人类的创造力以及创造非凡事物的共同热情。当你加入AMD时,你会发现真正的差异化因素是我们的文化。我们推动创新的极限,以解决世界上最重要的挑战——在追求卓越执行的同时,保持直接、谦逊、协作,并包容多样化的观点。加入我们,共同塑造人工智能及更广泛领域的未来。一起,我们推动你的职业发展。 职位 AI/ML框架团队正在招聘一名软件开发工程师,以构建和维护可扩展的DevOps基础设施,加速AMD的AI软件开发。你将领导CI/CD管道设计,管理Kubernetes部署,并使用Ansible和Python自动化系统。此职位支持GPU环境,集成监控工具,并实现跨团队的快速、可靠的软件交付。 个人 理想的候选人是一名具有DevOps、站点可靠性或基础设施工程背景的熟练工程师。他们精通Kubernetes、CI/CD工具、脚本(Python/Bash)和基础设施自动化框架,如Ansible。具有GPU计算环境工作经验和集成自动化测试工作流程的经验非常有价值。此人在协作、快节奏的环境中茁壮成长,能够在最小监督下推动技术执行。他们带来解决问题的心态、强大的沟通能力,以及对构建可靠、可扩展系统的热情。 主要职责 - CI/CD管道开发:设计、实施和管理高效的持续集成和交付管道,使用Buildkite、GitHub Actions和Jenkins实现快速和可靠的软件部署。 - Kubernetes基础设施管理:在本地和云平台上部署和维护强大的基于Kubernetes的环境,以支持可扩展的服务编排。 - 基础设施自动化:使用Ansible、Python和Bash自动化基础设施的供应、配置和管理,以提高系统一致性并减少手动干预。 - 使用Helm进行服务部署:使用Helm图表在Kubernetes中管理应用程序和服务部署,以实现一致和可重复的发布流程。 - GPU服务器支持:配置、管理和维护基于GPU的计算环境,包括生命周期自动化和硬件级测试集成。 - 数据库和可观测性集成:与MySQL数据库交互以支持动态数据更新,并将数据源集成到Grafana仪表板中进行监控和洞察。 - 跨职能协作:与开发团队、SRE和项目利益相关者密切合作,确保系统级对齐和高影响力交付。 - 质量保证支持:将自动化测试框架集成到CI管道中,以确保代码质量、稳定性和开发周期的性能。 优先经验 - DevOps工具和自动化:熟练使用Buildkite、GitHub Actions、Jenkins、Ansible和脚本语言(如Python和Bash)来简化DevOps工作流程。 - 容器化和编排:具有使用Docker、Kubernetes和Helm部署和管理可扩展、容器化应用程序的丰富经验。 - 基础设施即代码(IaC):具有自动化基础设施供应和配置的实践经验,以确保环境的可重复性和可扩展性。 - 基于GPU的计算环境:熟悉GPU服务器生命周期管理和将GPU资源集成到CI测试工作流程中以支持性能关键应用程序。 - 监控和可观测性:具有使用Checkmk、Prometheus和Grafana等工具监控基础设施健康和应用程序性能的经验。 - 版本控制和协作:高级Git版本控制知识,包括分支策略和CI/CD集成以实现协作开发。 - Linux和系统管理:在Linux环境中具有扎实的背景,包括shell脚本和分布式系统的系统级故障排除。 - 敏捷和跨学科协作:能够在敏捷团队中工作,并与软件、基础设施和产品团队合作推动一致的交付和创新。 学术背景 - 计算机/软件工程、计算机科学或相关技术学科的学士或硕士学位 提供的福利如AMD福利一览所述。 AMD不接受猎头、招聘机构或基于费用的招聘服务的主动简历。AMD及其子公司是机会均等的包容性雇主,将考虑所有申请人,不论年龄、祖先、肤色、婚姻状况、医疗状况、精神或身体残疾、国籍、种族、宗教、政治和/或第三方关系、性别、怀孕、性取向、性别认同、军事或退伍军人身份或任何其他受法律保护的特征。我们鼓励所有合格候选人申请,并将在招聘和选拔过程的所有阶段根据相关法律满足申请人的需求。 AMD可能会使用人工智能来帮助筛选、评估或选择此职位的申请人。AMD的“负责任的AI政策”可在此处查看。 此职位发布是为现有空缺。