系统架构师硬件模拟

15个月前全职
Brillius

Brillius

location 旧金山
unsaved
系统工程师/架构师 加利福尼亚州圣尼维尔 长期 职位描述 设计技术团队基于AWS云和本地硬件为多个内部团队提供基于高性能计算(HPC)的服务,用于其硬件模拟和产品设计应用。作为HPC系统开发人员,个人的角色对HPC环境的日常运营至关重要,因此对于我们产品的所有开发过程的成功起着关键作用。该角色将支持内部工程师的应用程序/工具/服务。 工作职责 设计和实施下一代服务的底层架构,发明新技术,解决复杂的扩展挑战,并推出新的服务功能。为软件平台的可管理性、可操作性和性能提供系统支持,并创建简单的流程来帮助操作和构建我们的系统基础设施。调整和改进运营管理系统和流程,以适应系统和流量的快速增长。通过分析和部署新的硬件配置来优化系统的性能。应用网络和系统技能来构建、优化和扩展快速增长的软件服务。开发自定义组件来增强当前系统或从头设计和构建新的应用程序/组件,以更好地与团队和内部客户的目标和愿景相一致。 一些关键活动包括: • 在AWS上维护HPC环境 • 维护Linux/Windows远程桌面会话 • 用户注册、文件权限、用户组 • 维护HPC作业调度器(PBS) • 维护和管理多个软件工具(安装、配置、更新/升级、修补和修复安全漏洞),例如Atlassian工具等 • 管理软件许可服务,与客户和供应商沟通以满足许可需求。 • 处理问题(缺陷、风险、漏洞、用户请求)并及时解决工单(包括用户请求以及针对操作系统、AWS基础设施和软件更新等实体的安全和合规问题)。 基本资格 • 2年以上使用至少一种现代语言(如Python、PowerShell、C++)进行编程的经验, • 3年以上自动化经验(构建、测试、发布或监控)以及为此构建工具的经验。 • 5年以上Linux管理经验,以及网络、存储系统和实际的系统工程经验 • 4年以上AWS云服务经验,例如EC2、EFS、EBS、S3、Route53、VPC、VPC Peering和CloudFormation等 • 1年以上HPC系统和作业调度器(如Altair PBS、Slurm、IBM LSF)经验, • 1年以上管理网络许可服务器(符合FlexLM标准的网络许可证) • 2年以上在AWS上管理后端数据库(包括SQL和NoSQL)的经验 首选资格 • 理解分布式CAE(计算机辅助工程)和FEA(有限元分析)模拟工具之一或多个,例如Ansys(Ansys,LS-Dyna,Fluent,HFSS)、MATLAB、Siemens(StarCCM,Flotherm)、Cadence、Comsol、Abaqus、Keysight、Remcom、CST、Synopsys(Lighttools,HSpice)在HPC上 • 理解PBS、Slurm、LSF等HPC作业调度器之一或多个 • 有Java/Python/C/C++基于系统/应用程序部署、维护和管理的经验。 • 具备基本的数据库查询(包括SQL和NoSQL)经验 • 在AWS云上开发系统/应用程序的经验。 谢谢 Jay 硬件模拟系统架构师