首席大数据解决方案架构师

21天前全职
73.3万 - 94.2万 / 年 beBeeDataEngineer

beBeeDataEngineer

location 多伦多
unsaved
职位名称:Databricks 架构师 ShyftLabs 是一家快速发展的数据产品公司,正在寻找一位经验丰富的专业人士,领导使用 Databricks 统一分析平台的大数据解决方案的设计和开发。 此角色要求在 Apache Spark、SQL、Python 和云平台(AWS/Azure/GCP)方面具有深厚的专业知识。理想的候选人将与跨职能团队合作,架构可扩展的高性能数据平台。 主要职责: • 在 Databricks 平台上设计、开发和优化大数据和 AI/ML 解决方案。 • 开发高可扩展性的 ETL 流水线以处理大型数据集。 • 领导 Apache Spark 在分布式数据处理和实时分析中的应用。 • 定义并执行数据治理、安全政策和合规标准。 • 优化数据湖屋架构以提高性能、可扩展性和成本效率。 • 与数据科学家、分析师和工程师合作,以支持 AI/ML 驱动的洞察。 • 监督和排除 Databricks 集群、作业和性能瓶颈。 • 使用 CI/CD 流水线和基础设施即代码实践自动化数据工作流。 • 确保所有数据流程中的数据完整性、质量和可靠性。 要求: • 计算机科学、数据工程或相关领域的学士或硕士学位。 • 8 年以上数据工程的实践经验,其中至少 5 年在 Databricks 架构师和 Apache Spark 方面。 • 精通 SQL、Python 或 Scala 进行数据处理和分析。 • 在云平台(AWS、Azure 或 GCP)上有广泛的数据工程经验。 • 对 ETL 框架、数据湖和 Delta Lake 架构有深入了解。 • 具有 CI/CD 工具和 DevOps 最佳实践的实践经验。 • 熟悉数据安全、合规和治理最佳实践。 • 在快节奏环境中具有较强的问题解决和分析能力。 优先资格: • Databricks 认证(例如:Databricks 认证数据工程师、Spark 开发者)。 • 具有 MLflow、特征存储或 Databricks SQL 的实践经验。 • 接触过 Kubernetes、Docker 和 Terraform。 • 具有流数据架构(Kafka、Kinesis 等)的经验。 • 对商业智能和报告工具(Power BI、Tableau、Looker)有深入理解。 • 之前在零售、电子商务或广告技术数据平台工作过的经验。 在 ShyftLabs,我们热衷于提供数字解决方案,通过创新创造价值,加速各行业的业务增长。