首席大数据解决方案架构师 - beBeeDataEngineer招聘

职位名称：Databricks 架构师 ShyftLabs 是一家快速发展的数据产品公司，正在寻找一位经验丰富的专业人士，领导使用 Databricks 统一分析平台的大数据解决方案的设计和开发。此角色要求在 Apache Spark、SQL、Python 和云平台（AWS/Azure/GCP）方面具有深厚的专业知识。理想的候选人将与跨职能团队合作，架构可扩展的高性能数据平台。主要职责： • 在 Databricks 平台上设计、开发和优化大数据和 AI/ML 解决方案。 • 开发高可扩展性的 ETL 流水线以处理大型数据集。 • 领导 Apache Spark 在分布式数据处理和实时分析中的应用。 • 定义并执行数据治理、安全政策和合规标准。 • 优化数据湖屋架构以提高性能、可扩展性和成本效率。 • 与数据科学家、分析师和工程师合作，以支持 AI/ML 驱动的洞察。 • 监督和排除 Databricks 集群、作业和性能瓶颈。 • 使用 CI/CD 流水线和基础设施即代码实践自动化数据工作流。 • 确保所有数据流程中的数据完整性、质量和可靠性。要求： • 计算机科学、数据工程或相关领域的学士或硕士学位。 • 8 年以上数据工程的实践经验，其中至少 5 年在 Databricks 架构师和 Apache Spark 方面。 • 精通 SQL、Python 或 Scala 进行数据处理和分析。 • 在云平台（AWS、Azure 或 GCP）上有广泛的数据工程经验。 • 对 ETL 框架、数据湖和 Delta Lake 架构有深入了解。 • 具有 CI/CD 工具和 DevOps 最佳实践的实践经验。 • 熟悉数据安全、合规和治理最佳实践。 • 在快节奏环境中具有较强的问题解决和分析能力。优先资格： • Databricks 认证（例如：Databricks 认证数据工程师、Spark 开发者）。 • 具有 MLflow、特征存储或 Databricks SQL 的实践经验。 • 接触过 Kubernetes、Docker 和 Terraform。 • 具有流数据架构（Kafka、Kinesis 等）的经验。 • 对商业智能和报告工具（Power BI、Tableau、Looker）有深入理解。 • 之前在零售、电子商务或广告技术数据平台工作过的经验。在 ShyftLabs，我们热衷于提供数字解决方案，通过创新创造价值，加速各行业的业务增长。