描述:
• 必须具备在大数据、Cloudera分发7.x、云迁移、关系型数据库方面的强大项目经验。
• 必须具备在Amazon EMR/Databricks/Cloudera CDP方面的强大项目经验。
• 必须具备4-5年使用Hadoop组件Sqoop、Hive、Solr、MR、Impala、Spark、Spark SQL、HBase构建数据流水线的经验。
• 必须具备4-5年的Python、Java和Scala编程经验。
• 必须具备使用Python框架(Django、Flask等)开发REST API的强大经验。
• 非常希望具备使用Spring框架开发微服务/网络服务的强大经验。
• 必须具备Amazon EMR/Data Bricks/Cloudera CDP方面的强大经验。
• 具备Dask、NumPy、Pandas、Scikit-Learn的经验。
• 具备在大数据、Cloudera分发7.x、关系型数据库方面的实际经验。
• 具备使用Hadoop组件Sqoop、Hive、Solr、MR、Impala、Spark、Spark SQL、HBase构建数据流水线的实际经验。
• 具备在实时分析领域(如Spark/Kafka/Storm)的强大经验。
• 具备Jenkins、JIRA的经验。
• 具备在Unix/Linux环境中编写脚本和安排/执行作业的专业知识。
• 提供愿景,收集需求,并将客户用户需求转化为技术架构。
• 设计和实施集成的大数据平台和分析解决方案。
• 设计和实施数据收集器,用于收集和传输数据到大数据平台。
• 为大数据平台实施监控解决方案,监控基础设施的健康状况。