关键职责
负责公司内生产数据管道的健康、可靠性和性能。
构建、维护和调试用于分析、AI系统和内部工具的ETL/ELT管道。
确保数据质量、监控和警报,以便及早发现问题并快速修复。
设计和维护数据堆栈中的集成(API、仓库、编排和下游消费者)。
通过构建稳健的数据和上下文管道,支持和扩展AI和代理系统。
与数据科学、产品和工程紧密合作,以实现数据驱动的决策。
主动改进基础设施,以防止故障并随业务扩展。
所需技能和经验
必需
3年以上数据工程或分析工程的专业经验。
强大的Python和SQL技能(不可协商)。
有构建和管理生产ETL/ELT管道的实际经验。
具有云数据仓库经验(Snowflake或类似)。
熟悉编排工具(Airflow或同等工具)。
具有实施数据质量检查、监控和警报的经验。
能够在生产环境中调试复杂数据问题。
良好的沟通能力和与非数据利益相关者合作的能力。
加分项
有AWS(ECS、Lambdas、RDS)经验。
实际使用过Airbyte、DBT或类似工具。
有构建API集成或抓取管道的经验。
接触过LLMs、代理系统或AI数据管道。
有支持早期阶段或快速增长的初创公司的经验。
快速自查
如果你曾经全面负责管道并在出现问题时负责,那么你可能非常适合这个职位。