AI大型模型分布式平台的高级研发工程师

14个月前全职
Huawei

Huawei

location 香港
unsaved
关于公司: 华为成立于1987年,是全球领先的信息与通信技术(ICT)解决方案提供商,为运营商、企业客户和消费者提供具有竞争力的ICT解决方案、产品和服务。三十年来,华为一直专注于主要方向,抵制各种诱惑。它坚持脚踏实地、长期奉献和积累,而不是采取捷径和机会主义。华为还通过反思保持了客户至上、奉献、毅力和成长。展望未来,我们希望您能加入华为团队,共同努力为更美好的未来工作。 职责: 1. 优化平台性能,提高平台的吞吐量和响应速度。在人工智能大数据模型预测和推理中,准确的流量预测和快速的推理实例冷启动使得无服务器推理能够按需弹性扩展。 2. 确保平台的高可用性和可扩展性。简单的API可以灵活扩展和定制。例如,AI模型训练代码可以是固有的框架代码。 3. 支持AI数据、公共AI数据集和开箱即用的数据增强操作的分布式加载和处理。专注于大规模异构集群的高效开发、高资源利用率、高性能和高可用性。 要求: 1. 熟悉Linux系统,至少熟悉C++/Golang/Python中的一种。 2. 熟悉分布式中间件,如Redis、Kafka、Etcd、Zookeeper,有开发经验者优先。 3. 熟悉分布式计算和云计算等技术,能够掌握并使用Ray等分布式计算框架处理和分析数据(优先考虑)。