职责:
• 设计和开发深度学习模型和算法,应用于计算机视觉、自然语言处理和语音识别等各种应用。
• 收集、预处理和分析大规模数据集,用于训练深度神经网络。
• 实现和优化深度学习架构,包括卷积神经网络(CNN)、循环神经网络(RNN)和Transformer模型。
• 与数据科学家、软件工程师和领域专家等跨职能团队合作,定义项目需求和目标。
• 了解深度学习研究和技术的最新进展,并应用它们来提升模型性能。
• 进行实验和严格测试,评估和改进深度学习模型的准确性和效率。
• 针对生产系统优化和微调深度学习模型,考虑计算资源和实时限制等因素。
• 使用Python等编程语言编写干净、高效、易于维护的代码,并利用TensorFlow、PyTorch或Keras等深度学习库和框架。
• 应用迁移学习、数据增强和正则化等技术,提高模型的泛化能力并减少过拟合。
• 与数据工程团队合作,确保数据流水线和基础设施支持高效的深度学习模型训练和部署。
• 向利益相关者和团队成员记录和传达研究发现、方法论和最佳实践。
• 指导和提供给初级团队成员指导,并为深度学习团队的持续学习和发展做出贡献。
要求:
• 计算机科学、电气工程或相关领域的学士或硕士学位,博士学位优先。
• 扎实的机器学习原理和算法理解,特别是深度学习技术。
• 熟练掌握Python等编程语言,具有使用深度学习框架(如TensorFlow、PyTorch、Keras)的经验。
• 具备开发和训练深度神经网络解决图像分类、目标检测、序列建模或自然语言理解等各种任务的经验。
• 熟悉线性代数、微积分、概率和统计学,并能在深度学习中应用它们。
• 熟悉数据预处理、特征工程和数据可视化技术。
• 最好具有云计算平台(如AWS、Azure、Google Cloud)和分布式计算框架(如TensorFlow Distributed、Horovod)的实际经验。
• 出色的问题解决能力,能够在开发创新的深度学习解决方案时进行批判性和创造性思考。
• 优秀的沟通和团队合作能力,能够与技术和非技术相关方有效合作。
• 拥有深度学习项目、研究论文或对深度学习社区的贡献的强大作品集或记录将是加分项。