职责:
• 设计和开发深度学习模型和算法,用于各种应用,如计算机视觉、自然语言处理和语音识别。
• 收集、预处理和分析大规模数据集,用于训练深度神经网络。
• 实现和优化深度学习架构,包括卷积神经网络(CNN)、循环神经网络(RNN)和Transformer模型。
• 与跨职能团队合作,包括数据科学家、软件工程师和领域专家,定义项目需求和目标。
• 保持对深度学习研究和技术的最新进展的了解,并应用它们来提高模型性能。
• 进行实验和进行严格测试,评估和改进深度学习模型的准确性和效率。
• 针对生产系统优化和微调深度学习模型,考虑计算资源和实时约束等因素。
• 使用诸如Python之类的编程语言编写清晰、高效和易于维护的代码,并利用TensorFlow、PyTorch或Keras等深度学习库和框架。
• 应用迁移学习、数据增强和正则化等技术,改善模型的泛化能力并减少过拟合。
• 与数据工程团队合作,确保数据管道和基础设施支持高效的深度学习模型训练和部署。
• 将研究结果、方法论和最佳实践文档化和沟通给利益相关者和团队成员。
• 指导和提供初级团队成员的指导,并为深度学习团队的持续学习和发展做出贡献。
要求:
• 计算机科学、电气工程或相关领域的学士或硕士学位,博士学位优先。
• 扎实的机器学习原理和算法的理解,特别是深度学习技术。
• 熟练掌握编程语言,如Python,并具有使用深度学习框架(如TensorFlow、PyTorch、Keras)的经验。
• 在开发和训练深度神经网络方面有经验,涉及图像分类、目标检测、序列建模或自然语言理解等各种任务。
• 熟悉线性代数、微积分、概率和统计学,以及它们在深度学习中的应用。
• 熟悉数据预处理、特征工程和数据可视化技术。
• 最好具有云计算平台(如AWS、Azure、Google Cloud)和分布式计算框架(如TensorFlow Distributed、Horovod)的实际经验。
• 出色的问题解决能力,能够在开发创新的深度学习解决方案时进行批判性和创造性思考。
• 出色的沟通和团队合作能力,能够与技术和非技术人员有效合作。
• 拥有深度学习项目、研究出版物或对深度学习社区的贡献的强大作品集或记录为佳。