• 研究和改进数据科学原型 • 设计自然语言处理应用程序 • 选择适用于监督学习方法的合适的带注释数据集 • 使用有效的文本表示方法将自然语言转化为有用的特征 • 找到并实施适合自然语言处理任务的算法和工具 • 根据要求开发自然语言处理系统 • 训练开发的模型并进行评估实验 • 对结果进行统计分析并改进模型