在任何地方当经理都很难,但监督一个数据科学团队可能尤其具有挑战性. 角色仍在不断变化, 流动率高, 公司正在寻找团队运作的最佳方式. 作为一个技术能手并不一定能让你做好管理他人的准备.
今天你是否在管理一个数据科学团队, 准备发射一枚, 或者希望将来这样做, 本领域指南将使您成为企业中更好的数据科学经理.
在本现场指南中:
如何聘用和留住数据科学家
在最近的Rev数据科学领袖峰会的小组讨论中, 三位专家分享了他们的招聘技巧, 保留, 培养数据科学人才.
他们的建议总结如下. 你也可以通过BOB官方APP下载的 招聘数据科学团队的现场指南.
来自数据科学经理的建议
首先招聘领导
如果你从初级员工或刚从学术界毕业的人开始, 如果没有指导,他们可能会感到失落和沮丧. 米开朗基罗达, ShopRunner的数据科学高级总监, 建议先安排一个更有经验的人来指导团队.
谨慎选择经理
不要只关注技术人才和经验. 小组成员一致认为谦逊, 好奇心和倾听和接受反馈的能力是高级职位的关键特质. “将要负责的人必须知道,他们并没有所有的好主意或所有的答案,达戈斯蒂诺说. 他建议让未来的员工描述一下他们失败的情况,以及他们如何避免重蹈覆辙,以衡量他们的自我反省能力.
重新思考数据挑战
考虑到竞争激烈的招聘环境, 繁重的带回家的测试会筛选出合格的候选人,并制造紧张气氛, exam-like气氛. 你不需要这些挑战来招聘优秀的员工, 帕特里克·菲尔普斯说, Insight data Science的首席数据科学家. 他表示:“这真的很难规模化……(而且)分级需要花费大量时间。. “我宁愿让我的团队中有一位优秀的数据科学家和他们在一个房间里呆上一个小时.如果你写了一个挑战, D 'Agostino建议让应聘者在办公室完成一项编码练习,并像在非正式的代码审查中一样讨论它.
数据科学家招聘和入职计划
这个招聘和入职计划模板介绍了一些关键问题,以帮助找到和培训新的数据科学家. 该计划模板包括吸引顶尖人才的关键问题, 招聘过程, 在登机, 保留, 和更多的.
通过采取系统的方法, 数据科学领导者将最大限度地找到并培养一个比其组成部分的总和更大的团队.
吸引顶尖人才
- 你们对候选数据科学家的差异化价值主张是什么? 列出让这个机会独一无二的三件事, 你认为会引起目标候选人的共鸣. 在你的团队中测试你的演讲. 得到反馈.
- 哪些1-3个风险可能会使机会不如竞争机会那么吸引人? 你该如何减轻或超越他们?
招聘过程
- 你的候选人最重要的三个特质是什么?
- 你的评估计划是什么?
新员工培训
- 在最初的30天、60天和90天里需要完成哪些活动和成果?
- 你的新员工需要知道的最重要的“部落知识”是什么, 她又将如何学习呢? 示例包括数据源, 项目方法, 涉众的动力学, 显著的得失, 等.
保留和管理
- 你希望应聘者在第一年能培养哪些技能?
- 一年后,哪些指标将决定候选人的成功? 示例包括某些业务度量, 社区的贡献, 产生的见解数量, 或者项目迭代速度.
保留你的才能
不要过分夸大这个角色. 一半的数据科学家在他们的工作岗位上呆了两年或更短的时间. 减少营业额, 对你招聘的职位要诚实, 康纳·詹森建议道, Domino的客户成功经理. “对自己的角色要非常现实, 多痛苦啊, 你认为影响会在哪里, 以及时间线是什么样的,他说. “很多时候,BOB官方APP下载对自己作为数据科学家将要完成的事情感到非常兴奋, BOB官方APP下载可以做得有点超前.”
理解团队成员的动机. 詹森建议花时间去发现每个员工的目标、兴趣和个人动机. 然后你可以将它们与有意义的项目配对,并以有意义的方式认可成就.
提供支持. “数据科学可能是一门失败的学科:模型会失败, 过程失败, 数据来源原来是可怕的,菲尔普斯说. 他建议提供积极的强化,并提醒团队成员可能需要数年时间才能看到效果. 詹森还建议将问题分解成可管理的小块,这样员工就不会被庞大的项目吓倒.
创造学习机会. 达戈斯蒂诺观察到,数据科学家经常因为无聊而离职. 如果核心项目不是前沿项目, 他建议为团队成员创造学习新事物的机会, 比如每周一次的午餐来讨论最新的研究,或者偶尔的黑客马拉松来测试一个新的软件框架或计算技术.
成功的数据科学经理的习惯
以下是BOB官方APP下载在许多成功的数据科学经理身上观察到的七个习惯, 排名不分先后.
- 与其他利益相关者建立联系. 通过开放与其他团队的沟通渠道来避免摩擦和交叉. 考虑在每个新项目之前让数据科学家和产品经理在一个房间里呆一个小时,以确保他们在同一页上. 让数据科学家不带笔记本电脑参加会议,可能会迫使他们与其他利益相关者进行沟通. 让数据科学家有机会向工程师解释他们的工作, 产品经理, 其他的也可以改善沟通.
- 跟踪性能. 使用模板来记录你们讨论的内容, 你设定的目标, 以及你在一对一会议上对报告的反馈. 依靠记忆是行不通的.
- 目标是将项目投入生产. 让团队准备好部署他们自己的API服务并将代码产品化,可以帮助您更快地前进, 这样就不会阻碍工程资源的使用.
- 开始随叫随到. 随着团队规模的扩大,每周轮换轮换数据科学家来修复损坏的模型. 这鼓励了更好的文档,并让那些不随叫随到的人有时间专注于核心项目.
- 问愚蠢的问题. 看似简单的问题可以打开识别和解决根本问题的大门.
- 不断学习. 大量阅读以跟上这个快速发展领域的发展. 不要只消耗技术材料, 还有关于管理和组织心理学的见解.
- 让开,但不是永远让开. 如果你是一名新经理,可以考虑在三到六个月的时间里不写代码. 否则,你可能永远不会真正接受管理者的角色,而且可能会对团队服务不足. 在那之后,你可以自由地处理那些不重要的项目,或者那些没人想做的项目.
知识管理
数据科学家经常对知识管理这个话题感到恐惧. Some see it as a time-sucking distraction from their “real” jobs; others don’t fully grasp what it means. 甚至许多看到这个概念价值的人也发现这个过程很痛苦.
但知识管理能力将成为企业竞争优势的关键来源, 据马修·格兰德说, Point72的首席市场情报官, 和麦克·斯蒂尔, 他是Domino Data Lab的产品总监. 在下面的视频中, 两人阐述了知识管理的重要性,以及企业应如何将其作为优先事项.
数据科学团队的知识管理要点如下.
什么是知识管理?
知识管理的目标是获取洞察力, 哪个可以被定义为“更好的理解”.因此,洞察力是相对的——它是关于不断改进先前的想法. 从爱因斯坦到弗洛伊德,洞察力通常被视为“孤独的天才”的权限.事实上,大多数的洞察力来自于与他人的合作和对现有想法的扩展.
创造这种“复合机器”需要一种获取知识的方法, 一个供用户遵循的框架和通过反馈改进的机制. 企业的未来将越来越多地取决于它们在这方面做得如何. 随着更多的算法和基础设施的广泛使用, 数据科学人才不断增长,共享数据的需求不断扩大, 捕捉和增强独特见解的能力将成为关键的差异化因素.
为什么知识管理是困难的?
每个行业都面临着知识管理方面的挑战:
- 提前组织知识是困难的. 分类通常过于死板,因为您不知道将来什么是重要的.
- 参与的动机很少. 正如一位数据科学家所说, “我的工资是根据我今年建造的东西来的, 而不是维护我去年建造的东西.”
- 这是一个典型的集体行动问题. 没有人想成为第一个在文档上花费时间的人. 当知识被获取时,很难知道如何采取行动.
- 制度总是落后于现实. 如果知识管理需要额外的时间并且是在与核心工作不同的系统中完成的, 它的质量会受到影响.
数据科学团队面临的其他障碍是:
- 人们使用不同的工具. 当一些团队成员使用R而另一些使用Python时,知识管理变得更加困难, 有些人把代码存储在GitHub上,有些人把代码存储在电子邮件中. 培训人们使用相同的系统是很困难的,因为人员流动率很高.
- 单个项目的组成部分是分散的. 工件和见解可能分布在Docker商店、wiki、PowerPoint演示文稿等.
- 如果您有代码,那并不意味着您可以重新运行它. A meta-analysis of 600 computational research papers found that only 20 percent of the code could be re-run; of that share, 许多第二次尝试的结果略有不同.
如何改进知识管理
有四个步骤可以帮助数据科学领导者改善企业组织中的知识管理:
1. 在一个地方获取尽可能多的知识.
里面的东西越多, 你与他们之间的联系就越多, 价值就是这样增长的. 你不希望有人在边缘地带行动. 一个包含核心工作和知识管理的公共平台是确保完成这些工作并将负担降至最低的关键. 如果你不能捕捉到一切, 从最有价值的模型或知识开始, 然后围绕它建立一个系统.
测试: 问问你公司里的五位数据科学家, 分别, “你认为这个团队现在正在做多少项目??“他们可能会有不同的答案.
2. 选择一个允许发现、溯源、重用和模块化的知识管理系统
发现: 数据科学家花费大量时间搜索信息,降低了工作效率. 团队必须决定是管理知识(雅虎的方法)还是索引知识(谷歌的方法)。. 当域名相对稳定时,管理是有意义的. 当域是流动的时,索引和搜索是最好的, 你不可能事先知道分类应该是什么样的.
测试: 让新员工从事一个主题的工作,并计算他们收集正确工件所需的时间. 如果是几周或几个月,那就是一个危险信号.
出处: 让人们关注知识管理中重要的方面. 使用一个平台,让人们综合他们的工作, 不必追踪他们使用的软件版本.
测试: 事先写下你认为团队成员应该花在文档上的时间百分比. 然后问一些人他们到底花了多长时间. 这可能令人大开眼界.
重用: 如果它不运行,它就不会被重用. 这不仅需要访问代码,还需要访问数据集的历史版本.
测试: 让一位新员工重现另一位数据科学家六个月前所做的工作, 最好是已经离开团队或组织的人. 让他或她用最新的数据更新它. 如果需要一周或一个月的时间,那就麻烦了.
分解和模块化: 确保人们有动机和工具来创建可以重用和构建的构建块.
测试: 让两个做过类似项目的团队做一个事后分析,找出重叠的工作.
3. 确定正确的知识单元
复合系统依赖于知识单元. In academia, those are books and papers; in software, it’s code. 在数据科学中, 这个模型是正确的组织方式, 因为这是数据科学家做的事情. 该模型包括数据、代码、参数和结果.
4. 超越技术思考
人员和流程级别的变化也很重要. 重塑人们对工作的看法:他们应该少花点时间做事,多花点时间整理和学习. 在招聘和薪酬方面要优先考虑合作. 最后, 而知识管理应该被视为每个人的工作, 一些组织为管理或促进知识创造了新的角色.
协作
以下三个视频提供了一系列关于促进数据科学家和企业内其他利益相关者之间协作的课程.
促进协作的内部实践
与整个企业的利益相关者合作
建设卓越的数据科学中心
扩展数据科学团队
运行一个复杂的数据科学组织需要什么? 当你扩展到一个可重复的模式时,你需要考虑哪些事情, 高通量数据科学机器? 下面的两个视频提供了两种观点.
建筑 & 扩展数据科学团队
迈克尔•李, 数据科学孵化器(Data Science Incubator)的创始人兼总裁多年来一直专注于这个问题, 建立和发展多学科的数据科学团队.
在下面的视频中, Michael讨论了如何继续打造世界级的数据科学和人工智能团队. 他还讨论了数据科学的实践, 组织的规模, 的关键组件和最佳实践 数据科学项目 在你的组织中建立数据驱动的文化.
财富500强的经验教训
通过与从敏捷创业公司到财富500强的公司合作, BOB官方APP下载已经能够整理用例,并从这些组织中学习成长中的数据科学团队所面临的挑战和成功.
在这段视频中,BOB官方APP下载将分享其中的一些经验, 包括:数据科学项目的目标, 他们的挑战, 进行诊断, 管理项目和系统, 并利用数据科学平台进行扩展.
下一个步骤
本领域指南涵盖了管理企业数据科学团队的人员组成部分:招聘和入职, 培养团队走向成功, 养成正确的习惯, 获取和管理知识, 促进合作. 现在,这些数据科学家需要做点什么. 学习如何在企业中管理数据科学项目.