跳到内容

    机器学习模型管理

    模型是数据科学的核心成果, 他们有巨大的力量来改变公司, 行业, 和社会. 亚马逊(Amazon)和网飞(Netflix)——这十年来最成功的两家企业——只是公司利用模型创造新产品和推动持续运营改进的两个例子. 尽管模型驱动有很多优势,但许多公司都在努力实现这一目标.

    公司把模型当作软件来对待, 事实上, 非常不同——BOB官方APP下载称之为“模范神话”. 尽管模型看起来像软件并且涉及数据, 模型有不同的输入材料, 不同的开发过程, 不同的行为. 克服模范神话, 公司需要开发一种新的组织能力,称为模型管理. 以前, 模型管理指的是监控生产模型, 但BOB官方APP下载认为它应该包含更广泛的能力. 就像公司建立了销售能力一样, 市场营销, 人员管理, 金融, 等等......, 他们需要在数据科学方面具备同等的能力. 模型管理是一种新的技术和过程类别,它们协同工作,使公司能够可靠、安全地进行开发, 验证, 交付, 并快速监控模型以创造竞争优势.

    成功构建模型管理能力的组织将获得指数级的回报,因为更多的模型将推动更好的客户体验和更好的利润. 因为模型是相互建立的, 更多的模型会带来更多的数据和能力,使组织能够投资于新的和更好的模型. 这些组织也将更好地避开阻碍模型影响的常见陷阱,比如道德规范, 偏见, 合规风险. 最终, 下一个计算时代的富人和穷人将由一个组织的模型管理的质量决定.

    机器学习模型-它们是什么以及为什么它们很重要?

    在不到十年的时间里,数据科学已经从一个小众功能上升到董事会层面的焦点. 这是为什么?? 数据科学家的工作有什么价值? 抛开所有的炒作, 所有的流行语, 以及所有关于数据科学核心的人工智能和机器学习的讨论, 它的力量之源, 是模型. 模型是数据科学家创造的东西——它们是数据科学家创造价值的地方. 模型是一种特殊类型的算法. 在软件中,算法是一组硬编码的指令,用于计算确定性答案.

    但是在数据科学中, 模型是一种算法,它的指令是从一组数据中推导出来的,然后用来做出预测, 建议, 或者根据概率评估规定一个行动.

    许多人把数据描述为新的石油. 如果是这样的话,那么模型就是 引擎. 模型使事情发生. 他们开始行动. 它们可以比人类更准确地预测事情发生之前的情况,比如 灾难性事件 或者谁在 在医院面临即将死亡的危险. 模型可以相互建立. 一个模型的输出充当另一个模型的输入, 更复杂的模式,然后创造一个生活, 连接, 可训练的决策者大军. 无论好坏, 模型可以自主地做到这一点, 以人类无法企及的速度和复杂程度. 模型始于金融和某些风险管理领域, 但现在,它们正扩散到几乎所有行业. 数字化转型的力量正在获取更多有关企业运作方式的数据,从而为数据科学家创造更多机会来创建模型以改进做事方式.

    为什么模型很重要

    无论它被称为数据科学、机器学习还是人工智能,这个时代的原子单元都是模型. 模型推动新的突破和运营改进. 少数按模式运营的特权企业已经走在了前面,而且还在加速发展. 其他人都面临着生存风险.

    根据 麦肯锡最近的一项研究在美国,广泛利用模型的组织给出了7分.5%的利润率优势,而那些没有使用模型的公司有2%的利润率优势.与同行相比,利润率亏损5%.

    与行业平均水平相比,模型驱动业务的利润率图表

    模型如何创造价值

    模型显著 降低预测成本类似于半导体如何大幅降低运算成本.  它们还提高了预测的质量. 这种变化使模型成为竞争优势、战略和增长的新货币. 但是模式究竟是如何转化为商业成功的呢? 模型驱动业务价值有两种基本机制.

    1. 模型是突破性产品的基础, 杀手的特性, 甚至是全新的收入来源.
    2. 模型允许公司通过不断的增量改进来创造运营效率.

    模型是存在风险的问题

    这样的公司 好事达, 强生公司, 洛克希德·马丁公司在模型驱动型企业中,其他先行者创造了飞轮效应. 他们能够建立一些模型, 收集其他数据, 改进这些模型, 将一个领域的知识传播到另一个领域, 增加突破的可能性, 提高效率. 虽然飞轮效应始于具有快速模型反馈循环的数字化优先企业(例如.g., 在线零售, 数字广告, 和金融), 数字化转型的潜在力量几乎为每个企业提供了模型驱动的机会.

    同样,这意味着没有任何企业能够免受来自模型驱动的竞争对手的威胁. 的 麦肯锡之前提到的研究 通过使用人工智能和机器学习,模型驱动型领导者的息税前收入增加了20%. 这种优势结合在一起,使胜利者走得更远,而落后者则走得更远, 并最终, 远远落后.

    一些企业可能会安慰自己,他们在基础设施方面拥有强大的竞争优势, 人, 或数据. 然而, 许多组织以前所依赖的竞争优势已经受到侵蚀:

    • 由于开源和云计算的兴起,专有算法和基础设施日益受到开放和廉价竞争产品的威胁.
    • “独角兽”的招聘越来越具有传递性 平均任期 一个数据科学家不到两年的时间.
    • 通过共享安排,专有数据越来越容易获得, 聚合器, 或者受到GDPR等规则的监管.

    然而, 一个组织的发展能力仍然是一个有竞争力的差异化因素, 验证, 交付, 并大规模监控模型.

    白皮书

    不要让模特偏离你的轨道

    不要让模特偏离你的轨道 描述模型如何以及为什么会变坏, 回顾模型风险预防的指导性用例, 并为那些希望帮助他们的组织防止不良模式的后果的商业领袖提供了可行的建议.

    下载白皮书

    模范神话阻碍BOB官方APP下载前进

    正如前面的分析所显示的,当一个公司是模型驱动的时候,会有巨大的力量. 不幸的是,只有四分之一的组织能够做到这一点. 根据… 2022年对高级数据和技术高管的调查  根据New Vantage 合作伙伴的调查,只有26%的受访者将人工智能投入了广泛的生产. 这是为什么?? 如果模型驱动如此重要,为什么公司没有取得更大的进展呢?

    许多公司似乎在变得更加以模型为驱动的过程中陷入了困境. 说不同, it’s not that companies aren’t trying to become model-driven; it’s that their approach (for some reason) isn’t working. 以下是BOB官方APP下载在与许多公司员工的交流中听到的一些事情:

    • 数据科学家面临着访问工具的日常问题. 一个组织描述了数据科学家如何偷偷地带着他们的个人笔记本电脑去工作,因为安装新的Python包需要几个月的时间
    • 数据科学经理努力追踪模型开发过程中产生的制度知识. 一位数据科学经理提到:“这太糟糕了,每天都像是我的第一天.”
    • 使用数据科学产生的见解的决策者很少理解这些见解的假设和背景. 这种理解的缺乏导致决策者忽视或误解这些见解.

    模式不同

    但更深层次的问题是什么呢? 考虑到利害关系的重要性以及公司在这些能力上的投资, 他们当然不想把事情搞砸. BOB官方APP下载的观点是,这些公司的数据科学领导者和其他高管正在把模型当作他们以前见过的东西——软件, data, 或者商业智能——而不是认识到模型是根本不同的.

    BOB官方APP下载称这种错误为模型神话——因为模型涉及代码和数据, 你可以像对待软件或数据一样对待它们. 模型是不同的,如果不把它们当作模型来对待,就会导致公司在模型驱动的道路上陷入困境.

    解决方案-模型管理

    企业已经发展了所有基本活动的组织能力:销售, 市场营销, 人员管理, 软件工程, 等. 组织能力允许企业在规模上可靠地执行关键功能,并使该功能超越对个人英雄主义或银弹工具的依赖. 模型管理是应用于数据科学的组织能力的名称.

    什么是机器学习模型管理?

    模型管理是 一种由协同工作的技术和流程组成的新能力,使公司能够可靠、安全地进行开发, 验证, 交付, 并监控创造竞争优势的模式. BOB官方APP下载相信这是模范神话的解决方案. 这是释放模型变革潜力的途径.

    在过去, “模型管理”已经被用作跟踪和监视生产中运行的模型的技术术语. BOB官方APP下载指的是更广泛的东西. 在本节中, BOB官方APP下载为这种新的组织能力提供了一个框架,并展望了它将如何改变BOB官方APP下载从事数据科学的方式.

    机器学习模型管理的支柱

    模型管理有五个支柱. 下图显示了模型管理的蓝图.

    模型管理的五大支柱

    今天,大多数组织都投资于在这些支柱中的两个或三个方面建立能力. 通常, 他们专注于模型开发(构建模型的能力), 模型技术(为数据科学家提供技术的能力), 和, 希望, 模型生产(一种将那些模型产品化的方法). 然而, 这个领域的领导者认识到,作为团队的规模和期望规模,这些因素本身是不完整和不可靠的. BOB官方APP下载相信,只有统一了所有这些功能的完整解决方案才能释放模型的全部潜力——一个包含模型独特特征的解决方案, 包括管理整个系统和管理整个过程中产生的知识的能力.

    模型技术 

    模型技术包括计算基础设施和软件工具,为数据科学家提供了开发和部署创新模型所需的敏捷性. 模型的输入材料不同于软件或BI. 模型是不断发展的, 在开源和商业生态系统中都有前所未有的创新. 模型还使用更多的计算密集型算法, 所以他们受益于可扩展的计算和gpu等专用硬件. 模型技术是完整数据科学系统的支柱, 允许组织在每个步骤中使用适当的工具, 从早期数据探索到关键任务模型产品的持续监控.

    模型开发 

    模型开发允许数据科学家快速开发模型, 实验, 合作, 推动突破性研究. 建立模型的过程比软件更具实验性. 数据科学家以交互方式探索数据,并以编程方式测试许多不同的特征和算法类型的排列. 也, 数据科学家与同事和利益相关者分享见解,并存储见解以供以后使用. 通常,在模型开发中获得的洞察力对组织的成功与模型本身一样重要,应该分类并保留

    模型生产 

    模型生产是数据科学团队工作的操作方式. 它是如何从一个创新项目转变为集成到业务流程中的实时模型产品的, 影响决策和驱动价值. 因为模型的行为不同于软件, 模型生产使组织能够以允许人们轻松地应用必要的判断或提供反馈的方式使用模型. 模型生产 还跟踪模型的执行情况(模型监视), 如何使用,在哪里使用, 并确保一个闭环来驱动迭代和改进.

    模型管理

    模型管理 公司如何才能把握住市场活动的脉搏, 成本, 以及数据科学工作对整个组织的影响,以及了解项目的进展, 生产模型, 以及支持它们的底层基础设施. 整个模型系统的治理要比其他系统复杂得多,因为前面描述的模型的独特特征的汇合:快速发展的工具包, 基于研究的发展, 和概率目的

    模型上下文

    模型上下文是所有的知识, 的见解, 以及在构建或使用模型时生成的工件. 它代表了一个模型的完整来源,它可以被模块化(特征), 数据集, 环境, code, 主题专家, 验证检查, 监测计划),并重新组装成新的模型. 这通常是公司最有价值的知识产权, 以及寻找的能力, 重用, 并以此为基础,对推动快速创新至关重要. 比如在科学领域, 自下而上的知识交叉传粉是扩大模型影响的最有效和最可持续的方式. 模型上下文对于主动处理关于模型的遵从性和可审计性的关注也是必不可少的.

    模型管理的未来

    模型管理是企业的下一个重大范式转变. 成为模型驱动的组织将继续与落后者保持距离. 到目前为止,许多挫折和失望都源于将模型硬塞到现有的组织范例(如软件开发或数据管理)中. 通过认识到模型的独特之处,并建立一种组织能力,这种能力可以从其他能力中学习,并接受这些差异, 企业可以产生更多的突破,并不断改善其核心业务. 这是在下一个时代保持竞争力的关键.

    ML模型管理资源

    博客
    模型治理在机器学习中的作用 & AI
    博客
    机器学习模型开发和生产指南