2023年企业机器学习的8个MLops预测
MLops前景一片光明,全球市场预计到2021年将达到6.12亿美元,预计到2028年将超过60亿美元。但是,它也高度分散,数百家MLops供应商争夺最终用户的运营人工智能(AI)生态系统。
前几年,MLop作为一组好的经验出现,用于解决阻碍企业将AI付诸行动的主要障碍,从开发和培训到生产环境的过渡。这是必不可少的,因为几乎有二分的AI飞行员从未将其投入生产。
那么2023年MLops领域将出现哪些趋势?
1.MLops将超越炒作
MLops将不仅仅是一个炒作的主题,而是一个授权数据科学家将机器学习模型引入生产的源泉。其主要目的是简化机器学习解决方案的开发过程。
企业推动推广AI产品化的好的经验,采用MLops弥合机器学习和数据工程之间的差距将有助于无缝统一这些功能。在扩展人工智能系统所涉及的不断变化的挑战中,这将是至关重要的。明年开始接受它并加速这一转变的公司将是获益的公司。
2.数据科学家将青睐预建的行业特定和领域特定的ML模型
到2023年,我们将看到越来越多的预建机器学习[ML]模型可供数据科学家使用。他们将领域专业知识封装在初始ML模型中,然后加快数据科学家及其企业的价值实现时间和上市时间。例如,这些预构建的ML模型有助于消除或减少数据科学家必须花费在重新训练和微调模型上的时间。
希望明年及以后看到的是特定行业和特定领域的预构建ML模型的增加,使数据科学家能够使用一组定义明确的基础数据来处理更有针对性的问题,而不必花时间在成为其企业非核心领域的主题专家。
3.在Kubernetes中运行的AI和ML工作负载将超过非Kubernetes部署
AI和ML工作负载正在加速发展,但主要项目目前仍不在Kubernetes上。我们预计这种情况将在2023年发生转变。
在过去的一年里,人们对Kubernetes进行了大量的关注,新项目使它对开发人员更具吸引力。这些努力还侧重于调整Kubernetes产品,以允许AI和ML的计算密集型需求在GPU上运行,从而在托管在Kubernetes上时保持服务质量。
4.运营效率将成为2023年ML预算的一个项目
以运营效率为中心的投资已经发生了好几年,但这将成为2023年的焦点,尤其是在宏观经济因素逐渐显现且人才库仍然有限的情况下。那些通过机器学习(ML)和先进技术推动企业发展的人发现,在设计包含人在环路方面的工作流方面取得了最大的成功。如果技术陷入困境或需要额外的监督,这种方法提供了急需的护栏,同时允许双方高效地协同工作。
在对大众进行ML的质量保证过程教育时,预计会看到一些最初的阻力和犹豫,这主要是由于缺乏对学习系统如何工作以及由此产生的准确性的理解。一个方面仍然引起怀疑,但它是ML与我们已经知道的静态传统技术之间的核心区别,那就是ML的学习和随时间调整的能力。如果我们能够更好地教育领导者如何释放ML的全部价值,以及它对实现运营效率的指导,我们将在未来几年看到很多进步。
5.机器学习项目的优先级将侧重于收入和商业价值
看看正在进行的ML项目,考虑到最近的裁员,团队将不得不提高效率,并寻求自动化来帮助项目向前发展。其他团队将需要开发更多结构并确定截止日期,以确保项目有效完成。不同的业务部门将不得不开始更多地沟通、改进协作和共享知识,以便这些现在较小的团队可以作为一个有凝聚力的部门。
此外,团队还必须确定他们需要从事哪些类型的项目的优先级,以便在短时间内产生最大的影响。我看到机器学习项目归结为两种类型:领导层认为可以增加销售额并赢得竞争的可销售功能,以及直接影响收入的收入优化项目。可销售的功能项目可能会被推迟,因为它们很难快速推出,相反,现在规模较小的ML团队将更多地关注收入优化,因为它可以推动实际收入。目前,性能对于所有业务部门都至关重要,机器学习也不能幸免。
6.企业机器学习团队将变得更加以数据为中心而非以模型为中心
企业ML团队正变得更加以数据为中心,而不是以模型为中心。如果输入数据不好并且标签不好,那么模型本身也不会好,导致更高的假阳性或假阴性预测率。这意味着人们更加关注确保将干净且标记良好的数据用于培训。
例如,如果不小心使用中文来训练一个需要英文的模型,就会出现意外。这使得MLops更加重要。数据质量和ML可观察性正在成为关键趋势,因为团队试图在训练前管理数据并在生产后监控模型有效性。
7.EdgeML将MLops团队的扩展而增长,以专注于端到端流程
虽然云继续提供无与伦比的资源和灵活性,但越来越多的企业看到了在边缘运行ML的真正价值,靠近决策发生的数据源。发生这种情况的原因有很多,例如需要减少自主设备的延迟、降低云摄取和存储成本,或者因为高度安全的系统无法连接到开放互联网的远程位置缺乏连接。
由于边缘ML部署不仅仅是在设备中粘贴一些代码,MLops团队扩展到专注于完整的端到端流程,边缘ML将经历巨大的增长。
8.特征工程将自动化和简化
特征工程,即以机器学习模型可使用的方式理解、分类和准备输入数据的过程,是一个特别有趣的领域。
虽然数据仓库和流媒体功能简化了数据摄取,并且AutoML平台使模型开发民主化,但此过程中间所需的特征工程在很大程度上仍然是一项手动挑战。它需要领域知识来提取上下文和意义,需要数据科学来转换数据,需要数据工程来将“特性”部署到生产模型中。我们希望看到在自动化和简化这一过程方面取得重大进展。