Supernan1994's Personal Blog

2021年Gartner数据科学与机器学习(DSML)平台魔力象限报告解读

Gartner是全球最具权威的IT研究与顾问咨询公司,Gartner魔力象限(Magic Quadrant,简称MQ)是一种针对企业级IT市场的分析方法,用来形象化的阐述公司间的实力及差异。谷歌、微软、甲骨文、IBM等科技巨头都非常在意Gartner魔力象限的评价,并以上榜为荣;同时,世界五百强的CIO们在采购技术产品时,也大多将Gartner魔力象限作为一个重要评价依据。
今年3月Gartner发布了2021年Data Science and Machine Learning Platform Magic Quadrant(简称DSML MQ),8月我听了一场由Gartner研究总监孙鑫主持的Webinar[Slides]。

这篇文章主要是Webinar的学习笔记,总结一些核心观点,也包含了一些我个人的理解。文章里没有太多涉及对某个Vendor的评估,更多是对整个行业的研讨。

1. DSML平台定义

拥有一个核心产品实现全生命周期的数据科学活动。同时,产品需要具备集成第三方(包括开源)的组件、框架的能力。

DSML平台3个基本特征

DSML平台核心功能

产品能力评估在魔力象限评估体系中权重比较高。分析师在这里没有进行过多描述。

❗️商业机器学习落地是一门非常复杂的工程问题,涉及到非常多的细分领域,而且每年都在发展。这份报告中更多是站在商业、市场、产品角度给出的分析,如果你想从工程、学术角度了解机器学习平台架构,强烈建议看一下UC Berkeley的Full Stack Deep Learning课程。

由于问题的复杂性和用户的多样性,DSML平台根据使用场景分化出4种不同的流派,厂商各有侧重。这四个场景分别是:

2. DSML MQ评估标准和过程中得到的经验

评估标准

MQ的纵轴和横轴分别代表执行力和前瞻性。

换个更接地气的说法,MQ评估的是一个基本的商业逻辑:企业能不能把NB吹的别人都信了(前瞻性),并且能做出来(执行力)。

过程中得到的经验

3. DSML平台的主要趋势

主要趋势

这些趋势是Gartner通过跟客户和投资人在Inquiry中逐渐总结出来的。

交付模式的多样性

通常有3种交付模式:自建、购买、外包。3种各有优劣势,很多成熟企业会采纳混合的交付模式。

搭建好DMSL平台后,企业需要考虑如何与现有的BI平台和自助式分析平台集成,通过building block方式实现组装式的分析。

哪些工作可以被自动化

全自动化的机器学习平台是不存在的,不同环节可被自动化的比例有所不同。

开源软件依然非常重要

开源软件和商用软件不完全站在对立面。MQ评估的厂商很多也是开源项目的发起人或重要贡献者。


comments powered by Disqus