机器学习行业发展分析
一、机器学习行业发展概况
第一,2010年2月,加州大学伯克利分校教授乔丹和卡内基梅隆大学教授米歇尔同时当选美国工程院院士,同年5月份,乔丹教授又当选为美国科学院院士。随后几年,概率图模型专家科勒(Daphne Koller)当选为美国工程院院士,理论计算机学家和机器学习专家、Boosting的主要建立者之一夏皮尔(Robert Schapire)当选为美国工程院院士和科学院院士。期间,斯坦福大学的统计学家弗莱德曼和提布施瓦尼(Robert Tibshirani)、伯克利分校的华裔统计学家郁彬,以及卡内基梅隆大学统计学家沃塞曼也先后被选为美国科学院院士。这是一个非常有趣的现象,因为这些学者都在机器学习领域做出了非常重要的贡献,比如弗莱德曼的工作包括分类回归树、多元自适应回归(Multivariate Adaptive Regression Splines,MARS)和梯度推进机(Gradient Boosting Machines,GBM)等经典机器学习算法,而提布施瓦尼是最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)的提出者。此外,优化算法专家鲍德(Stephen Boyd)当选美国工程院院士,他和范登贝格(Lieven Vandenberghe)的合着《凸优化》(Convex Optimization)可以说风靡机器学习界。
第二,2011年的图灵奖授予了加州大学洛杉矶分校教授珀尔(JudeaPearl),他主要的研究领域是概率图模型和因果推理,这是机器学习的基础问题。图灵奖通常颁给纯理论计算机学者,或者早期建立计算机架构或框架的学者。而把图灵奖授予珀尔教授具有方向标的意义。此外,2015年《科学》和《自然》杂志连续发表了4篇关于机器学习的综述论文。而且,近几年在这两个杂志上发表的计算机学科论文几乎都来自机器学习领域。
第三,机器学习切实能被用来帮助工业界解决问题。特别是当下的热点,比如说深度学习、AlphaGo、无人驾驶汽车、人工智能助理等对工业界的巨大影响。当今IT的发展已从传统的微软模式转变到谷歌模式。传统的微软模式可以理解为制造业,而谷歌模式则是服务业。谷歌搜索完全是免费的,服务社会,他们的搜索做得越来越极致,同时创造的财富也越来越丰厚。
财富蕴藏在数据中,而挖掘财富的核心技术则是机器学习,因此谷歌认为自己是一家机器学习公司。深度学习作为当今最有活力的机器学习方向,在计算机视觉、自然语言理解、语音识别、智力游戏等领域的颠覆性成就,造就了一批新兴的创业公司。工业界对机器学习领域的人才有大量的需求。不仅仅需要代码能力强的工程师,也需要有数学建模和解决问题的科学家。
现在计算机界戏称机器学习为“全能学科”,它无所不在。除了有其自身的学科体系外,机器学习还有两个重要的辐射功能。一是为应用学科提供解决问题的方法与途径。对于一个应用学科来说,机器学习的目的就是把一些难懂的数学翻译成让工程师能够写出程序的伪代码。二是为一些传统学科,比如统计、理论计算机科学、运筹优化等找到新的研究问题。因此,大多数世界著名大学的计算机学科把机器学习或人工智能列为核心方向,扩大机器学习领域的教师规模,而且至少要保持两三个机器学习研究方向具有一流竞争力。有些计算机专业有1/3甚至1/2的研究生选修机器学习或人工智能。
机器学习现在已成为统计学的一个主流方向,许多著名大学的统计系纷纷从机器学习领域招聘教授,比如斯坦福大学统计系新进的两位助理教授来自机器学习专业。计算在统计领域已经变得越来越重要,传统多元统计分析是以矩阵分解为计算工具,现代高维统计则是以优化为计算工具。
二、机器学习技术发展水平
机器学习可以跟踪每个客户在购买过程中的位置,并定制其建议。亚马逊拥有互联网上最好的推荐引擎之一,机器学习推荐带动了销售额的55%。了解客户购买模式有助于提高销售额,并使预测库存需求更加容易,特别是对于季节性和基于趋势的项目。
三、机器学习行业市场规模分析
图表:2019-2022年机器学习行业市场规模

2022年中国机器学习应用规模约为237亿元,下游应用领域以金融为首;2022年,中国金融领域机器学习产业规模占比为37.5%,工业领域产业规模占比为12.1%,工业领域产业规模后期长空间较大。
四、机器学习应用领域分析
1、自动驾驶
在消费领域,我们看到最多的机器学习应用,莫过于无人驾驶技术。许多无人驾驶汽车还处在测试阶段,在公共道路上实现完全自动驾驶的想法还处在起步阶段。
当自动驾驶汽车在公路上行驶时,必须能够实时响应周围的情况,这一点至关重要。这意味着通过传感器获取的所有信息必须在汽车中完成处理,而不是提交服务器或云端来进行分析,否则即使是非常短的时间,也可能造成不可挽回的损失。
因此,机器学习将是汽车数字基础设施的核心,使它能够从观察到的环境条件中进行学习。对于这些数据,一个特别有趣的应用是映射——汽车需要能够自动响应现实世界的周围环境,以更新地图。因此,每辆车都必须生成自己的导航网络。
自动驾驶已经成为近两年传统车企与科技公司争夺的热点领域,大众、本田、丰田、福特、通用、博世等传统车企或零部件企业通过自主研发或合作等方式,开发自动驾驶汽车;高通、三星、英特尔等公司通过开发自主驾驶芯片来抢占自动驾驶领域的一席之地;谷歌、特斯拉、亚马逊、微软等科技巨头更是通过技术优势提前布局自动驾驶。
在我国,自动驾驶更是提到了国家战略的高度,全国各地纷纷启动无人驾驶汽车示范区项目。百度开放自动驾驶平台,帮助汽车行业及自动驾驶领域的合作伙伴快速搭建属于自己的完整的自动驾驶系统。
2、制造业
与自动驾驶汽车一样,随着物联网的发展,制造业企业可以从安置在生产线各环节的传感器收集大量的生产数据。
然而,这些数据并没有被充分利用。随着从复杂系统收集到众多参数的数据,数据分析变成了一项艰巨的任务。机器学习在制造业中的最大应用将是异常检测。
据统计,到2030年,全球的淡水需求预计将超过供应近40%。为协助各企业实现净零水循环使用的目标,美国水处理公司Ecolab(艺康集团)正通过包括Azure和Dynamics CRM Online在内的微软云平台帮助全球企业实现可持续运营。
与全球各地数以千计传感器相连的云平台能收集实时用水数据,并通过机器学习和商业智能分析全球各地的生产用水运营解决方案,不仅提高效率,还能降低水、能源消耗及运营成本。
2017年,机器学习也将推动工业自动化的实现,通过观察生产线和数据流来学习,并能够精确优化生产过程,降低生产成本,加快生产周期,从而节省人工分析数据的时间成本和资金成本。
天机智能作为深圳长盈精密的全资子公司,通过自动化改造,帮助公司提升生产工艺装备的自动化和智能化水平。该公司用机器取代了90%的劳动力,生产率提高了80%,产品缺陷率也显著减少了2.5倍。目前,工厂只有60名工人检测和管理生产线,以及维护计算机系统。
欲了解更多行业的未来发展前景,可以点击查看中研普华产业院研究报告《2024-2030年中国人工智能行业发展前景及投资战略分析报告》。






















研究院服务号
中研网订阅号