当前位置:首页 > 动态信息

动态信息

斯坦福大学《人工智能指数报告》揭示人工智能领域发展趋势

来源:世界科技研究与发展 发布日期:2021-03-22 阅读:28

 

  斯坦福大学2021年3月初发布《人工智能指数报告2021》(Artificial Intelligence Index Report 2021),该报告是斯坦福大学“以人为中心的人工智能研究所”(Human-Centered Artificial Intelligence Institute,HAI)的一项研究项目的成果,其年度报告开始发布于2017年,2021年报告是其第4个年度报告(2020年空缺)。该《人工智能指数报告》跟踪、整理、提取和可视化与人工智能(AI)相关的数据,旨在为决策者、研究人员、管理者、记者以及公众等提供公正、经过严格审查的全球数据,以发展对人工智能这一复杂领域的认识。报告旨在成为国际上最可信和最权威的人工智能数据和见解来源。

  该报告显示,中国已经成为人工智能领域发表论文(包括期刊论文及同行评议会议论文)最多的国家(超越美国和欧盟)。中国的AI论文占世界总数的22.4%,欧盟为16.4%,美国为14.6%。在同行评审期刊论文方面,中国占总数的18%,美国为12.3%,欧盟为8.6%。但在科研机构与人工智能应用公司合作成果数量上,美国仍保持领先。在引用率方面,排在前列的是新加坡、澳大利亚和瑞士。

图1  同行评议的人工智能论文发表数量占比(占全球%)变化趋势

 

  报告分析指出,美国2021财年(2020年10月至2021年9月)用于军事领域人工智能研究的预算或达到50亿美元,民用人工智能领域的预算或达到15亿美元。

  《人工智能指数报告2021》包括研究与开发、技术性能、经济、人工智能教育、人工智能应用的伦理挑战、人工智能的多样性、人工智能政策和国家战略等7个部分。

 

  1 报告研究方法

  1.1 数据源与数据库

  1)以Scopus数据库、arXiv数据库中收录的人工智能相关文献为研究对象,分析人工智能期刊论文、被引量等分布情况。

  2)以LinkedIn中注册人员相关信息分析各国人工智能招聘情况。

  3)麦肯锡公司从2020年6月9日到2020年6月19日进行实地调查,收集了2395名代表各地区、行业、公司规模、功能专业和任期的参与者的统计数据,了解各组织使用人工智能的情况。麦肯锡公司还在2020年5月至8月期间对企业高管进行了采访,询问他们公司对人工智能的使用情况。

  4)计算机研究协会(Computer Research Association,CRA)Taulbee Survey在每个学年的秋季学期对200余个博士学位授予部门收集相关调查数据,分析人工智能博士学位授予情况。

  5)根据《泰晤士报高等教育》的《2021年世界大学排名》和《2020年新兴经济体大学排名》,将相关调查问卷分发给73所大学,根据调查结果分析人工智能指数情况。

  6)以Joint Research Centre数据库为数据来源,通过文本挖掘技术,识别数据库中与人工智能相关的教育研究项目。

  7)在有关人工智能、机器学习的会议论文、期刊论文等标题中搜索与伦理相关的术语,分析有关人工智能伦理问题被讨论的情况。

  8)从Bloomberg Government(BGOV)数据平台中获得美国政府预算和合同数据,基于该平台,统计在合同支出、国防和工程预算、国会议事录中有关人工智能的出现情况。

  9)从Parliament of Canada website(加拿大议会网站)、U. K. Parliament(英国议会网站)、U. S. Congressional Record website(美国国会记录网站)中检索有关人工智能、机器学习等术语出现情况。

  10)从智库、政策和学术研究界,民间组织、协会和财团界,行业和咨询界等三大类组织中,选取36个具体组织分析其发表的人工智能相关政策论文情况。

 

  2 报告主要研究结论

  2.1 研究与开发

  1)人工智能期刊论文发文量从2019年到2020年增长了34.5%,明显高于比2018年到2019年(19.6%)增长百分比。

  2)在主要国家和地区,学术机构发表的同行评审的人工智能论文比例最高。各个国家位居第二的机构有所不同:在美国,企业附属研究机构发表论文占论文总数的19.2%,而政府所属研发机构在中国(15.6%)和欧盟(17.2%)是发表论文第二多的机构。

  3)2020年,人工智能期刊论文引用量中国首次超过美国,在2004年人工智能期刊论文发表量中国曾一度超过美国,2017年再次领先。然而,在过去的十年里,人工智能会议论文引用数美国一直(并且明显)比中国多。

图2 人工智能期刊论文引用量占比(占世界%)分布变化趋势情况

 

  4)为了应对COVID-19,大多数主要的人工智能会议都以线上虚拟方式举行,因此出席人数显著增加。2020年,九次会议的与会者人数几乎翻了一番。

  5)仅在过去六年中,arXiv数据库中收录的人工智能相关论文数量增加了6倍多,从2015年的5 478篇增加到2020年的34 736篇。

  6)人工智能论文数量占2019年全球所有同行评审论文数量的3.8%,高于2011年的1.3%。

图3  arXiv数据库中收录的人工智能相关论文数量变化趋势

 

  2.2 技术性能

  1)生成一切:人工智能系统现在可以以足够高的标准合成文本、音频和图像,以至于对于某些受限的技术应用,人类很难分辨合成和非合成输出的区别。这有望产生大量的人工智能下游应用,既有对社会有用的,也有不太有用的。这也促使研究人员投资于检测生成模型的技术;深度假货检测挑战(DeepFake Detection Challenge)数据显示了计算机应如何更好地区分不同输出。

  2)计算机视觉的产业化:计算机视觉技术在过去十年中取得了巨大的进步,这主要归功于机器学习技术(特别是深度学习)的应用。新的数据显示,计算机视觉正在工业化:在一些最大的基准上,性能开始变平,这表明社区需要开发和商定更难的基准来进一步测试性能。公司正在投入越来越多的计算资源,以前所未有的速度训练计算机视觉系统。同时,用于部署系统的技术,如用于分析视频静止帧的对象检测框架正在迅速成熟,这表明人工智能的进一步部署。

  3)自然语言处理(NLP)超过了它的评估指标:NLP的快速发展产生了人工智能系统,其语言能力显著提高,这些系统已经开始对世界产生有意义的经济影响。谷歌和微软都在它们的搜索引擎中部署了BERT语言模型,从微软到OpenAI等公司都开发了其他大型语言模型。自然语言处理的进展如此迅速,以至于技术进步已经开始超过测试它们的基准。这可以从在SuperGLUE上获得人类水平性能的系统的快速出现中看出,SuperGLUE是一种自然语言处理评估套件,是为了响应早期自然语言处理进展超过GLUE评估的能力而开发的。

  4)新的推理分析:大多数技术问题的度量都会在固定的基准上为每个时间点显示最佳系统的性能。为人工智能算法开发的新的分析方法提供了一些新的指标,这些指标考虑到一个不断发展的基准,并允许随着时间的推移,将一组系统的总体性能的一部分归因于单个信用系统。这些被应用于两种符号推理问题,即自动定理证明和布尔公式的可满足性。

图4  视觉问答(VQA)挑战的准确性变化趋势

 

  5)机器学习正在改变医疗保健和生物学领域的游戏规则:随着机器学习的采用,医疗保健和生物学行业的格局发生了巨大变化。DeepMind的AlphaFold应用深度学习技术,在长达数十年的蛋白质折叠生物学挑战中取得了重大突破。科学家使用机器学习(ML)模型来学习化学分子的表示,以便制定更有效的化学合成计划。人工智能初创公司PostEra在疫情大流行期间使用基于机器学习(ML)的技术来加速COVID-19 相关药物的发现。


  2.3 经济

  1)“药物、癌症、分子、药物发现”在2020年获得了最多的人工智能私人投资,超过138亿美元,是2019年的4.5倍。

  2)巴西、印度、加拿大、新加坡和南非是2016年至2020年人工智能人才招聘增长最快的国家。尽管新冠肺炎疫情大流行,但2020年,人工智能人才招聘在这些国家继续增长。

图5  人工智能领域人才招聘指数居前的主要国家

 

  3)越来越多的人工智能私人投资正流向越来越少的初创企业,新投资的公司数量连续第三年下降。但2020年人工智能私人投资总额比2019年增长了9.3%,高于2018年至2019年(5.7%)的增长。

  4)麦肯锡的一项调查显示,尽管越来越多的人呼吁解决与使用人工智能相关的伦理问题,但该行业解决这些问题的努力有限。例如,人工智能中的公平和公正等问题仍然很少受到公司的关注。与2019年相比,2020年将个人隐私风险视为相关风险的公司较少,且公司正在采取措施减轻这些特定风险的受访者比例没有变化。

  5)尽管新冠肺炎疫情大流行导致了经济衰退,但麦肯锡调查的一半受访者表示,疫情对他们在人工智能方面的投资没有影响,而实际上27%的人报告说他们增加了投资。不到1/4的企业减少了对人工智能的投资。

  6)从2019年到2020年,美国人工智能工作岗位的比例有所下降,这是六年来的首次下降。2019年至2020年,美国人工智能岗位总数也下降了8.2%,从2019年的325 724个降至2020年的300 999个。

 

  2.4 人工智能教育

  1)2020年进行的一项人工智能指数调查表明,在过去的四年里,世界顶尖大学增加了对人工智能教育的投资。在过去的四个学年中,面向学生在本科和研究生阶段构建或部署实用人工智能模型所需技能的课程数量分别增加了102.9%和41.7%。

  2)根据计算研究协会(CRA)的一项年度调查,在过去的10年里,北美更多的人工智能博士毕业生选择在工业部门工作,而选择在学术界工作的人更少。在过去十年中,选择工业部门岗位工作的新毕业的人工智能博士的比例增加了48%,从2010年的44.4%增加到2019年的65.7%。相比之下,新毕业的人工智能博士进入学术界的比例下降了44%,从2010年的42.1%降至2019年的23.7%。根据CRA的调查,在过去的10年里,人工智能相关博士在美国获得的博士学位总数中所占的比例从14.2%上升到2019年的23%左右。与此同时,其他以前流行的计算机科学博士的受欢迎程度已经下降,包括网络、软件工程和编程语言。与2010年相比,这些专业的博士学位都有所减少,而人工智能和机器人/视觉专业则大幅增加。

  3)经过两年的增长,北美从大学转到工业岗位的人工智能教师人数从2018年的42人下降到2019年的33人(其中28人是终身教职,5人未经培养)。卡内基梅隆大学在2004年至2019年间的人工智能教师离职人数最多(16人),其次是佐治亚理工学院(14人)和华盛顿大学(12人)。

图6 北美从大学转到工业岗位的人工智能教师人数变化情况

 

  4)2019年,北美新获得人工智能博士学位的国际学生比例继续上升,达到64.3%,比2018年增加了4.3%。在外国毕业生中,81.8%留在美国,8.6%在美国境外就业。

  5)在欧盟,绝大多数专业人工智能学术课程都是在硕士阶段讲授的;机器人和自动化是专业学士和硕士课程中最常讲授的课程,而机器学习在专业短期课程中占主导地位。

 

  2.5 人工智能应用的伦理挑战

  1)自2015年以来,提交给人工智能会议的论文标题中包含伦理相关关键词的数量有所增加,尽管多年来在主要人工智能会议上匹配伦理相关关键词的论文标题的平均数量仍然较低。

  2)2020年,与人工智能的伦理使用有关的五个最受关注的新闻话题是:欧盟委员会发布的关于人工智能白皮书;谷歌解雇伦理研究员蒂姆尼特·格布鲁(Timnit Gebru);联合国成立人工智能伦理委员会;梵蒂冈的人工智能伦理计划以及IBM退出面部识别业务。

图7 大型人工智能会议的论文标题中包含伦理相关关键词的数量分布情况

 

  2.6 人工智能的多样性

  1)十多年来,人工智能博士毕业生和计算机科学(CS)终身教职的女性比例一直很低。根据计算研究协会(CRA)的一项年度调查,北美人工智能博士项目的女性毕业生平均不到所有博士毕业生的18%。一项人工智能指数调查显示,在世界各地的几所大学中,女性教师仅占计算机科学终身教职教师的16%。

  2)CRA的调查显示,2019年,美国居民中人工智能的新增博士毕业生中,45%是白人,22.4%是亚洲人,3.2%是西班牙人,2.4%是非洲裔美国人。在过去10年里,白人(非西班牙裔)新毕业的计算机博士的比例变化不大,平均为62.7%。同期,黑人或非洲裔美国人(非西班牙裔)和西班牙裔计算机博士的比例明显较低,平均分别为3.1%和3.3%。

  3)近年来,在与神经信息处理系统会议(NeurIPS)同办的人工智能研讨会上,黑人的参与显著增加。2019年的出席人数和提交论文数是2017年的2.6倍,而接受论文数是2017年的2.1倍。

  4)在2020年Queer进行的一项人工智能会员调查中,近一半的受访者表示,他们认为该领域缺乏包容性是他们在成为人工智能(AI)/机器学习(ML)领域从业者时面临的障碍。超过40%的受访成员表示,他们在工作或学校经历过歧视或骚扰。

 

  2.7 人工智能政策和国家战略

  1)自加拿大于2017年发布世界首个国家人工智能战略以来,截至2020年12月,已有30多个国家和地区发布了类似的文件。

  2)2020年,全球人工智能伙伴关系(GPAI)和经济合作与发展组织(OECD)人工智能政策观察站和人工智能专家网络的启动,促进了政府间共同努力支持全民人工智能的发展。

  3)美国第116届国会是历史上最关注人工智能的国会会议,在国会立法、委员会报告和国会研究服务局(CRS)报告中提到人工智能的次数是第115届国会的3倍多。2019年和2020年的综合数据表明,美国人工智能政策文件的主要关注点是创新与技术、国际事务与国际安全、产业与监管等议题。

图8  美国人工智能政策文件的主题分布情况(2019-2020)

 

  总之,自从20世纪50年代这项技术首次吸引了计算机科学家和数学家的想象力以来,人工智能已经发展成为一门具有重大商业应用价值的主要研究学科。研究与开发是AI进步的基础。在过去20年里,人工智能出版物的数量(包括会议和预出版文献数据库)急剧增加。包括美国、欧盟和中国等在内的大国都在竞相投资于人工智能这个日益复杂和竞争激烈的领域研究。可以预期,未来数年国际人工智能领域的研发与商业应用的竞争将更加激励。