龚克:从国家战略和产业发展特征看智能计算(附演讲PPT下载)
2019-09-11 20:10:39
  • 0
  • 0
  • 0

来源:人工智能计算大会

8月27-28日在北京国际饭店举行的AICC2019人工智能计算大会上,中国新一代人工智能发展战略研究院执行院长龚克,从智能计算的国家战略高度、产业发展现状、趋势以及产业特征等维度,全方位阐释了我国人工智能发展的机遇与挑战。此举被业界视为智能计算国家政策研究与产业落地的风向标,极具指导意义。

龚克院长所在的中国新一代人工智能发展战略研究院作为AI产业重要的“智囊”,汇集了一批院士团队形成高端智库平台。并旨在为发展中国新一代人工智能科技产业,提供引领产业变革的方案对策,制订总体战略和阶段性规划,促进智能科技服务国家治理和社会发展。今年11月,龚克将赴任世界工程组织联合会主席,这也是该组织成立50年以来首次由中国科学家当选主席。现将龚克在AICC2019人工智能计算大会上发表的主题演讲《从国家战略和产业发展特征看智能计算》实录分享如下。

大家上午好,我来自中国新一代人工智能战略发展研究院,这是中国工程院和天津市人民政府共同创建的依托于南开大学的软科学研究院,研究人工智能发展战略。

我想谈的第一个问题开始前,先请大家看下这张图片:

图中有2017年美国政府发布的关于人工智能的报告,然后是日本的,英国的,法国的,欧盟的……从这里我们看到世界各国政府都高度重视人工智能发展,把它作为国家发展战略。中国在2017年7月也发布了《中国新一代人工智能发展规划》。今年6月份美国更新了它的人工智能研究发展规划,它不仅制定规划,而且根据形势发展不断调整规划。

接下来介绍一下我们国家关于人工智能发展规划的战略部署。

首先看它的框架,分成6个部分,第一部分分析它的战略态势,提出总体要求,部署重点任务,规定了资源配置、保障措施、组织措施等等。

我们来看对战略态势是怎么分析的。

人工智能发展进入新阶段,人工智能成为国际竞争的新焦点,人工智能成为经济发展的新引擎,人工智能带来社会建设的新机遇,人工智能的发展不确定性带来新的挑战。最后说到我国具有人工智能发展的良好基础和明显不足。这是中国工程院从2015年到2016年用两年时间做的咨询报告,对其做了详细分析。

中国在人工智能发展有哪些良好基础呢?我们基本形成共识的,有五个方面。

1. 在语音识别、视觉识别方面技术世界领先;

2. 自适应自主学习、直觉感知、综合推理、混合智能和群体智能等初步具备跨越发展的能力;

3. 中文信息处理、智能监控、生物特征识别、工业机器人、服务机器人、无人驾驶逐步进入实际应用;

4. 人工智能创新创业日益活跃,一批龙头骨干企业加速成长,在国际上获得广泛关注和认可;

5. 加速积累的技术能力与海量的数据资源、巨大的应用需求、开放的市场环境有机结合,形成了我国人工智能发展的独特优势。我们需要继续培育它,用强有力的算力支撑它的发展。

同时也要清醒地看到,我国人工智能整体发展水平与发达国家相比仍存在差距,主要体现在以下四个方面:

1. 缺少重大原创成果,在基础理论、核心算法以及关键设备、高端芯片、重大产品与系统、基础材料、元器件、软件与接口等方面差距较大;2. 我们科研系统和企业尚未形成具有国际影响力的生态圈和产业链,缺乏系统的超前研发布局。这个在2017年以来已经做了一些工作,去年我们科技部的人工智能科技专项已经启动,基金委和其它科技计划也都加大了对人工智能这方面的投入。我们今天的人工智能计算大会也是为了创造这样的生态,把学术界、政府、企业界各方面应用者聚集在一起,也是为了打造我们的生态;3. 人工智能尖端人才远远不能满足需求;4. 适应人工智能发展的基础设施、政策法规、标准体系亟待完善。

在这样的背景下,提出了中国发展人工智能的总体要求,这个总体要求是什么呢?

要加快人工智能和经济社会深度融合,这是主线,提升新一代人工智能科技创新能力,这是主攻方向,发展智能经济、智能社会,构筑知识群、技术群、产业全互动融合和人才、制度、文化相互支撑的生态系统,我想今天的会议也是为了打造生态系统,这是我们总体要达到的一个目标。

总体布局我们简单称之为“1234”

1. 构建开放协同的人工智能科技创新体系,这是一个体系,而不是好多体系,这就要求把我们国家的各个创新主体连结起来,形成一个开放创新体系;

2. 把握技术特性,人工智能有技术属性、社会属性,这两者属性有机统一起来把握好,现在大家对于AI伦理问题、公平问题有很多质疑,这些要很好的治理;

3. 坚持研发攻关、产品应用和产业培育一体推进;

4. 全面支撑科技、经济、社会发展和国家安全。

重点任务包含六点:

1. 构建开放协同的科技创新体系;2. 培育高端高效的智能经济;3. 建设安全便捷的智能社会;4. 加强人工智能领域军民融合;5. 构建泛在安全高效的智能化基础设施体系;6. 前瞻布局新一代人工智能重大科技项目。

从研发角度来讲,重点放在什么地方?1+5,1是人工智能基础理论和关键技术,这是毫无疑问的,我们要把脚踩在地上,必须要加强我们基础理论和关键技术。比如去年启动的第一期人工智能科技专项,集中放在了基础理论和核心技术方面。从技术角度来讲,规划定义了五项技术作为新一代人工智能的特征性技术要重点加以发展,大数据智能、群体智能、人机混合智能、自主无人智能、跨媒体或者多模态的智能。

比如跨模态的问题,现在有一种对话器,不仅可以听音,而且可以做聋哑人语言手势,它可以看懂,但它不能同时解决听声音和看图像的结合。我们打电话讲不清楚,说约时间见面谈,见面和电话有什么不一样?因为见面不光是语言,见面有手势、表情、肢体语言等等,这说明人在感知时候实际上是耳朵和眼睛同时在感知的,但耳朵和眼睛同时感知在计算上很好融合在一起需要很好的模型,特别是当有些人口是心非,表情和语言不一致时候怎么判断,耳听为实?还是眼见为实?所以需要在技术上进一步突破。

目前,根据部署,我们从2017年底,建立前面四个开放创新中心,到2018年底增加一个是智能影像,我们建立了5个开放创新平台,有什么特点呢?

第一针对应用的,自主驾驶、城市大脑,医学影像、智能语音、智能影像,都是应用在导向,这有助于防止出现一些泡沫。同时这些都是民营企业,这里体现了PPP,这也是我们在过去科技计划里从来没有过的这样一种布局。

六项重点任务,其中与计算特别紧密结合第一项和第五项。第一项提出来构建开放协同的创新体系,创新体系是用这样几个平台支撑的,有人工智能开源软硬件基础平台,群体智能的服务平台,增强混合智能的支撑平台,增强混合是指人类和机器智能增强混合,自主无人系统的支撑平台,人工智能基础数据和安全检测平台,其中特别谈到在混合增强里面要建立人工智能的超级计算中心,大规模超级智能计算的支撑环境,这就是我们今天来开会大家共同商讨要实现的这样的目标。

在第五项任务里头,要构建泛在的安全高效的智能化基础设施体系。它谈到了优化网络基础设施,统筹利用大数据基础设施,建设高性能、智能计算基础设施,提升超级计算中心对人工智能应用的服务支撑能力,后面还有能源互联网等等。我们可以看到,现在正在部署几个项目之中的新的面向智能的超级计算中心,其中非常重要的一个任务不仅是继续比赛速度提高,更要支撑人工智能的智能计算。

谈到智能化基础设施,涉及三个层面的基础设施。

网络基础设施,这是必须有的,我们现在加快部署第五代移动通信就是要支持这个,网络基础设施是非常重要的内容。

大数据基础设施,没有足够多开放充分的高质量数据无法支撑今天的人工智能。

我们知道人工智能非常重要一个基础设施是计算能力,算力是智能时代的核心生产力,这里面谈到要继续加强超级计算的基础设施,分布式计算基础设施和云计算中心的建设,构建可持续发展的高性能计算的应用生态环境,推进下一步的超级计算机研发应用,现在正在实施之中。

我们归结起来看我们的国家战略,谈了这么多部署以后,我们智能计算在什么地方呢?智能计算把它放在了基础性的支撑地位,我试着表达一下,这是我的观点。

新一代智能计算不仅要在运算速度上达到新的水平,而且要在支撑智能化应用上促进它形成一个新局面。我个人建议我们要高度重视开放强大的人工智能应用服务平台的建设,因为我们计算是为应用服务的,应该是应用来导向的,另外我们特别希望,在座大多是搞计算的,特别是浪潮这样的计算硬件基础设施,能够更加主动和国家建立的各个开放创新平台构成战略性合作,百度谈到了浪潮合作给了他支撑,如果把合作进一步强化,对于打造我们基础设施毫无疑问是必要的。

另外我们从计算来讲,过去我们总是用浮点的运算速度衡量我们计算能力,我想现在我们应该面向人工智能的智能计算能力建立起我们一个新的测评系统,因为这个不是简单用多快的浮点计算能够来描述这样能力的,这个能力到底怎么来描述、怎么发展,这个世界上还没有统一标准,我们需要自主创新把这个东西建立起来,形成一个我们面向智能计算的很好的评测的引导。

当然我们还要来探索智能计算对于智能制造、数据和算法的治理来提供支撑。说到治理,我们可以讲一些哲学、伦理的原则,但这个原则要在技术上能实现,我们要求人工智能是公平的,怎么检测公平性,支撑公平性,我们必须要有技术手段。

接下来再向大家汇报一下我们研究院从去年年初成立以来做的一项工作,我们对全国的智能科技产业开展了一年多的调研,我们调研的目的是试图刻画智能科技产业发展的形态特征,因为它和其他产业不一样,甚至和互联网产业也有所区别。

我们首先把智能产业看作一个多主体作用的复杂适应系统。它不是一个、一类主体,它有好多,其中企业是最重要的。根据我们收集的材料在全国识别出来745家企业,我们认为它的核心技术、主要服务方向应该叫做智能科技企业,这个数比别的报告要少,我们经常看到两千多、四千多的报道。我们根据我们的标准识别出745家企业;有94家大学是和这些企业、和人工智能研发密切相关的,75个科研院所,还有很多链接者包括各项会议,包括今天的人工智能计算大会也是链接者之一,还有联盟组织。我们在745家后面找到1780家投资者,包括他们之间的互相投资;还有政府的政策,产业园建设,我们样板总量是4098个。根据这个样板,以745家企业为核心,看到这张图:

每一个点开始核心的点都是一个企业,我们看这个企业钱从哪儿来的,然后看到后面的投资者,然后看人才从哪儿来,可能是大学出来的,再看技术从哪儿来的,可能另外一个科研机构出来了,再看钱向哪儿去,因为很多企业有投资,向谁投,他的技术向谁输出,如果人员跳槽到哪儿去,比如王海峰是从微软跳出来的到了百度,这就构成了关系图,我们这个关系图看的比较清楚的几个点,阿里巴巴、腾讯、百度,说明他们在人财物上连接非常广泛,我们用复杂的系统分析他们,样本节点745个,他们构成的节点的总数,连接线有15000多个,反映人财物相互的联系。注意节点平均距离不到3,在统计意义上一个公司和另外一个公司,一个节点和另外一个节点之间超不过三个,你看腾讯、阿里都是连着的,最多中间隔了三个企业,人财物就勾连起来了。

这个表明互联网企业都有着更加紧密的连接,所以我们认为这种高度连接是产业发展的生态。

谁在主导这个产业的发展?连接度特别强的节点主体起着主导作用。

我们看到中心度特别高的一个样本节点是腾讯,腾讯为什么中心度这么高呢?因为它从几年前就开放了腾讯云的服务,然后阿里、百度、华为等等一路下来,这些中心都高的企业,是其主导作用的企业;从关系节点看,有突出作用的是清华大学、红杉资本、IDG、北大等等,这些关系通过这个图被揭示出来了。

谁在提供人力资源?

我们看到700多个企业里面核心技术人员他们前期的学习经验,四分之三是在中国学习的,四分之一在国外学习的,在前期工作经验,80%是在中国工作的,也有20%从国外直接回到这些企业里成为它的技术骨干。这边列出来看到中国提供前期学习经验的最主要的学校是清华大学,然后北大等等,国外是哪些学校?斯坦福、卡耐基梅隆等等。前期工作经验,国内的,百度出来的好多人,在阿里工作、腾讯工作过。国外在哪儿获得工作经历呢?微软,在微软工作过的非常多,谷歌、IBM,还有微软亚洲研究院。

再看技术从哪儿来的?

大量技术赋能,这是输出,与技术输入占3成,输入与输出是三七之比。这些企业,平均起来,技术输入主要来自国内,其中只有18%来自国外,现在更多国内技术在相互赋能,往外赋能90%赋给国内企业,其中不到10%即9.5%赋能给国外企业,国外也有买中国技术过去。这里看到,阿里有输入和输出数,腾讯也是这样,腾讯从输出来讲现在是最多的,阿里输入来讲是最多的,这是我们看到的情景。

这是投资者,谁在进行投资?

我们从这边看腾讯、百度、阿里、科大讯飞,去年年底还没有商汤,这是科技部五个开放平台,当时四个开放平台,我们可以看到四个开放平台相互之间的投资关系,比如说阿里和百度通过中国联通连着,和腾讯之间联系其实更多,这里头我们看到在这个平台上,我们单独看刚才五个技术平台,他们的融资,技术输入和技术输出情况,他们获得的投资和对外进行投资的情况。

归结起来我们看到的是什么呢?我们看到智能产业的发展具有链接、聚集、赋能、加速和扩散这样明显的特征,这个特征和制造业相比,和通信产业相比,它的链接特征非常明显,所以我们想到我们智能计算本身向智能化发展进程中,刚才王恩东院士谈到产业智能化,我们自己产业在智能化过程当中不仅要探索我们怎么利用人工智能来提升我们的能效,还要来改进我们的运维,来普及我们的智能计算,比如要搞操作系统。设想假如没有Windows操作系统,有多少人会用计算机,以前只有专业的人才能有计算机,后来有了Doc之后,不那么专业的人开始用了,有了Windows所有人都开始用了。

我认为一个非常重要的事情,就是大家怎么探索和培育出开放、互联、共赢的智能计算连接的生态出来。

人工智能的发展不仅要发展技术,突破现在技术上的问题,而且要实现有效的治理。这里我列举了我们面临的技术瓶颈,其中最重要的技术瓶颈是算法可解释,以及能耗问题,能耗很大程度上是体现在计算上面的。

除了技术问题,我们还要关心安全、可靠和可控问题,这是总书记多次强调的问题。比如算法是不是公平,我们要建立算法公平性的指标,要变得可衡量,这些要训练,比如说这是美国出现的事情,它利用人工智能在筛选犯人假释的时候,它就把所有黑人拒绝了,有的公司招聘员工的时候把所有女士筛除出去了,这些问题出在哪儿呢?是出他用的进行训练的数据以前带有偏见,比如这个公司以前没有招聘女的,现在并非有意不招聘女的,但由于训练它的数据带上了这些东西以后变成了算法,它是固化下来的,这是很可怕的。

我们需要发展一些办法来检测它,比如谷歌提出来算法公平性检测这些等等。这些都要在我们这儿给它发展起来,这里是《人工智能技术治理的总体框架》,也就是智能从一开始提出需求的时候我们要分析这个需求中间是不是有不合伦理的地方。另外,我们在进行数据的采集和训练的时候,数据准备的时候要确保数据的正确性、确保数据分布的平衡性、公平性,来消除数据导致的偏差。在进行设计和训练的时候要根据伦理规范设计模型结构进行模型训练,它要具有人类的伦理道德。然后我们在检测模型的公平性、可靠性和解释性的时候也要把伦理要求加入进去,最后在应用实验中进行反馈,这样形成一个闭环的完整的人工智能治理的框架。

有人提出过一个问题,人工智能这个东西到底是狼还是狗,狗是人类的朋友,没有问题的,如果是狼的话虽然长的像狗,它威胁人类的生存,从这里看出来哪个是狼,那边是狼,狼和狗我们能分出来,但这个能分出来吗?我们现在这个时候,我们要确保我们养的不是狼,我们发展的是为我们服务的狗。

今年7月24号中央组织全面深改领导九次会议,通过了一个《国家科技伦理委员会的组建方案》,这个科技伦理会一上来提出来科技伦理要求,而且第一件工作就是要做关于人工智能的伦理方面的工作,今年6月份发布了《关于新一代人工智能治理原则》,副标题就是发展负责任的人工智能,提出来了和谐友好、公平公正、包容共享、尊重隐私、安全可控、共担责任、开放协作、敏捷治理这么八条原则,但这八条原则必须要靠我们的计算能够让它落地,也就是发展负责任的人工智能必然要求负责任的智能计算。

我今天的报告说到这儿,谢谢大家!

最新文章
相关阅读