什么是第三代人工智能,其发展趋势是什么?

人工智能从1956年第一次提出来,人工智能已经发展了63年多,最初的第一代人工智能是用计算机来解决问题,第二代是以AlphaGo为标志的深度学习,但是深度学习是基于真正的大数据,在目前似乎也遇到了瓶颈,于是,科学家们提出了第三代人工智能,但是目前来看,还没有人真正明确第三代人工智能是什么,但是其趋势是清晰的。

第一代、第二代人工智能

下面是清华大学人工智能研究院院长、中国科学院院士张钹在《迈向第三代人工智能的新征程》中对三代人工智能的诠释。

第一代人工智能提出符号模型,以知识经验为基础的推理模型,这是人工智能的第一个重大突破。这个突破后来产生了一个结果,就是这个理论提出时有个非常乐观的估计,1956年由西蒙提出,基于这种模型,十年之后机器可以打败所有棋手,二十年以后机器取代人类所有的工作。实际并不是这样,六十年以后机器才打败棋手,机器究竟代替人类的所有工作是什么时间,可能还很遥远,这也是人工智能的另外一个特点,往往被高估。

人工智能的第一代模型,有优点,但是也有很大局限性。这个优点是显然的,因为它是模仿人类的,它可解释,鲁棒性很强,但是它的局限性也非常大。因为最大的问题是人类的知识经验,很难准确表达,这就是产生的后来人工智能冬天的根本原因。当时的应用很有限,几乎没有推广,但是,有了大数据以后,这个问题得到了很大改善,特别是机器的能力提高以后,可以把大量的数据作为知识放在机器里,这就是最典型的沃森系统。

沃森系统可以做癌症的免疫治疗,这里面用多少知识呢?100万个医学杂志中抽取的2500个摘要,400万病人的数据,再加上1861年以前所有药物的专利,它有医学知识,并联的数据再加上药物知识,就可以做癌症的免疫治疗。当然了,很多慢性病的治疗和管理,这个系统也做得很好,中国的国内也有大量这方面的工作在探索和研究。

第二代人工智能,一个最重要的成果就是深度学习。也就是说,第一代人工智能提出来,如果能够很好地利用人类的知识,就可以建立很好的人工智能系统,如果我们有充分数据,也有可能建立起有用的人工智能的系统。

深度学习为什么这么受重视?一个很重要的原因,它有两个重大变化。当网络层次增加以后,有两个重大变化:第一个变化,输入只要原始数据,不需要预处理。第二个是性能提高很多,这就造成了深度学习的重大突破。也就是说,它从一定意义上有通用工具,对领域的知识要求不高,同时能够处理大数据。

最后一个,给大家印象最深就是AlphaGo,大家都知道了。因此就有很多估计,十年之内代替40%以上人类的工作,三五年里面,智能驾驶车就可以量产,等等,刚刚李院士说到了这个问题,他分析得很深刻。实际三五年里面不可能量产。

技术已经完全成熟,我们现在的研究已不成熟,主要是应用问题。为什么在人工智能上往往产生乐观估计?主要原因有两个:一个是对发展人工智能的困难性估计不足,对取得的成果估计过高。一个估计不足,一个估计过高,就产生了问题。另外一个很重要的原因,受历史事件的影响。过去我们发现,有了蒸汽机以后就产生了工业革命,有了电动机发动机以后就产生了电气革命,有了计算机以后产生了信息革命,大家很希望有一个东西出来以后引起人工智能的革命。

现在的问题是,有没有?至今为止,还没有发现人工智能里面的蒸汽机和计算机。曾经最开始寄希望于符号模型,结果发现符号模型也没有那么管用。第二次发现的是大数据+深度学习,以为大数据+深度学习就是人工智能的蒸汽机和计算机,为什么这样?

这不能不考虑到人工智能的特点,我们说深度学习根本不是AI的通用机。现在大家在寻找通用的人工智能,到底有没有,还有争论,不去管它,但至少深度学习不是人工智能。这个非常明显,第一代人工智能也好,第二代人工智能也好,它的应用场景必须满足以下五个条件。

从正面来讲,所有的应用场景,如果满足以下五个条件,计算机绝对能够战胜人类,不管这个问题多么复杂:具有丰富的数据或知识,完全信息,确定性信息,静态,单领域和单任务。

最明显的例子是围棋,围棋多么复杂,但是围棋满足这五个条件,所以计算机战胜在围棋上战胜人类是早晚的事情。所以从正面来讲,如果你满足这五个条件,不管多复杂,计算机绝对战胜人类。长远来看,如果你的应用场景不完全满足这五个条件,其中有些条件不满足,你这个工作就变成困难。自动驾驶为什么如此困难?根本的原因在这里。为什么我们难以做出来廉价、可靠的自动驾驶呢?背后的原因就在这里,因为自动驾驶很多条件都不满足,它不是完全信息,它不是确定性信息,它不是静态的环境,或者是按照确定性规律演化的,它的很多东西是不可预测的,它也不是单领域的,里面有人驾驶的车、行人、其它车辆。所以刚刚李院士提出来专用道,就是把这些东西弄干净,变成单领域。所以我们一直说,如果有些条件是不符合这五条,你就需要下功夫。

现在人工智能能够在这些领域里面得到应用,换句话说,这些领域里面有很多应用产品符合刚才讲的五个条件。如果这些领域里面的应用场景符合五个条件,大家大胆去做,绝对会超过人。根据现在计算机强大的力量,是可以做到这一点的。但是,这些应用里面,也有大量不符合那五个条件的,大家必须下功夫,不能指望靠现在的第一代、第二代人工智能去解决它。

举个简单的例子,复合场景下的决策,完全信息条件下的决策或者完全信息下的博弈,计算机战胜人类是绝对的。下面一个问题,不完全信息的博弈及打牌,大家都知道,今年5月份对扑克牌这个问题也解决了。换句话说,6人无限注的德州扑克,计算机能战胜人类,这就意味着概率意义下的不确定性,机器也可以战胜人类。但是人类的决策环境都不符合前面两个条件。所以在复合环境下的博弈或者复杂环境下的决策,机器跟人类还差得比较远。从这里来讲,应用场景是极为重要的。

这是阿尔卑斯山图片,人起来是,机器看起来也是,只要给它加上噪声,右边这个图和左边那个图,唯一的区别是噪声多一点,人看起来还是阿尔卑斯山,机器看起来是一条狗,而且它的置信度是99.99%,它99.99%认为这是一条狗,非常容易受欺骗,这就说明机器跟人的认知差异非常大。

语音也是同样的道理,前面的英文说的是一句话,我们加上一点点噪声,人听起来还是一样的,机器听起来就是另外的内容,这就非常危险。

搞军事的人说,过去你语音传过去,它进行干扰,你听不见而已。现在语音传过去,它说进攻,可以让你听成退却,加一点噪声就行了,这就是AI的安全性。

另外,缺少自我知识,这是非常重要的。你说我用这个话,让它翻译,「说你行的人行」,这句话计算机怎么翻呢?「说你专业的人行道」,瞎翻,为什么瞎翻?它不知道自己不知道,没有任何自知之明。这是很危险的。为什么翻译成人行道呢?「人行」,它以为是人行道。为什么翻译成「你的专业」呢?「你行」。这是非常危险的。大家想想,我带了一个翻译,翻译水平挺高的,大多数翻译是很准确的,但是他会瞎说,你敢用吗?人类不会,因为他知道这句话如果没有听明白会再问是什么意思,计算机没有自知之明,人贵有自知之明,这是人类智慧的一个部分。怎么让机器有自知之明?这是很困难的事。

下一步,我们现在有个新的历史机遇,就是迈向第三代人工智能。第三代人工智能就要纠正前面说的两个局限性,建立可解释、鲁棒的人工智能理论,发展安全、可信、可用的人工智能技术,促进人工智能的创新应用。

第三代人工智能趋势

近日,AI2000人工智能全球2000位最具影响力学者榜单在清华大学发布,中国学者规模位列世界第二,但高水平学者集中的研究机构匮乏,人工智能领域的人才队伍亟待加强。

AI2000榜单由清华-中国工程院知识智能联合研究中心和清华大学人工智能研究院发布。AI2000人工智能全球最具影响力学者(200名)和提名学者(1800名)分布于全球不同高校和学术机构,美国有1128人次,中国171人次,欧盟有307人次上榜。

发布会上,清华大学人工智能研究院院长、中国科学院张钹院士做了热情洋溢的报告和精彩点评发言。

人工智能研究必须国际化

基础研究,尤其是人工智能领域的基础研究必须国际化,因为只有把全世界的研究人员共同团结起来、利用起来,才能够引领基础研究的发展。为什么目前人工智能领域大多由美国来引领,就是因为美国把全世界最优秀的人才利用了起来。

中国要想在基础研究上引领世界,必须走国际化道路。今天有很多外国留学生来华求学,这是一个好事儿,但我们还可以做一定平衡调整,吸引更广泛国家地区的优秀学生来华学习。

把数据驱动和知识驱动结合起来

人工智能的四大基础是:知识、数据、算法和算力,回顾历史,这四个因素都在不断地发挥作用。第一代人工智能也叫符号人工智能,比较强调知识对智能的作用,因为那时算法和算力都还没有跟上。

进入新世纪后,深度学习把大家的目标凝聚到了数据上,这时大数据的出现,再加上很好的算法,就形成了基于概念的深度学习,再加上云计算等手段,使以数据为基础的连接主义模型得到了极大推广和应用。

数据主义喊了许多口号,导致了我们今天遇到一些困难,按照大数据建起来人工智能系统似乎不可信、不可靠、不安全、不易推广,这都是目前用深度学习进行人工智能研究带来的问题,也可以说是大数据遇到的挑战。怎么来解决这个挑战呢?唯一的办法,就是重新引入知识,把数据驱动和知识驱动结合起来,达成可信安全的第三代人工智能。

常识往往不在数据里

自然语言理解是人工智能领域最核心的问题。不管做机器翻译也好,做自然语言应用也好,都试图通过分析符号序列来理解相关内容,这是第一代人工智能所谓符号主义的核心做法。到了第二代人工智能,又走上深度学习的道路,这条路充满希望,但又非常危险,因为解决不了可信安全的问题。

机器翻译现在只能翻译不重要的东西,因为翻错了也没有关系,真正重要的场合还需要人力同声翻译。机器最大的问题,就在于它缺乏常识,根本不知道自己不知道,这是一个很大的问题。知识包含两方面,一是我知道什么,二是我不知道什么。一个有学问的人,不仅仅表现在他知道的多,更表现在他清楚自己不知道的更多。那些狂妄自大的人,都是没有学问的人,不知道自己能吃几碗干饭,机器翻译也是这个问题。给机器任何句子,它都能翻,根本不懂也能瞎翻。

所以常识是必要的,简单翻译几句话也需要大量尝试积淀,“说你行,不行也行”,机器没有常识,就很难理解这句话,人反而觉得很简单,这就是常识的重要性。但常识库的建立非常之难,现在没法从数据中去建立常识库,因为常识往往不表示在数据之中。

建立常识,必须下功夫去做,只有这个问题解决了,自然语言的理解才能达到目标。而自然语言理解,则是第三代人工智能的终极目标,这是一个艰巨的任务。如果这个问题解决了,人工智能的其他问题将会迎刃而解。

免责声明:本文是网友投稿,与本网无关。本网所转载的内容,其版权均由原作者和资料提供方所拥有!如因作品版权问题需要处理,请联系站长。云知网 » 什么是第三代人工智能,其发展趋势是什么?

赞 (0) 打赏

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址