张正友的报告

GAIR听到第三个,就明白了,这其实是一个学术经历(经历>经验)分享的活动。

张正友的报告在https://www.toutiao.com/i6713143613334749703/

有完整的文本内容,不再复述。

就补充一下我记录的体会吧:

近三、四十年,AI在各种领域上是算法各有擅场、百花齐放,直到近十年来,才被深度学习一统天下。但张博士认为深度学习的局限也是明显的。

光度视觉、几何视觉和语义视觉紧密结合起来,同时注入常识和领域知识,和语言进行多模态融合,才是计算机视觉的未来。

深度学习一统天下,数十年AI从业经验者认为这是有局限的
多种计算机视觉理论和技术的结合点,可能才是真正的计算机视觉的突破口

我的理解就是,深度学习的问题在于,堆砌大量的硬件资源去训练,然后说明自己的高效,其实是不妥的,至少在工程层面是无法有效利用。换句话说,人脑的能量消耗比起机器学习的能量消耗只低不高,一天深度学习做不到人脑这么环保,它的应用局限就很大。

AI语音机器人可能需要的AI技术及应用场景: