张正友的报告

GAIR听到第三个，就明白了，这其实是一个学术经历（经历>经验）分享的活动。

张正友的报告在https://www.toutiao.com/i6713143613334749703/

有完整的文本内容，不再复述。

就补充一下我记录的体会吧：

近三、四十年，AI在各种领域上是算法各有擅场、百花齐放，直到近十年来，才被深度学习一统天下。但张博士认为深度学习的局限也是明显的。

光度视觉、几何视觉和语义视觉紧密结合起来，同时注入常识和领域知识，和语言进行多模态融合，才是计算机视觉的未来。

深度学习一统天下，数十年AI从业经验者认为这是有局限的

多种计算机视觉理论和技术的结合点，可能才是真正的计算机视觉的突破口

我的理解就是，深度学习的问题在于，堆砌大量的硬件资源去训练，然后说明自己的高效，其实是不妥的，至少在工程层面是无法有效利用。换句话说，人脑的能量消耗比起机器学习的能量消耗只低不高，一天深度学习做不到人脑这么环保，它的应用局限就很大。

AI语音机器人可能需要的AI技术及应用场景：