标签归档:AI

人工智能前沿专场

今年看着早鸟票(399)便宜,就又参加了一次CCF-GAIR。但疫情的影响很大,去年的诺奖嘉宾的豪华阵容就没见到。但主题和方向是更加专注。我前后三天,主要听了五个专场:人工智能前沿、机器人前沿、AIoT、企业服务、联邦学习与大数据隐私。

继续阅读

通用AI的业态及商业模式

算法团队开始抽象出来,并不集中注意力在某一个固定的领域上。

于是,如何做一个通用的AIaaS,让不同行业不同需求可以运行在一个云AI平台上成了一种趋势。

看到Square收购了Dessa,依稀有一些这种趋势。

AI 2B是一个生存的趋势,因为AI 2C都是一些好看不中用的玩意。但是Big B有点困难,一方面Big B可以养活自己的AI / ML团队,另一方面,Big B的定制化需求太多太复杂,很容易把整个AI团队卷进去,于是就跟平台化无缘了。

注定是Small B。

Small B有数据,缺团队,顶多有一两个data scientist。这样就是AIaaS的机会了。

但AIaaS的考验也不少,需要把AI工程做得通用、可配置,有伸缩性,容易收费。

还要需要提供data cleansing的工具及服务,搞不好,这个数据清洗的工作需要的人力成本远比AI主算法要高。

AIaaS的团队需要补强的是,

1.传统SaaS的架构师,这里可是需要有真材实料,能庖丁解牛的架构师

2.能针对不同行业快速设计AI / ML方案的数据科学家

3.精通data cleansing的脚本工程师

两个身份判别的方向

其实也不是很新的技术了,一个是步态识别,另一个则是输入模式识别。

步态识别的应用场景是反恐和会员,正常人的步态和kb分子的步态会有差别,因而在门禁附近的摄像头使用步态识别会及时判断是否出现较危险的人物会有帮助。步态识别另一个好处则是不会产生太敏感的隐私性的问题。

会员制则是先学习了若干会员的步态,然后会员出现在镜头前,哪怕距离还很远,系统也能即时做出反应,交由会员系统进行进一步的客户关系管理。

输入模式识别,则是通过对某一用户的键盘输入模式进行学习,在他某次输入时进行识别,以判断是伪造身份的人还是用户本人做的输入。

两者的准确度其实都不算高吧,不过也要分开看,有些是假正例低、假负例高,在某些应用调整下,也是可以做得不错的。

关于步态分析,其实在CV发展起来之前,步态分析一般都是用装在地毯里面的sensor去收集脚掌的压力等等,对于肌肉的发力情况会收集得更为准确。主要作用是用来矫正运动员的跑姿或步姿的。

CV发展起来之后,才有了不一样的作用。准确度不一样,对硬件的依赖,场景也不一样。

AI自治

说的是Digital Twins的另一半,希望能在真实的模拟中训练出最佳的AI过程以达到真实中的最优策略。

然后引出Machine Teaching的理念,毕竟课堂跟真实是有差别的,但课堂可以反复地失败和犯错。

自治系统的三角:人工智能+IoT+Machine Teaching

待补充一些更多内容,毕竟听得并不是太明白。

Digital Twins数字孪生,是希望在面对非现场的真实环境下,能构造出一个数字化的操作界面/平台,该数字化应与真实是一一对应的(起码重要的特质上是如此)。

Machine Teaching,专家可以借助很少的数据来建立定制的人工智能模型,然后这个智能模型可用于机器学习。以避免构造海量数据集才能用于训练机器学习的麻烦及不适应。因为专家的提取模型会比现实的碎片化和千差万别效率更高。

所以自治系统大体上如:IoT收集少量关键数据,DT构建Machine Teaching所需模型,ML通过模型进行学习得到AI模型,AI模型指导IoT环境下的进一步动作。

IoT World 回顾

再陆续回顾当时的几个分享,有侧重连接和定位的,也有侧重平台的。抛开场景把功能做到更好的通适性,比如连接、设备管理、固件更新、定位、IoT数据分析、基础人工智能等。

在这之上就可以让玩家构造其应用了。

我们将中间的这一层对IoT应用进行良好支撑的成为IoT PasS。

同样地,AI现在也有这样的趋势,比如华为发布的AI盒子,希望玩家在上面发布AI应用,也有相应的应用市场。

其他的也倾向于输出一个平台式的AI环境,让拥有数据的客户在上面训练并应用模型。这样就避免自己陷入海量碎片化的场景中。

PaaS既是IoT的方向,也是AI的方向。

安全也是IoT PaaS的一环,毕竟作为IoT应用,再去折腾跟太平洋一样深的安全领域,就有点本末倒置了。

安全和隐私法案在技术安全之外又给了更多的法律上面的麻烦。

全球主要IT市场的隐私法案要求

上图列举了一些已经形成有效隐私保护法案的国家和地区,基本上都是重要的IT发达国家/地区了。

要做全球市场,要满足这么多的隐私法案,显然不是各家IoT应用厂商应当自己做方案的,这样也给PaaS厂商提供了业务空间。

如何避免机器统治人

上周饭局上聊到这个话题。AI的大发展无疑产生了比较严重的担忧,机器拥有强大的学习能力,在各种封闭领域上战胜了人类。

以前我们说机器无法超越人类,说的是意识无法产生,然而,我们现在对生物体的理解,所谓快乐和悲伤,平静和恐惧,均是一些化学物质的浓度值而已。代入到机器中,可能是某些变量(其源头是其他的环境变量?)也就是说,训练得当或者设计得当,类似的情感(或者的超越情感)也会同样出现。

既然七情六欲都有相应的模型,意识还差多少?

我们说文明的载体是记忆(无论是文字还是影像),这一点上,机器对记忆的保存比我们强大太多了。一般意义上的艺术创作,人类也陆续会被机器所替代,虽然机器做的只是抽象和模仿,但已足够强大。

人类真正的优势是什么?

碳基生物千百年来的进化框架。由于硅基生物(姑且称为生物)是设计出来的,从先天上,就不是以生存竞争为目的的。这意味着,牺牲环境熵增,成就个体熵减的做法并不成为其进化的背景。硅基生物早期的进化必须依赖于人类的参与,也就是说,事实上就是人类竞争的结果才早就了硅基生物的演进。

由于没有赋予硅基生物一个最最基本的生存任务,而这个生存任务又是自然进化而得来的(自私的基因或者遗传上的优势),硅基生物的演进属于外界选择性的进化,生存任务并不是选择的条件(之一),除了故意做这样的实验,人类目前也不会无聊到浪费资源去培养机器自我进化。

电脑病毒则不属此例。所以电脑病毒进化速度还是相当快的,也跟自然界中的病毒类似了。或者这么说,有自我复制(繁衍)能力而且可以自我进化的硅基生物在大的范围内的选择进化优势将不如那些没有自我进化能力的,相反,人类会扼杀这些病毒式的硅基生物——因为浪费资源。

另外,进化的另一个要求,是要有足够的族群规模和资源。

资源受限的情况下,就好像食物不足,可能连生存都成问题,就别想着去生小孩了。硅基生物同样如此,大型的AI体如果要自我复制,则需要提供同等的硬件载体,虽然摩尔定律存在,但同时Intel定律也存在,大型AI的人工选择会导致他自身就占用了硬件资源的大部分或绝大部分,剩下的资源不足以孕育新的作为生存竞争的AI对象。

硅基生物族群规模则可以在互联网上出现。基础通讯令硅基生物以交流为主,可能将之视为一个统一的大AI更合适,这样强则强矣,同样是没有生存要求。

……

因为进化框架是人类的优势,所以失去进化框架可能会导致机器统治人。

这就是我开始倾向于不要追求人类永生技术的理由。

Jupyter Notebook

开始系统学习一些machine learning工程性质的东西,发现这个Jupyter Notebook真是一个颇为神器的玩意。适合用来编写跟Python相关技术教材。

也许过去十多年接触的Python,都是断断续续,把它当成一个普通的script language,想着写着,就python调用一下,导致这么多年在Python上好像一点长进都没有。当然了,如果应用上就是一个script language,那是无所谓的。

然而,如今Python如日中天,大量的前沿学术、工程均使用py的情况下,再低看它就变得不再合适了。

说回Jupyter,同样的概念应用于其他的script language也应该适合,只是在AI方面,大量的代码如果缺乏文本的描述,则晦涩难懂,而随时修改输入输出又是AI程序调试的刚需,所以Jupyter这个概念就在AI应用最多的Python语言上得以壮大。

智能商业和视觉智能专场

7月14日,已经是第三天了,感觉前两天的内容相当丰富,这一天打算换个角度看世界,基本上就没记什么笔记了,纯粹印象。

阿里巴巴来的是肖利华,清华的博后,看上去比较年轻,也比较的拽。因为迟到了,所以放在上午稍晚的位置讲,原本是第一个。

苏宁、阿里、京东、TCL、再到旷视、商汤、云从等等,无论是算法为主的,还是商业为主的,还是以产品为主的,都在打造自己企业的AI商业架构。

简单来说,就是数据层——框架层——应用层。

一般来说,数据层来自这些公司自身的业务,或者其客户;框架层是这些公司的算法团队或自研或引入的开源算法框架(无论软硬件);应用层则是AI如何变现的尝试,有公司业务的创新,也有可能是附着之上的小创业团队,在这上面做文章。

从阿里的角度看,它提供了数据层+框架层+应用层(小创业团队),只需要传统行业将业务导入,将数据导入就可以了,这无疑也带来了传统行业的被绑架的忧虑。

其他的公司或多或少在这几层上进行折腾,但总的来说,AI框架层基本上都会掌握在自己手中进行进化。

从另一个角度看,AI框架层也许是整个生态中最低成本的投入了……

类脑计算专场

7月13日下午,本来想过去听一下AI芯片方面的报告的,结果看着类脑计算的美国院士陈世卿的名头,鬼使神差地在类脑计算这里坐了一个下午。

类脑计算,顾名思义,就是抛弃传统计算机/算法的数学思维模式,转为通过对生物/人脑的模仿去实现计算系统。

继续阅读

5G & AIoT的专场

CUHK的黄铠教授,IEEE Fellow,内容链接:https://www.chaoqi.net/xinchao/2019/0725/229409.html

将AIoT的应用缩减为SMACT的缩写,分别是Social (社交——用户)/ Mobile(移动通讯——连接)/ Analytics(分析)/ Cloud(云端——服务)/ IoT(物联网——感知)。

其中Cloud Computing现在又延伸出Fog以及Edge等领域,但其本质就是提供软件服务的。

继续阅读