标签归档:AI

The book of why

中文名是因果关系。

给的例子都比较容易看懂,是科学家和专业作家合作的书,虽然思想本身都是来自科学家。

因果识别的三个层次:观测,从而发现关联性;干涉,识别因果线条以及量化关系;反事实推测,得到确定的因果。

后面的一两章开始了对AI的期望,能理解为何不喜欢单纯的数据挖掘,因为那只是第一层的内容,做得再好也是关联性的挖掘,AI必须演进到识别因果关系,才能对人类的事情产生本质的帮助。

大数据必须寻找可解释的关系,比如AI需要理解为何(Why)主人熟睡的时候不应该开吸尘器,而不是单纯记住这一个设定。

强人工智能须主动增加更高维度的理解,不要总是在二维影响中分析明暗,而应该提高维度到三维,产生光影的概念。

AI要试图进行反事实的算法化,即对输入信息有违抗的想法。

作者倒是不觉得AI会邪恶化,相反,他认为AI在得到足够好的信息后,可做出比人类更强的道德判断。

看的时间比较长,记录比较零星,有空再看一遍中文版。

AI DJ

AI承担DJ的工作其实是很正常的,比如现在流行的音乐APP里面,其实都有AI选曲播放的频道。

更多的是,AI可以自行根据旋律创作一些背景音乐(鼓点、midi等),如能,也可以配合现场的IoT环境,控制灯光。

AI可以通过观测现场的人群的反应(CV能力),再进行播放的调整。

当然了,作为chatbot,可以接受现场客人的点唱,也可以提供虚拟形象。

传统零售店智能化 或 无人零售

首先是要考虑最小的修改,毕竟大家手里钱都不多,改动太大或者推倒重来的话,一方面是成本高,另一方面智能店真正完全成功的还不多,大多数都是概念店和体验店。

店面大小,不适宜太大,太小也不好,就考虑那种连锁便利店1~3倍的规模好了。形状规范一点。

SKU控制一下,不超过600?有更多的话,请用减法。

尽量使用现有的基础设施,比如网络,电,监控摄像头,收银台。


AI相关:做现在SKU的数据收集和采集,买也可以。训练模型–>生产环境下的重训练(比如增加或删除SKU等)

需要的硬件或基础设施:摄像头、视频处理硬件(如GPU)、QR Scanner(当然,摄像头也可以)、AI模型服务器(边缘计算够便宜也可以)

AI,其实是CV,也该考虑人脸等隐私特征的保护。


无人零售用AI的目的:

识别顾客,绑定到一个实体/虚拟的账号,并100%跟踪其店内行为

产品识别,品类、数量、状态等

前两者的关系,也就是谁拿了什么东西,多少东西

自助结账。

无人零售的退化版本就是自助售卖机、自助餐食等。

联邦学习与大数据隐私专场

这个专场对于我来说,算是一个扫盲性质的,听了几个讲座后,大概知道联邦学习是一个什么样的模式了。

杨强是港科大的教授,微众银行的高管。他对联邦学习的介绍还是很清晰的:https://www.leiphone.com/news/202008/hBACeSbAY8PIOcbh.html

联邦学习的背景是1.数据的来源碎片化,且难以标准化,2.数据的合规性要求限制了中央处理。

继续阅读

企业服务专场

选这个来听,本意是希望听到关于企业SaaS怎么做的讨论,但遗憾的是,还是偏少。主要是企业服务如何匹配新基建等大方向和大趋势的。

信通院政策与经济研究所副所长何伟,https://www.leiphone.com/news/202008/PG3C7FP2gUzNXNAd.html

重点在于产业发展的时间和方向,企业服务应该与其保持一致。

阿里巴巴副总裁,郭继军,https://www.leiphone.com/news/202008/wvoatM5VImhgvrGQ.html

企业服务中,数据凌驾一切,打通数据间的障碍,后挖掘及形成新的业务。而对阿里来说,目前则不纠结于具体是哪个云,哪一家的云,只考虑将其打通并组合给应用。

继续阅读

机器人前沿专场

次日,选了机器人前沿专场和AIoT专场来听。

开场的报告是加拿大工程院张宏院士作的。他也即将在深圳建立有实验室,但此次是用远程的方式进行演讲。

https://dy.163.com/article/FK6GSE5D0511DPVD.html

讲的范围不多,集中在机器人如何得知自身处在已知地图的何处。包括对视野中的各种物体的标示(全局/全景描述符),Deja vu的时候各种不同的外部环境产生的变化如何识别,二维点云计算即确认,图像粗匹配、精匹配,雷达和视觉的信息融合等等。

不过他说的是已知地图的情况。结合去年有个讲陌生环境下的digital twin构建地图,就可以多机器人联合制作地图并进行相对定位了。

继续阅读

人工智能前沿专场

今年看着早鸟票(399)便宜,就又参加了一次CCF-GAIR。但疫情的影响很大,去年的诺奖嘉宾的豪华阵容就没见到。但主题和方向是更加专注。我前后三天,主要听了五个专场:人工智能前沿、机器人前沿、AIoT、企业服务、联邦学习与大数据隐私。

继续阅读

通用AI的业态及商业模式

算法团队开始抽象出来,并不集中注意力在某一个固定的领域上。

于是,如何做一个通用的AIaaS,让不同行业不同需求可以运行在一个云AI平台上成了一种趋势。

看到Square收购了Dessa,依稀有一些这种趋势。

AI 2B是一个生存的趋势,因为AI 2C都是一些好看不中用的玩意。但是Big B有点困难,一方面Big B可以养活自己的AI / ML团队,另一方面,Big B的定制化需求太多太复杂,很容易把整个AI团队卷进去,于是就跟平台化无缘了。

注定是Small B。

Small B有数据,缺团队,顶多有一两个data scientist。这样就是AIaaS的机会了。

但AIaaS的考验也不少,需要把AI工程做得通用、可配置,有伸缩性,容易收费。

还要需要提供data cleansing的工具及服务,搞不好,这个数据清洗的工作需要的人力成本远比AI主算法要高。

AIaaS的团队需要补强的是,

1.传统SaaS的架构师,这里可是需要有真材实料,能庖丁解牛的架构师

2.能针对不同行业快速设计AI / ML方案的数据科学家

3.精通data cleansing的脚本工程师

两个身份判别的方向

其实也不是很新的技术了,一个是步态识别,另一个则是输入模式识别。

步态识别的应用场景是反恐和会员,正常人的步态和kb分子的步态会有差别,因而在门禁附近的摄像头使用步态识别会及时判断是否出现较危险的人物会有帮助。步态识别另一个好处则是不会产生太敏感的隐私性的问题。

会员制则是先学习了若干会员的步态,然后会员出现在镜头前,哪怕距离还很远,系统也能即时做出反应,交由会员系统进行进一步的客户关系管理。

输入模式识别,则是通过对某一用户的键盘输入模式进行学习,在他某次输入时进行识别,以判断是伪造身份的人还是用户本人做的输入。

两者的准确度其实都不算高吧,不过也要分开看,有些是假正例低、假负例高,在某些应用调整下,也是可以做得不错的。

关于步态分析,其实在CV发展起来之前,步态分析一般都是用装在地毯里面的sensor去收集脚掌的压力等等,对于肌肉的发力情况会收集得更为准确。主要作用是用来矫正运动员的跑姿或步姿的。

CV发展起来之后,才有了不一样的作用。准确度不一样,对硬件的依赖,场景也不一样。