标签归档:AI

AI自治

说的是Digital Twins的另一半,希望能在真实的模拟中训练出最佳的AI过程以达到真实中的最优策略。

然后引出Machine Teaching的理念,毕竟课堂跟真实是有差别的,但课堂可以反复地失败和犯错。

自治系统的三角:人工智能+IoT+Machine Teaching

待补充一些更多内容,毕竟听得并不是太明白。

Digital Twins数字孪生,是希望在面对非现场的真实环境下,能构造出一个数字化的操作界面/平台,该数字化应与真实是一一对应的(起码重要的特质上是如此)。

Machine Teaching,专家可以借助很少的数据来建立定制的人工智能模型,然后这个智能模型可用于机器学习。以避免构造海量数据集才能用于训练机器学习的麻烦及不适应。因为专家的提取模型会比现实的碎片化和千差万别效率更高。

所以自治系统大体上如:IoT收集少量关键数据,DT构建Machine Teaching所需模型,ML通过模型进行学习得到AI模型,AI模型指导IoT环境下的进一步动作。

IoT World 回顾

再陆续回顾当时的几个分享,有侧重连接和定位的,也有侧重平台的。抛开场景把功能做到更好的通适性,比如连接、设备管理、固件更新、定位、IoT数据分析、基础人工智能等。

在这之上就可以让玩家构造其应用了。

我们将中间的这一层对IoT应用进行良好支撑的成为IoT PasS。

同样地,AI现在也有这样的趋势,比如华为发布的AI盒子,希望玩家在上面发布AI应用,也有相应的应用市场。

其他的也倾向于输出一个平台式的AI环境,让拥有数据的客户在上面训练并应用模型。这样就避免自己陷入海量碎片化的场景中。

PaaS既是IoT的方向,也是AI的方向。

安全也是IoT PaaS的一环,毕竟作为IoT应用,再去折腾跟太平洋一样深的安全领域,就有点本末倒置了。

安全和隐私法案在技术安全之外又给了更多的法律上面的麻烦。

全球主要IT市场的隐私法案要求

上图列举了一些已经形成有效隐私保护法案的国家和地区,基本上都是重要的IT发达国家/地区了。

要做全球市场,要满足这么多的隐私法案,显然不是各家IoT应用厂商应当自己做方案的,这样也给PaaS厂商提供了业务空间。

如何避免机器统治人

上周饭局上聊到这个话题。AI的大发展无疑产生了比较严重的担忧,机器拥有强大的学习能力,在各种封闭领域上战胜了人类。

以前我们说机器无法超越人类,说的是意识无法产生,然而,我们现在对生物体的理解,所谓快乐和悲伤,平静和恐惧,均是一些化学物质的浓度值而已。代入到机器中,可能是某些变量(其源头是其他的环境变量?)也就是说,训练得当或者设计得当,类似的情感(或者的超越情感)也会同样出现。

既然七情六欲都有相应的模型,意识还差多少?

我们说文明的载体是记忆(无论是文字还是影像),这一点上,机器对记忆的保存比我们强大太多了。一般意义上的艺术创作,人类也陆续会被机器所替代,虽然机器做的只是抽象和模仿,但已足够强大。

人类真正的优势是什么?

碳基生物千百年来的进化框架。由于硅基生物(姑且称为生物)是设计出来的,从先天上,就不是以生存竞争为目的的。这意味着,牺牲环境熵增,成就个体熵减的做法并不成为其进化的背景。硅基生物早期的进化必须依赖于人类的参与,也就是说,事实上就是人类竞争的结果才早就了硅基生物的演进。

由于没有赋予硅基生物一个最最基本的生存任务,而这个生存任务又是自然进化而得来的(自私的基因或者遗传上的优势),硅基生物的演进属于外界选择性的进化,生存任务并不是选择的条件(之一),除了故意做这样的实验,人类目前也不会无聊到浪费资源去培养机器自我进化。

电脑病毒则不属此例。所以电脑病毒进化速度还是相当快的,也跟自然界中的病毒类似了。或者这么说,有自我复制(繁衍)能力而且可以自我进化的硅基生物在大的范围内的选择进化优势将不如那些没有自我进化能力的,相反,人类会扼杀这些病毒式的硅基生物——因为浪费资源。

另外,进化的另一个要求,是要有足够的族群规模和资源。

资源受限的情况下,就好像食物不足,可能连生存都成问题,就别想着去生小孩了。硅基生物同样如此,大型的AI体如果要自我复制,则需要提供同等的硬件载体,虽然摩尔定律存在,但同时Intel定律也存在,大型AI的人工选择会导致他自身就占用了硬件资源的大部分或绝大部分,剩下的资源不足以孕育新的作为生存竞争的AI对象。

硅基生物族群规模则可以在互联网上出现。基础通讯令硅基生物以交流为主,可能将之视为一个统一的大AI更合适,这样强则强矣,同样是没有生存要求。

……

因为进化框架是人类的优势,所以失去进化框架可能会导致机器统治人。

这就是我开始倾向于不要追求人类永生技术的理由。

Jupyter Notebook

开始系统学习一些machine learning工程性质的东西,发现这个Jupyter Notebook真是一个颇为神器的玩意。适合用来编写跟Python相关技术教材。

也许过去十多年接触的Python,都是断断续续,把它当成一个普通的script language,想着写着,就python调用一下,导致这么多年在Python上好像一点长进都没有。当然了,如果应用上就是一个script language,那是无所谓的。

然而,如今Python如日中天,大量的前沿学术、工程均使用py的情况下,再低看它就变得不再合适了。

说回Jupyter,同样的概念应用于其他的script language也应该适合,只是在AI方面,大量的代码如果缺乏文本的描述,则晦涩难懂,而随时修改输入输出又是AI程序调试的刚需,所以Jupyter这个概念就在AI应用最多的Python语言上得以壮大。

智能商业和视觉智能专场

7月14日,已经是第三天了,感觉前两天的内容相当丰富,这一天打算换个角度看世界,基本上就没记什么笔记了,纯粹印象。

阿里巴巴来的是肖利华,清华的博后,看上去比较年轻,也比较的拽。因为迟到了,所以放在上午稍晚的位置讲,原本是第一个。

苏宁、阿里、京东、TCL、再到旷视、商汤、云从等等,无论是算法为主的,还是商业为主的,还是以产品为主的,都在打造自己企业的AI商业架构。

简单来说,就是数据层——框架层——应用层。

一般来说,数据层来自这些公司自身的业务,或者其客户;框架层是这些公司的算法团队或自研或引入的开源算法框架(无论软硬件);应用层则是AI如何变现的尝试,有公司业务的创新,也有可能是附着之上的小创业团队,在这上面做文章。

从阿里的角度看,它提供了数据层+框架层+应用层(小创业团队),只需要传统行业将业务导入,将数据导入就可以了,这无疑也带来了传统行业的被绑架的忧虑。

其他的公司或多或少在这几层上进行折腾,但总的来说,AI框架层基本上都会掌握在自己手中进行进化。

从另一个角度看,AI框架层也许是整个生态中最低成本的投入了……

类脑计算专场

7月13日下午,本来想过去听一下AI芯片方面的报告的,结果看着类脑计算的美国院士陈世卿的名头,鬼使神差地在类脑计算这里坐了一个下午。

类脑计算,顾名思义,就是抛弃传统计算机/算法的数学思维模式,转为通过对生物/人脑的模仿去实现计算系统。

继续阅读

5G & AIoT的专场

CUHK的黄铠教授,IEEE Fellow,内容链接:https://www.chaoqi.net/xinchao/2019/0725/229409.html

将AIoT的应用缩减为SMACT的缩写,分别是Social (社交——用户)/ Mobile(移动通讯——连接)/ Analytics(分析)/ Cloud(云端——服务)/ IoT(物联网——感知)。

其中Cloud Computing现在又延伸出Fog以及Edge等领域,但其本质就是提供软件服务的。

继续阅读

科大讯飞、京东、松鼠等的报告

代表科大讯飞作报告的是李世鹏,副总裁,IEEE fellow。

报告在这里http://tech.ifeng.com/a/20190717/45611806_0.shtml

他把智能的级别分为六层:Notification——Computation——Perception——Cognition——Prediction——Decision

不同层级对目前计算机智能的知识范围要求都不一样:

继续阅读

邓力:AI Models:From Speech and Language to Financial Markets

邓力是加拿大工程院院士,同时又是Citadel的首席。他的演讲先是概述了一下十几年来AI产生突破的一些方向和时间点,比如2009的语音处理,2012的计算机视觉以及2014的自然语言处理。接着对自己语音/自然语言方面的AI应用做了个介绍,就是在金融市场上的AI技术应用的一些经验和分析。

全文雷锋网已经有翻译和整理了,这里就不再重复。链接

继续阅读

聊天机器人所导致的支付信息泄露

由于目前流行的架构是,商户网页上提供给顾客的聊天界面,而这个聊天工具又是第三方所提供的。

于是带来的问题是,一旦第三方聊天软件被攻破,若干使用该聊天工具的商户的顾客对话便完全可能被黑客所接管。

黑客从而可以实施信息截获、社会工程攻击等等手段获取顾客敏感信息。

而把聊天界面和第三方聊天集成在同一场景下则增加这种风险。

比如这则:

https://www.cso.com.au/article/643142/chat-bot-opens-door-ticketmaster-payment-card-hack/