标签归档:AI

近期AI…1

近期参加了一些AI的会议,也看了关于Open AI新的发布会的一些内容,大概整理下。

1024翌日参加了深圳程序员节的一个讲座,其中印象深刻的是华为的某博士介绍其CodeArts,之前还有一位同济大学的教授在讲AI带来的工程/工作范式的变革,一并节录并解读:

软件即模型

如SaaS一样,SaaM(软件即模型)也逐渐普及起来,大模型或垂直模型可以完成一系列大型软件,比如:回答问题、翻译、写作、摘要、分析诊断、预测、图像搜索、文生图、语音合成、视频解读等等。

跟SaaS集中在修改软件的商业模式不一样,SaaM更多是重构了软件生成的方式……

当然了,未来SaaM也有传统软件开发的壳在外面,也可以如SaaS那样根据使用付费。

常态化的人与AI的交互

交互常态化后,人类的经验将持续引导LLM的升级,上下文明确、反馈以改进、协助LLM学习、调优控制、结果审查。

不过我觉得这样还是太费人了。

新的工作范式

这个范式是一种对人比较好的假设:人的角色没变,每个人都有一个强大的AI助手,而工作团队变小了,能做事更高效。

助手的能力包括但不限于:BA助手、架构咨询、UI设计助手、编程/测试/部署/发布助手、AIOps、技术支持、客户服务助手。

对于内容生产而言,则有一个新的范式:模型+数据=生产

软件工程3.0

可以用自然语言(prompt)来编程了,架构或传统编程概念也就是一句话的事情,编程效率将提升,AI也将渗透到软件工程的各个场景。

华为也籍此介绍Code Arts的能力。

生成:代码、测试用例、注释、移植

问答:知识、代码调试、代码解释、检查与修复、代码检视、代码优化

协同:研发工具协同、云服务调用、Code Interpreter、Low Code协同

集成测试:测试脚本生成、用例文本优化、测试序列生成、测试日志总结与分析、测试设计辅助

运维:日志埋点、日志模板提取、故障报因分析


虽然华为说的很大很多,但以我对华为和做AI的团队的理解,他们大概率是没有把工程团队的经验和Code Arts真正结合的……

所以感兴趣的可以试用一下。

数字达尔文主义

Digital Darwinism

先抄一些meme代替阅读过程的体会吧:

要理解技术产生的背后的意义,而不是技术本身。

新技术应当应用与业务核心core,而并非边沿edge。(感觉大多数保守的公司都只愿意将新技术用在edge业务上,避免风险)

人们通常低估了技术应用的深度,高估了短期影响,也低估了长期影响。

转型中最大的忧虑是,何时采用新技术,要不要再等等,等更好更完善的(这跟买手机、买电脑有点像)。

旧的会议方式难以评估错过新技术/思想的损失,所以财务去主导转型不合适。

技术是转型的背景,而不应是主导,人们需要的是解决方案,而非技术本身。

几个采用新技术的思路:

  • 自我中断,比如Netflix,直接把租DVD的客户转成订阅流服务的客户,大胆、冒险。
  • 持续重新发明、改善、创新、补全,比较低的风险,一点点自我革新。
  • 原有业务不变,投资新业务应用新技术
  • 投资对冲基金

应用AI的策略上,作为公司,应有精心设计的战略,而不是在边际上进行小实验。

套用已有模型不会有明显的成功,大脑中的模型要革新,不应该是之前的XXX,直接修改成数字时代的XXX、人工时代的XXX。

目前看到AI的应用,只是取代人类原来的工作(岗位、职责),将失去真正转型的意义。要考虑改变企业架构(为前提),考虑做人类没有做过的事情。

忘记大数据,聚焦innate data,数据不需要多大规模,但有用且效果好。

围绕人去设计新的技术方案,而不是做了方案/产品,投钱去推广。


看完后,最大的感想是,希望能找到真正的新范式,才能利用好AI。否则,不过是让AI重复人类、取代人类而已。

两个GPT的应用

一个是Be My Eyes,这款给视障人士使用的app,本来是通过摄像头让远程的社区协助者/志愿者告知视障者视野范围的情况。GPT的应用就是,可以通过CV的分解和分析,生成相应的文本描述,告知视障者,一定程度上降低对志愿者人力的要求。

另一个是可汗学院的教学上,学生和GPT合作写故事、虚拟一个对已故人物的采访、人机对话练习,提高词汇量和使用技巧。


现在流行的悲观观点大多数是*GPT会取代人的工作,但对于教育本身来说,这些对教育手段的增强却是实在的。

The book of why

中文名是因果关系。

给的例子都比较容易看懂,是科学家和专业作家合作的书,虽然思想本身都是来自科学家。

因果识别的三个层次:观测,从而发现关联性;干涉,识别因果线条以及量化关系;反事实推测,得到确定的因果。

后面的一两章开始了对AI的期望,能理解为何不喜欢单纯的数据挖掘,因为那只是第一层的内容,做得再好也是关联性的挖掘,AI必须演进到识别因果关系,才能对人类的事情产生本质的帮助。

大数据必须寻找可解释的关系,比如AI需要理解为何(Why)主人熟睡的时候不应该开吸尘器,而不是单纯记住这一个设定。

强人工智能须主动增加更高维度的理解,不要总是在二维影响中分析明暗,而应该提高维度到三维,产生光影的概念。

AI要试图进行反事实的算法化,即对输入信息有违抗的想法。

作者倒是不觉得AI会邪恶化,相反,他认为AI在得到足够好的信息后,可做出比人类更强的道德判断。

看的时间比较长,记录比较零星,有空再看一遍中文版。

AI DJ

AI承担DJ的工作其实是很正常的,比如现在流行的音乐APP里面,其实都有AI选曲播放的频道。

更多的是,AI可以自行根据旋律创作一些背景音乐(鼓点、midi等),如能,也可以配合现场的IoT环境,控制灯光。

AI可以通过观测现场的人群的反应(CV能力),再进行播放的调整。

当然了,作为chatbot,可以接受现场客人的点唱,也可以提供虚拟形象。

传统零售店智能化 或 无人零售

首先是要考虑最小的修改,毕竟大家手里钱都不多,改动太大或者推倒重来的话,一方面是成本高,另一方面智能店真正完全成功的还不多,大多数都是概念店和体验店。

店面大小,不适宜太大,太小也不好,就考虑那种连锁便利店1~3倍的规模好了。形状规范一点。

SKU控制一下,不超过600?有更多的话,请用减法。

尽量使用现有的基础设施,比如网络,电,监控摄像头,收银台。


AI相关:做现在SKU的数据收集和采集,买也可以。训练模型–>生产环境下的重训练(比如增加或删除SKU等)

需要的硬件或基础设施:摄像头、视频处理硬件(如GPU)、QR Scanner(当然,摄像头也可以)、AI模型服务器(边缘计算够便宜也可以)

AI,其实是CV,也该考虑人脸等隐私特征的保护。


无人零售用AI的目的:

识别顾客,绑定到一个实体/虚拟的账号,并100%跟踪其店内行为

产品识别,品类、数量、状态等

前两者的关系,也就是谁拿了什么东西,多少东西

自助结账。

无人零售的退化版本就是自助售卖机、自助餐食等。

联邦学习与大数据隐私专场

这个专场对于我来说,算是一个扫盲性质的,听了几个讲座后,大概知道联邦学习是一个什么样的模式了。

杨强是港科大的教授,微众银行的高管。他对联邦学习的介绍还是很清晰的:https://www.leiphone.com/news/202008/hBACeSbAY8PIOcbh.html

联邦学习的背景是1.数据的来源碎片化,且难以标准化,2.数据的合规性要求限制了中央处理。

继续阅读

企业服务专场

选这个来听,本意是希望听到关于企业SaaS怎么做的讨论,但遗憾的是,还是偏少。主要是企业服务如何匹配新基建等大方向和大趋势的。

信通院政策与经济研究所副所长何伟,https://www.leiphone.com/news/202008/PG3C7FP2gUzNXNAd.html

重点在于产业发展的时间和方向,企业服务应该与其保持一致。

阿里巴巴副总裁,郭继军,https://www.leiphone.com/news/202008/wvoatM5VImhgvrGQ.html

企业服务中,数据凌驾一切,打通数据间的障碍,后挖掘及形成新的业务。而对阿里来说,目前则不纠结于具体是哪个云,哪一家的云,只考虑将其打通并组合给应用。

继续阅读

机器人前沿专场

次日,选了机器人前沿专场和AIoT专场来听。

开场的报告是加拿大工程院张宏院士作的。他也即将在深圳建立有实验室,但此次是用远程的方式进行演讲。

https://dy.163.com/article/FK6GSE5D0511DPVD.html

讲的范围不多,集中在机器人如何得知自身处在已知地图的何处。包括对视野中的各种物体的标示(全局/全景描述符),Deja vu的时候各种不同的外部环境产生的变化如何识别,二维点云计算即确认,图像粗匹配、精匹配,雷达和视觉的信息融合等等。

不过他说的是已知地图的情况。结合去年有个讲陌生环境下的digital twin构建地图,就可以多机器人联合制作地图并进行相对定位了。

继续阅读