分类目录归档:不是技术

近期AI…2

国内怎么用Open AI的问题

微软和亚马逊都陆续给出相关的答案,使用还是不难的,只要你是Azure或者AWS的正式的商用客户,自然就可以使用±Open AI或者AWS预建的AI平台进行二次开发。

多模态技术

对于不同的AI能力,称之为多模态,多模态相当于人的几种感官:分别处理图像/视频,音频,文本理解。大模型如人的大脑,存储知识并推理,多模态则五官,接收和融合信息,两者结合才是通用AI的发展。

智能体Agent

讲者说智能体是手,其实当时听就觉得不对,智能体是通用AI的多个分身,每个分身处在不同的工作环境下,处理不同的工作任务。这也是我之前提及元宇宙的未来:AI让人类个体可以在不同元宇宙有其分身,个体的财富和能力体现不同元宇宙中的能力。

AI时代设计思考

产品与用户时间的交互会倾向于多模态的方式,而不仅仅是自然语言或图形界面的方式;

大模型时代的产品会融合AI 1.0的千人千面和AI 2.0的生成式特性;

要构建不断增长的数据飞轮,通过数据驱动产品运营全过程。

AI大模型要继续压缩以适应端部署(独立AI)

近期AI…1

近期参加了一些AI的会议,也看了关于Open AI新的发布会的一些内容,大概整理下。

1024翌日参加了深圳程序员节的一个讲座,其中印象深刻的是华为的某博士介绍其CodeArts,之前还有一位同济大学的教授在讲AI带来的工程/工作范式的变革,一并节录并解读:

软件即模型

如SaaS一样,SaaM(软件即模型)也逐渐普及起来,大模型或垂直模型可以完成一系列大型软件,比如:回答问题、翻译、写作、摘要、分析诊断、预测、图像搜索、文生图、语音合成、视频解读等等。

跟SaaS集中在修改软件的商业模式不一样,SaaM更多是重构了软件生成的方式……

当然了,未来SaaM也有传统软件开发的壳在外面,也可以如SaaS那样根据使用付费。

常态化的人与AI的交互

交互常态化后,人类的经验将持续引导LLM的升级,上下文明确、反馈以改进、协助LLM学习、调优控制、结果审查。

不过我觉得这样还是太费人了。

新的工作范式

这个范式是一种对人比较好的假设:人的角色没变,每个人都有一个强大的AI助手,而工作团队变小了,能做事更高效。

助手的能力包括但不限于:BA助手、架构咨询、UI设计助手、编程/测试/部署/发布助手、AIOps、技术支持、客户服务助手。

对于内容生产而言,则有一个新的范式:模型+数据=生产

软件工程3.0

可以用自然语言(prompt)来编程了,架构或传统编程概念也就是一句话的事情,编程效率将提升,AI也将渗透到软件工程的各个场景。

华为也籍此介绍Code Arts的能力。

生成:代码、测试用例、注释、移植

问答:知识、代码调试、代码解释、检查与修复、代码检视、代码优化

协同:研发工具协同、云服务调用、Code Interpreter、Low Code协同

集成测试:测试脚本生成、用例文本优化、测试序列生成、测试日志总结与分析、测试设计辅助

运维:日志埋点、日志模板提取、故障报因分析


虽然华为说的很大很多,但以我对华为和做AI的团队的理解,他们大概率是没有把工程团队的经验和Code Arts真正结合的……

所以感兴趣的可以试用一下。

畀 与 俾

今日又读《诗经》

彼姝者子,何以畀之。——《风 干旄》

那个人那么出色/有才/漂亮/贤能,能送他些什么呢?

这里的“畀”,是给予、赠送的意思。

粤语里也常用“畀”,送个XX畀你:送个XX给你。

然而有另一个古字:俾,意思相当接近。

俾:使,把。

俾也可忘。——《邶風 日月》

粤语里面,俾,俾佢食饱:使(让)他吃饱。然而在能用“俾”的语境,“畀”也是适用的。

数字化阶段

把这两个月出差、看的展会以及交流,做一个简单的论断:

如果对于每个行业或者生活的片段存在一个数字化阶段的评估标准的话,那么支付,已经是处在数字化的末期了。

体现在:

支付牌照(或者准入资格)不再值钱,比如十年前一亿一张的牌照,连续约都不续

垂直行业的ISV并不看重,如果有需要,完全可以自建支付通道,因为门槛足够低

支付公司无法再创造出更新的玩法,所有的故事都已经被讲过,无非新瓶装旧酒

利用好已有的行业联系,及时发展新的业务,新的产品,还能优雅地转身。毕竟整个链条来说,未经历完全数字化的片段比比皆是,支付之所以先到达尾声是因为离钱太近,资本优先驱动而已。

Video telematics

看了几个公司的介绍,Streamax / Lytx / Samsara

共同点都是在交通上的应用,可能有侧重不同类型的工程车(队)

一道三元二次方程组

刷刷数学题,避免老年痴呆。

在youtube上看到这么一道题,觉得有点意思,就记了下来。

方程组如下:

x2 - yz = 2
y2 - xz = 3
z2 - xy = 5

x, y, z的值

视频里面也说了有很多解法,但大多比较ugly,推荐了一个:

不失一般性,令
x2 - yz = a ...... (1)
y2 - xz = b ...... (2)
z2 - xy = c ...... (3)

(1)式左右各乘y,(2)式左右各乘z,(3)式左右各乘x
x2y - y2z = ay
y2z - xz2 = bz
z2x - x2y = cx

3个方程加起来,左边均抵消为0
得:
0 = ay + bz + cx

又
(1)式左右各乘z,(2)式左右各乘x,(3)式左右各乘y
相加抵消后得到:
0 = az + bx + cy

两方程可以换成向量点积的表达:
<x, y, z> * <c, a, b> = 0
<x, y, z> * <b, c, a> = 0

如a, b, c均不为零
则<x, y, z> 为与 <c, a, b>和<b, c, a>所在平面垂直的向量

令z = 1,
cx + ay = -b
bx + cy = -a
求得
x = (a2 - bc)/(c2 - ab)
y = (b2 - ac)/(c2 - ab)

因此
x = k(a2 - bc)
y = k(b2 - ac)
z = k(c2 - ab)

代入原方程(1)中求k
k2(a2 - bc)2 - k2(b2 - ac)(c2 - ab) = a

k = 1 /(a3 + b3 + c3 - 3abc)1/2
因此
x = (a2 - bc)/(a3 + b3 + c3 - 3abc)1/2
y = (b2 - ac)/(a3 + b3 + c3 - 3abc)1/2
z = (c2 - ab)/(a3 + b3 + c3 - 3abc)1/2

将2, 3, 5分别代入即可
x = -11 / 701/2
y = -1 / 701/2
z = 19 / 701/2

这道题本身有特殊性,只是向量点积的方式会比较优雅。

两个GPT的应用

一个是Be My Eyes,这款给视障人士使用的app,本来是通过摄像头让远程的社区协助者/志愿者告知视障者视野范围的情况。GPT的应用就是,可以通过CV的分解和分析,生成相应的文本描述,告知视障者,一定程度上降低对志愿者人力的要求。

另一个是可汗学院的教学上,学生和GPT合作写故事、虚拟一个对已故人物的采访、人机对话练习,提高词汇量和使用技巧。


现在流行的悲观观点大多数是*GPT会取代人的工作,但对于教育本身来说,这些对教育手段的增强却是实在的。

PIN & PUK

周日到香港,本来中移动的手机号是开了漫游的(30元/天,封顶后限流),华为手机给了弹了一个天际通的优惠推荐,9.9元/天,含1G流量。

看着诱人,就点点点,支付完了。然后开通。这时候可能规则上触发了中移动的sim卡保护,要我输入SIM卡的PIN,我也没想起来是0000/1234之类,三次不中,就要输PUK了。

因为在香港,手忙脚乱,也拨不了移动的大陆客服……华为手机这时候输PUK的界面是置顶的,关机也关不了。

实在没办法,就用随身带的nano sim的顶针把SIM卡取了下来。然后手机就又可以用了,天际通上传个证件照,也正常开通网络了。

办完事情后,回到深圳,找到家附近的移动营业厅,也就两三分钟的事情,查到PUK,解锁,然后重置PIN,世界又回复原来的平静。

组织内的知识分享

这么多年看过很多组织内知识分享的形式,流于形式的有之,静静湮灭的也有。

有些文档,从诞生到终止,被打开的次数寥寥可数。

是什么导致了这种浪费。真正有效的经验为何总是存在大脑中。

组织内的知识分为显性知识和隐性知识。显性知识是很容易文档化的,同时也是最容易形式化的,在老成员看来,就是陈词滥调,新成员的角度看,是对自学有用的,然而总是比不上传帮带。

另外,即使是新成员,对所有显性知识的理解能力、接受速度都不一样,快慢的区别在人身上,也在内容上。

强制要去新成员去step by step,对部分人来说,也是一种浪费。

比较好的建议是,组织内部做分享会,新成员根据需要参与。

隐性知识最大的问题是,拥有这些经验和知识的老成员,不能将其显性化,所以,事实上不存在固定的隐性知识的边界,只跟成员的归纳整理和表达能力有关。

培养成员的知识归纳和书写能力,同时创造一个制度将隐性知识显性化,然后参与分享,将缩小对成员个体的隐性知识的依赖。

几种组织内部知识的形式:

文档管理系统——以文档形式管理

内容管理系统——以内容、主题串联知识

内部网络——自由分享知识的IT网络

数据仓库——可用于挖掘新知识