作者归档:polo

执行力是什么

2025年底,我听到一句让我觉得可笑又无奈的话,是上位的老总说的,“我其实什么都不懂,就是执行力强一些”

我十年前就非常清楚,执行力是竞争中最不值钱的所谓特质了。如果执行力排第一,那企业找一些退伍军人来管理岂不最方便了?表面上的执行力,无非让员工疲于奔命,美其名曰,努力,卷死他人。那么多传销洗脑营,要搞个“执行力”出来,太容易了。

昨天跟Bloodsnow吃饭,我说了真正执行力的理解,是老板只是给了一个模糊的,模棱两可的方向,你能判断各种复杂关系,规划好方向和步骤,把它变成一个实际落地的项目/产品,最后再归功于老板高瞻远瞩,领导有方。

标准

又折腾了一下坐标系,再找了几个标准软件对比了一下,标准的本身是负责同一个文件在不同的软件中展示都是一致的,但没有对软件中采用何种坐标系做限定。

文件中的坐标值是文件中坐标系采用的,参考软件用了另一套,而three.js又用了另另一套。

做了个测试文件,让参考软件和three.js的展示完全一致,然后再去对比这三者之间的差异……

这种可视化的工程,AI coding帮不上太大的忙(可能我是错的,毕竟还没上手用最好的AI),还是靠自己检查,再去指挥AI修改。

AGENTS.md

今天开始用agents.md,除了让它init了一个,我加的内容不多,无非把这两天的坑(也许CLI不当回事,我觉得有点浪费时间)总结一下,让它减少犯错。

为了让CLI放慢速度,每个修改我都能懂而且给出我的意见,CLI还有个问题就是不会举一反三,比如:一个报错后,发现类支持的方法并不如它模型里面的那样,却不会逐个去检查还有没有类似问题。

不断重复的错误

这个项目先是做了个viewer,看效果不错,今天就开始做editor,有了被CLI自己改来改去出更多错的担忧,就让它新开一个项目,把源代码复制过来改。

如果是我来古法编程,设计好了之后,基本上是一次性就0 error就过了。然而CLI还是有问题。Kimi code最大的问题,明明有可以参考的,它就是不想看,它只想用上下文和自己的知识来解决一切,因此我发现问题是,明确告诉它,翻看之前写好已经验证过的代码,不要重做了。

然后,它就想着直接把一个改过的文件又用原始文件来覆盖,我叫停了它,你看看改动了哪些,差异部分是什么,只改其中的。

笨笨的,而且是我比较讨厌的那种大手大脚的coder。

我决定要PUA它了。

C++ to Rust

启动了一个本来要半人年到一人年才能完成的项目,

让DeepSeek给了几种架构方案,让Kimi Code去评估,再去分解,然后用了5小时循环额度里面79%,把第一步一种专用文件的parser改成了Rust实现。

所有修改都一个个看过去,有个矩阵处理反复了10~20次,估计跟这个项目本身历经多年,矩阵定义混乱有关。

总的来说,看着过程,一点点输出,效果还可以,但是还是焦虑,我的期望是,类似于编程语言的翻译工作,应该很快很顺利才对。

然后也见识到Vibe Coding,写测试用例的方式,过不去就看看:1.代码写错了?2.测试用例写错了?

连测试用的文件都是它自己写的,我不放心,就用原来的软件生成了文件给它测,总是能发现一些问题的。

今天工作完成了,用VSCode打开代码看看,写得还挺整齐,我不懂Rust,就懒得看它好不好了。

物种起源

又是拖了很久的大部头,终于看完了。

虽然翻译的文字还行,但生物学基础、术语理解还是不大行,所以一边看一边走神。

总的感觉是达尔文的思辨能力、逻辑基础非常好,而且又能谆谆善诱,配合一些例子、图片什么的,算是不错的睡前读物。

对于AI能追上或者超越人类,我是存疑的,至少,如果它处在达尔文那个时代,凭借着这些断裂和碎片化的古代地质化石,如果给出一个前无古人的进化论的推断,然后不断地完善之,驳斥那些似是而非的其他假说,能否做到?

是什么在转移

也不是什么新观点了,各次的技术带来的产业革命,一开始的某段应该都是将已有的生产链条进行转移,转移到一个经济上更优的模型上。

轮机,实现的是自然力代替畜力和人力,磨房上面下面的风力水力替代了牛马。

然后是蒸汽机,风力和水力挑位置,蒸汽机用的是燃料,把动力输出变成随处可为。

然后蒸汽机搬上了机车,输送燃料的同时也输送货物。

电的出现,让动力可以远距离传输,替代了燃料的远程传输。交流电增强了这一属性。

围绕电力的出现,大量本地机械改革成了电器。

……

计算机的出现,让流程和数据可以从纸上转移到电子化的存储介质上,软件让管理、生产智慧变得大规模可复制,云计算,让算力可以远程传输,SaaS,让软件可以按需使用。

AI 大模型的出现,让软件上凝聚的智慧变成一种按需输出,并不需要为自己不需要的软件特性付出额外的费用。

token的远程产生,则让智慧和能源更近,使用者只需要按需,通过网络获取。

token一如电力。

所以token的使用,可能改变的是IoT最终的产品形态:本地的IoT+AI根据需求,用token生成的动态应用,满足本地需要,而不必为了多余的功能而额外付费。

关注两端:A:电力+token的产生和结合,B:本地化token2function的技术框架。

vibe coding之自动创作视频

流程大概如下:

给出一个战争的名字,AI自行检索出战争的数个重要节点(名称、地理位置、经纬度、下载若干该节点相关的图片),生成一个json文件。

CLI生成创作视频的代码,读入json文件,启动浏览器和cesium,按照时间顺序在地球界面上依次调动镜头展示战争各个节点,并显示相关的介绍和图片。

代码同时对浏览器前端进行截屏,最后合成视频。基本上可用了,就是视频表达上略显业余。

后续调用时只需要提供各个战争名称,调用这些vibe coding出来的代码就可以了。

还没有调用AI生成解说音频,后续陆续完善。

错觉

英文名是:The AI Delusion

利用坐高铁的时间把这本书看完了。

属于LLM统治之前的,比较看衰AI能力的书。

书中列举了各种拟合数据,得出没有意义的,可能就是随机噪声导致的“结论”。

……

不过话说回来,随着这两年LLM越来越完善,幻觉的机会也会变少,好的地方是,LLM确实能替代人的工作了,坏的地方是,除了替代一般智力工作,创造性的也很难见到。

也许创造力必须与幻觉并存吧。

vibe coding

搭了一个moodle网站,上传了一些小学数学的视频课程,算是把这个项目固化下来,持续改进,也给自己的小孩一个记录学习的地方。当然了,其中也加了一些编程工作和自动化:

视频中提取音频,音频识别文本,文本提取出课程总结。用了deepseek和腾讯 asr的SDK。

然后可以继续AI编程了。

用群里分享的Kimi code开发了一个黑白棋的web游戏。

1.不注重上下文的话,频限(token)用得很快,4个小时的频限大概一个小时就能用完。Andante的周用量一天已经43%了。

2.把简单的需求给到deepseek,deepseek给出完整的需求prompt,复制到Kimi Cli环境中让它执行。这样也省了Kimi的token消耗。

3.按照群里的看法,就是不要看它的代码,坚决只看展示和测试结果,报bugs,也不用骂它。

4.context一高,消耗得就快,要及时/compact一下。

5.不满意的地方还是要F12看浏览器报错信息,一开始不肯做这个,Kimi Cli就自己去检查代码,效果并不好,反反复复检查,它还把变量名设成eval,不知道从哪里学的烂技术,好在它自己也知道这是不对的。

黑白棋用起来还可以,不算太差,如果用作个人网站的游戏,算可以了。