项目规模大到一定程度,就发现AI Code CLI开始降智了。
比如主项目已经完成了文件的加载和渲染。但我需要为零件额外提前生成一些略缩图和旋转预览。
交给它去做,它就天马行空了,又是python,又是node.js,就是不肯参考主项目的方式,利用主项目已有的基础来做。
我骂了几句之后,发现它还是不会反省,只好强制要求它按照主项目的方式去做测试页面,去提取图片和动画。
AI在风格上还是优先依赖自己的知识,而不是工程中的已有经验,会导致无数次重做轮子……
项目规模大到一定程度,就发现AI Code CLI开始降智了。
比如主项目已经完成了文件的加载和渲染。但我需要为零件额外提前生成一些略缩图和旋转预览。
交给它去做,它就天马行空了,又是python,又是node.js,就是不肯参考主项目的方式,利用主项目已有的基础来做。
我骂了几句之后,发现它还是不会反省,只好强制要求它按照主项目的方式去做测试页面,去提取图片和动画。
AI在风格上还是优先依赖自己的知识,而不是工程中的已有经验,会导致无数次重做轮子……
2025年底,我听到一句让我觉得可笑又无奈的话,是上位的老总说的,“我其实什么都不懂,就是执行力强一些”
我十年前就非常清楚,执行力是竞争中最不值钱的所谓特质了。如果执行力排第一,那企业找一些退伍军人来管理岂不最方便了?表面上的执行力,无非让员工疲于奔命,美其名曰,努力,卷死他人。那么多传销洗脑营,要搞个“执行力”出来,太容易了。
昨天跟Bloodsnow吃饭,我说了真正执行力的理解,是老板只是给了一个模糊的,模棱两可的方向,你能判断各种复杂关系,规划好方向和步骤,把它变成一个实际落地的项目/产品,最后再归功于老板高瞻远瞩,领导有方。
又折腾了一下坐标系,再找了几个标准软件对比了一下,标准的本身是负责同一个文件在不同的软件中展示都是一致的,但没有对软件中采用何种坐标系做限定。
文件中的坐标值是文件中坐标系采用的,参考软件用了另一套,而three.js又用了另另一套。
做了个测试文件,让参考软件和three.js的展示完全一致,然后再去对比这三者之间的差异……
这种可视化的工程,AI coding帮不上太大的忙(可能我是错的,毕竟还没上手用最好的AI),还是靠自己检查,再去指挥AI修改。
今天开始用agents.md,除了让它init了一个,我加的内容不多,无非把这两天的坑(也许CLI不当回事,我觉得有点浪费时间)总结一下,让它减少犯错。
为了让CLI放慢速度,每个修改我都能懂而且给出我的意见,CLI还有个问题就是不会举一反三,比如:一个报错后,发现类支持的方法并不如它模型里面的那样,却不会逐个去检查还有没有类似问题。
这个项目先是做了个viewer,看效果不错,今天就开始做editor,有了被CLI自己改来改去出更多错的担忧,就让它新开一个项目,把源代码复制过来改。
如果是我来古法编程,设计好了之后,基本上是一次性就0 error就过了。然而CLI还是有问题。Kimi code最大的问题,明明有可以参考的,它就是不想看,它只想用上下文和自己的知识来解决一切,因此我发现问题是,明确告诉它,翻看之前写好已经验证过的代码,不要重做了。
然后,它就想着直接把一个改过的文件又用原始文件来覆盖,我叫停了它,你看看改动了哪些,差异部分是什么,只改其中的。
笨笨的,而且是我比较讨厌的那种大手大脚的coder。
我决定要PUA它了。
启动了一个本来要半人年到一人年才能完成的项目,
让DeepSeek给了几种架构方案,让Kimi Code去评估,再去分解,然后用了5小时循环额度里面79%,把第一步一种专用文件的parser改成了Rust实现。
所有修改都一个个看过去,有个矩阵处理反复了10~20次,估计跟这个项目本身历经多年,矩阵定义混乱有关。
总的来说,看着过程,一点点输出,效果还可以,但是还是焦虑,我的期望是,类似于编程语言的翻译工作,应该很快很顺利才对。
然后也见识到Vibe Coding,写测试用例的方式,过不去就看看:1.代码写错了?2.测试用例写错了?
连测试用的文件都是它自己写的,我不放心,就用原来的软件生成了文件给它测,总是能发现一些问题的。
今天工作完成了,用VSCode打开代码看看,写得还挺整齐,我不懂Rust,就懒得看它好不好了。
又是拖了很久的大部头,终于看完了。
虽然翻译的文字还行,但生物学基础、术语理解还是不大行,所以一边看一边走神。
总的感觉是达尔文的思辨能力、逻辑基础非常好,而且又能谆谆善诱,配合一些例子、图片什么的,算是不错的睡前读物。
对于AI能追上或者超越人类,我是存疑的,至少,如果它处在达尔文那个时代,凭借着这些断裂和碎片化的古代地质化石,如果给出一个前无古人的进化论的推断,然后不断地完善之,驳斥那些似是而非的其他假说,能否做到?
也不是什么新观点了,各次的技术带来的产业革命,一开始的某段应该都是将已有的生产链条进行转移,转移到一个经济上更优的模型上。
轮机,实现的是自然力代替畜力和人力,磨房上面下面的风力水力替代了牛马。
然后是蒸汽机,风力和水力挑位置,蒸汽机用的是燃料,把动力输出变成随处可为。
然后蒸汽机搬上了机车,输送燃料的同时也输送货物。
电的出现,让动力可以远距离传输,替代了燃料的远程传输。交流电增强了这一属性。
围绕电力的出现,大量本地机械改革成了电器。
……
计算机的出现,让流程和数据可以从纸上转移到电子化的存储介质上,软件让管理、生产智慧变得大规模可复制,云计算,让算力可以远程传输,SaaS,让软件可以按需使用。
AI 大模型的出现,让软件上凝聚的智慧变成一种按需输出,并不需要为自己不需要的软件特性付出额外的费用。
token的远程产生,则让智慧和能源更近,使用者只需要按需,通过网络获取。
token一如电力。
所以token的使用,可能改变的是IoT最终的产品形态:本地的IoT+AI根据需求,用token生成的动态应用,满足本地需要,而不必为了多余的功能而额外付费。
关注两端:A:电力+token的产生和结合,B:本地化token2function的技术框架。
流程大概如下:
给出一个战争的名字,AI自行检索出战争的数个重要节点(名称、地理位置、经纬度、下载若干该节点相关的图片),生成一个json文件。
CLI生成创作视频的代码,读入json文件,启动浏览器和cesium,按照时间顺序在地球界面上依次调动镜头展示战争各个节点,并显示相关的介绍和图片。
代码同时对浏览器前端进行截屏,最后合成视频。基本上可用了,就是视频表达上略显业余。
后续调用时只需要提供各个战争名称,调用这些vibe coding出来的代码就可以了。
还没有调用AI生成解说音频,后续陆续完善。
英文名是:The AI Delusion
利用坐高铁的时间把这本书看完了。
属于LLM统治之前的,比较看衰AI能力的书。
书中列举了各种拟合数据,得出没有意义的,可能就是随机噪声导致的“结论”。
……
不过话说回来,随着这两年LLM越来越完善,幻觉的机会也会变少,好的地方是,LLM确实能替代人的工作了,坏的地方是,除了替代一般智力工作,创造性的也很难见到。
也许创造力必须与幻觉并存吧。