又折腾了一下坐标系,再找了几个标准软件对比了一下,标准的本身是负责同一个文件在不同的软件中展示都是一致的,但没有对软件中采用何种坐标系做限定。
文件中的坐标值是文件中坐标系采用的,参考软件用了另一套,而three.js又用了另另一套。
做了个测试文件,让参考软件和three.js的展示完全一致,然后再去对比这三者之间的差异……
这种可视化的工程,AI coding帮不上太大的忙(可能我是错的,毕竟还没上手用最好的AI),还是靠自己检查,再去指挥AI修改。
又折腾了一下坐标系,再找了几个标准软件对比了一下,标准的本身是负责同一个文件在不同的软件中展示都是一致的,但没有对软件中采用何种坐标系做限定。
文件中的坐标值是文件中坐标系采用的,参考软件用了另一套,而three.js又用了另另一套。
做了个测试文件,让参考软件和three.js的展示完全一致,然后再去对比这三者之间的差异……
这种可视化的工程,AI coding帮不上太大的忙(可能我是错的,毕竟还没上手用最好的AI),还是靠自己检查,再去指挥AI修改。
今天开始用agents.md,除了让它init了一个,我加的内容不多,无非把这两天的坑(也许CLI不当回事,我觉得有点浪费时间)总结一下,让它减少犯错。
为了让CLI放慢速度,每个修改我都能懂而且给出我的意见,CLI还有个问题就是不会举一反三,比如:一个报错后,发现类支持的方法并不如它模型里面的那样,却不会逐个去检查还有没有类似问题。
这个项目先是做了个viewer,看效果不错,今天就开始做editor,有了被CLI自己改来改去出更多错的担忧,就让它新开一个项目,把源代码复制过来改。
如果是我来古法编程,设计好了之后,基本上是一次性就0 error就过了。然而CLI还是有问题。Kimi code最大的问题,明明有可以参考的,它就是不想看,它只想用上下文和自己的知识来解决一切,因此我发现问题是,明确告诉它,翻看之前写好已经验证过的代码,不要重做了。
然后,它就想着直接把一个改过的文件又用原始文件来覆盖,我叫停了它,你看看改动了哪些,差异部分是什么,只改其中的。
笨笨的,而且是我比较讨厌的那种大手大脚的coder。
我决定要PUA它了。
启动了一个本来要半人年到一人年才能完成的项目,
让DeepSeek给了几种架构方案,让Kimi Code去评估,再去分解,然后用了5小时循环额度里面79%,把第一步一种专用文件的parser改成了Rust实现。
所有修改都一个个看过去,有个矩阵处理反复了10~20次,估计跟这个项目本身历经多年,矩阵定义混乱有关。
总的来说,看着过程,一点点输出,效果还可以,但是还是焦虑,我的期望是,类似于编程语言的翻译工作,应该很快很顺利才对。
然后也见识到Vibe Coding,写测试用例的方式,过不去就看看:1.代码写错了?2.测试用例写错了?
连测试用的文件都是它自己写的,我不放心,就用原来的软件生成了文件给它测,总是能发现一些问题的。
今天工作完成了,用VSCode打开代码看看,写得还挺整齐,我不懂Rust,就懒得看它好不好了。
也不是什么新观点了,各次的技术带来的产业革命,一开始的某段应该都是将已有的生产链条进行转移,转移到一个经济上更优的模型上。
轮机,实现的是自然力代替畜力和人力,磨房上面下面的风力水力替代了牛马。
然后是蒸汽机,风力和水力挑位置,蒸汽机用的是燃料,把动力输出变成随处可为。
然后蒸汽机搬上了机车,输送燃料的同时也输送货物。
电的出现,让动力可以远距离传输,替代了燃料的远程传输。交流电增强了这一属性。
围绕电力的出现,大量本地机械改革成了电器。
……
计算机的出现,让流程和数据可以从纸上转移到电子化的存储介质上,软件让管理、生产智慧变得大规模可复制,云计算,让算力可以远程传输,SaaS,让软件可以按需使用。
AI 大模型的出现,让软件上凝聚的智慧变成一种按需输出,并不需要为自己不需要的软件特性付出额外的费用。
token的远程产生,则让智慧和能源更近,使用者只需要按需,通过网络获取。
token一如电力。
所以token的使用,可能改变的是IoT最终的产品形态:本地的IoT+AI根据需求,用token生成的动态应用,满足本地需要,而不必为了多余的功能而额外付费。
关注两端:A:电力+token的产生和结合,B:本地化token2function的技术框架。
英文名是:The AI Delusion
利用坐高铁的时间把这本书看完了。
属于LLM统治之前的,比较看衰AI能力的书。
书中列举了各种拟合数据,得出没有意义的,可能就是随机噪声导致的“结论”。
……
不过话说回来,随着这两年LLM越来越完善,幻觉的机会也会变少,好的地方是,LLM确实能替代人的工作了,坏的地方是,除了替代一般智力工作,创造性的也很难见到。
也许创造力必须与幻觉并存吧。
搭了一个moodle网站,上传了一些小学数学的视频课程,算是把这个项目固化下来,持续改进,也给自己的小孩一个记录学习的地方。当然了,其中也加了一些编程工作和自动化:
视频中提取音频,音频识别文本,文本提取出课程总结。用了deepseek和腾讯 asr的SDK。
然后可以继续AI编程了。
用群里分享的Kimi code开发了一个黑白棋的web游戏。
1.不注重上下文的话,频限(token)用得很快,4个小时的频限大概一个小时就能用完。Andante的周用量一天已经43%了。
2.把简单的需求给到deepseek,deepseek给出完整的需求prompt,复制到Kimi Cli环境中让它执行。这样也省了Kimi的token消耗。
3.按照群里的看法,就是不要看它的代码,坚决只看展示和测试结果,报bugs,也不用骂它。
4.context一高,消耗得就快,要及时/compact一下。
5.不满意的地方还是要F12看浏览器报错信息,一开始不肯做这个,Kimi Cli就自己去检查代码,效果并不好,反反复复检查,它还把变量名设成eval,不知道从哪里学的烂技术,好在它自己也知道这是不对的。
黑白棋用起来还可以,不算太差,如果用作个人网站的游戏,算可以了。
这是我上个月看过的最有感触的文章,复制一遍,回头再用NotebookLM剖析一下。
管理学大师彼得·德鲁克曾说,动荡时代最大的危险不是动荡本身,而是延续昨日的逻辑行事。
今天,我们就站在这样一个危险的临界点。
从系统演化的角度来看,管理学本身就不是一个永恒的真理,这并非因为管理学理论本身的缺陷,而是因为它所服务的对象——碳基生物的大脑在即将被智能体所替代时,管理学存在的前提也会被物理性地移除。
所以,未来的企业变革不是基于 AI 的“更好的管理”,而是“管理的退出”。这不关乎对错,这关乎结构的必然。当执行不再依赖生物特征时,基于生物特征构建的制度大厦,其历史使命便已终结。
现代管理学的大厦,实际上是建立在一片名为“生物局限性”的沼泽之上。过去一百年,我们所推崇的全部管理工具,本质上都是为了给人类大脑打上的“补丁”:
我们发明 KPI,并非因为它能精准衡量价值,而是因为人类大脑难以在长周期中锁定目标,“遗忘”是碳基生物的常态,我们需要路标;
我们发明科层制(Hierarchy),并非因为它高效,而是因为人类的工作记忆只能处理 7±2 个节点,为了避免认知超负荷,我们被迫通过层级来压缩信息;
我们发明激励机制,并非为了创造价值,而是为了对抗生物体天然的动机衰减与熵增。
管理学从未真正提升组织的“智能”。它是一个精密的“纠偏系统”,试图在人类心智失效之前,用制度锁定正确性。
当执行依赖人类时,企业是一个为适配大脑缺陷而构建的制度容器。
那么,我们要引入的替代者究竟是什么?
请大家注意,当我说“智能体(Agent)”时,我指的不是一个运行速度更快的软件,而是一种在认知解剖学(Cognitive Anatomy)上与人类完全不同的存在。
如果我们将人类员工与智能体放在解剖台上对比,你会发现三处根本性的生理差异:
第一,是记忆的连续性。
人类的记忆是瞬时且易碎的,我们依赖睡眠重置,上下文经常断裂。而智能体拥有 EverMem(永恒记忆),它拥有的不是片段的工作流,而是连续的历史。它不会遗忘,不需要“交接”,它的每一次推理都建立在全量历史的基座之上。
第二,是认知的全息性。
人类受限于带宽,必须通过层级来过滤信息。而智能体拥有全量对齐(Context Alignment) 能力。它不需要通过部门周会来同步信息,整个组织的知识网络对它实时透明。它看到的是全局,而非盲人摸象般的局部。
第三,是进化的内生性。
人类的动力依赖于多巴胺和外部奖赏,容易衰减。而智能体的行动源于奖励模型(Reward Model)的结构张力。它不需要被“哄”着工作,它的每一次行动都是为了让目标函数收敛。
这不是更强的员工,这是基于不同物理法则运转的新物种。
现在,当我们把这种具备“连续记忆、全息认知、内生进化”的新物种,强行塞进为人类设计的旧管理容器时,会发生什么?
系统性的排异反应开始了。那些曾经支撑现代企业的五大基石,正在从“必要的保障”异化为“智能的束缚”:
KPI 的崩塌:从“导航”变为“天花板”
我们要 KPI,原本是因为人类容易迷路。但对于时刻锁定目标函数的智能体而言,死板的 KPI 指标反而限制了它在无限解空间中寻找更优路径的可能性。这就好比你给自动驾驶汽车画死了一条轨道,却期待它能躲避突发的障碍。
层级结构的崩塌:从“过滤器”变为“阻断器”
我们要层级,原本是因为人类大脑处理不了太多信息。但对于能处理千级上下文的智能体,层级结构不再是过滤器,而成了阻碍数据自由流动的“血栓”。在智能网络中,任何中间层都是对信息的无谓损耗。
激励机制的崩塌:从“动力源”变为“噪音”
用外在激励去驱动智能体,就像试图用糖果去奖励万有引力一样,是无效且滑稽的。它不需要多巴胺,它需要的是精准的数据反馈。
长期规划的崩塌:从“地图”变为“模拟”
我们要五年规划,是因为我们无法在高频变化中维持长周期的推演。但在智能体手中,静态的战略地图被实时的世界模型模拟(World Model Simulation)所取代。既然能每秒钟推演一万次未来的可能性,为什么还要死守那张半年前打印出来的旧地图?
流程与监督的崩塌:从“纠偏”变为“冗余”
传统的监督机制,原本是为了盯着人别犯错。但在智能体内部,理解即执行,感知即行动。监督不再基于对执行过程的怀疑,而是基于对目标定义的再校准。
如果抛弃了这些生物学的拐杖,一家真正的 AI-Native 企业,它的终极形态究竟长什么样?
这不再是关于一家公司应该购买什么软件,而是关于一家公司应该以何种生物学形式存在。真正的 AI-Native 企业,必须在基因层面完成以下五项重写:
1. 架构即智能(Architecture as Intelligence)
传统企业架构是社会学产物,旨在解决人际摩擦。而 AI-Native 的架构是计算机科学产物。
整个组织本质上是一个巨大的、分布式的计算图(Computational Graph)。部门不再是权力的领地,而是特定功能的模型节点;汇报线不再是行政命令的通道,而是高维数据流转的总线。企业架构的设计目标,从“管控风险”转变为“最大化数据吞吐与智能涌现”。
2. 增长即复利(Growth as Compounding)
传统增长依赖线性的人力堆叠,边际成本随规模递增。AI-Native 增长依赖认知复利。
智能体的核心特征是“零边际学习成本”。一次成功的边缘案例处理,其实验结果会瞬间同步给全网智能体。企业的估值逻辑将彻底改变——不再取决于 headcount 的规模,而取决于认知结构复利的速度(Rate of Cognitive Compounding)。
3. 记忆即演化(Memory as Evolution)
没有记忆的智能只是算法,拥有记忆的智能才是物种。
传统企业的记忆是离散且易碎的“死数据”。AI-Native 企业必须拥有一个可读写、可进化的长期记忆中枢(Long-term Memory)。所有的决策逻辑、交互历史与隐性知识,都被实时向量化,沉淀为组织的“潜意识”。这是企业实现时间结构(Temporal Structure)的基础,也是智能跨越时间进行自我演化的前提。
4. 执行即训练(Execution as Training)
在旧范式中,执行是消耗过程,价值交付即终点。在 AI-Native 范式中,执行是探索过程。
不存在单纯的“执行部门”,所有部门本质上都是“模型训练部门”。每一次业务交互,都是对企业内部“世界模型”的一次贝叶斯更新(Bayesian Update)。业务流即训练流,行动即学习。
5. 人即意义(Human as Meaning)
这是企业伦理的重构。人类从“燃料”的角色中退出,升维为“意图策展人(Intent Curator)”与“认知架构师(Cognitive Architect)”。
智能体负责在无限的解空间中解决“如何做(How)”的问题,进行路径的极值优化;而人类负责处理那些不可计算的模糊性——定义“为何做(Why)”,定义审美、伦理与方向的价值函数(Reward Function)。智能负责扩展可能性的边界,人类负责裁定方向的意义。
这与我们在科学领域提出的发现式智能(Discoverative Intelligence)殊途同归。
发现式智能的核心定义是:智能不应止于对既有知识的拟合,而应具备构建模型、提出假设、并在与世界的交互中修正认知的能力。
AI-Native 企业,正是发现式思维在组织层面的投射。它要求企业本身成为一个发现式结构的平台,而非操作流程的容器。
如果组织的形式正在发生物种级的演化,那么承载它的数字容器也必须随之突变。
这就引出了一个我们不得不面对的命题:我们脚下的基础设施——那些为了固化流程而生的 ERP,那些为了切割职能而建的 SaaS——真的还能容纳这种液态的智能吗?这些系统本质上是旧时代管理逻辑的数字化投影,它们通过“打补丁”的方式或许能带来暂时的安宁,但这终究是在用旧地图寻找新大陆。
AI-Native 企业呼唤一种全新的操作系统。 一种不再致力于“资源规划(Resource Planning)”,而是致力于“认知演化(Cognitive Evolution)”的全新神经系统。
当管理退出,认知升起。
管理学不会消失,但它将第一次真正建立在智能(Intelligence)的地基之上,而非生物学(Biology)的废墟之上。
看到一篇文章,说“嗅到了有些RPA产品公司,会陆续出现倒闭迹象”。
文章中说到收到不少的RPA运维需求,有国内和国外的,这些公司已经不会继续投入运维业务,从而出现运维外包的情况。
也就是说RPA需求在减少。
我个人认为,纯种的RPA肯定会消失,真正的挑战来自于AI,然而AI的能力延伸又必须以各种粒度的高可靠的自动化任务为基础,所以AI + RPA才是下一个阶段的着力点。
然而AI + RPA又可以支持多久,大概率不会出现通适型的解决方案,然而是以解决方案顾问(一人或数人)为主,动用大模型和成熟的RPA,构建出真正定制化的方案。
骤一看跟项目制差不多,但解决和实施上,AI的空间非常大,有可能是一个人就可以撬动和完成一个项目。
有业务闭环是前提,后面的交给AI和RPA,以及手中无刀,心中也无刀的人。
花姐姐在AI群里说的:
我的感觉是OpenAI的技术哲学有其独到之处,它的内核是数学 + C++,它认为这两样东西足以描述整个世界。
这里的数学是科学家和工程师用的数学,计算数学和应用数学。
在这方面国内几个模型大概还没摸到边。Google也不行,Gemini的数学是数学竞赛的数学。
基础语言肯定也不是C++,是什么我说不准。
Qwen的基础语言一定是Javascript。
模型的个性就在这里产生。
Deepseek是Python。
Mistral的内核语言是法语文学。
个性过于明显不可能感知不到。
Gemini的数学追求抽象和绝对的精确,但是众所周知,这会丢失信息。
挺有意思的,如果花姐姐的感觉是对的话,基本上也能分析出这些大模型各自持续演进后的天花板所在了。