分类目录归档:不是技术

RAG

RAG(Retrieval-Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的自然语言处理(NLP)技术,它通过检索大量数据中相关信息的方式来辅助生成模型产生更准确、更丰富的文本输出。RAG的应用场景非常广泛,以下是一些主要的应用领域:

  1. 搜索引擎优化:RAG可以用于改善搜索引擎的结果,通过检索最相关的文档片段来提供更精确的搜索结果。
  2. 问答系统:在问答系统中,RAG可以检索大量数据以找到最准确的答案,然后生成对用户问题的直接回答。
  3. 内容推荐:RAG可以用于个性化内容推荐,通过检索和生成用户可能感兴趣的内容。
  4. 文本摘要:在文本摘要任务中,RAG可以检索文档中的关键信息,并生成一个简洁、准确的摘要。
  5. 机器翻译:RAG可以辅助机器翻译系统,通过检索双语数据中的相似上下文来提高翻译的准确性。
  6. 对话系统:在对话系统中,RAG可以检索对话历史中的相关信息,以生成更自然、更连贯的回复。
  7. 文本生成:RAG可以用于生成各种类型的文本,如新闻文章、故事、诗歌等,通过检索相关信息来增强生成文本的质量和相关性。
  8. 教育和学习:RAG可以辅助教育软件,通过检索大量的教育资源来生成定制化的学习材料。
  9. 法律研究:在法律领域,RAG可以帮助法律专业人员检索和生成相关的法律文件和案例摘要。
  10. 医疗咨询:RAG可以辅助医疗专业人员,通过检索医疗文献和病历来生成诊断建议或治疗方案。
  11. 技术写作:在技术文档编写中,RAG可以检索技术规范和先前文档,以生成准确和一致的技术文档。
  12. 社交媒体监控:RAG可以用于监控社交媒体上的讨论,通过检索和生成相关的信息来识别趋势和话题。
  13. 多语言支持:RAG可以用于支持多语言的文本生成,通过检索跨语言的数据来提高生成文本的质量和相关性。
  14. 历史文档分析:RAG可以帮助历史学家和研究人员检索和生成关于历史事件和人物的详细分析。
  15. 聊天机器人开发:在开发聊天机器人时,RAG可以提供更智能的对话管理,通过检索相关信息来生成更自然和信息丰富的回复。

RAG的应用场景随着技术的发展和创新而不断扩展,其核心优势在于能够结合大规模数据检索的广度和生成模型的灵活性,以生成更准确和信息丰富的文本输出。

kimi的回答还是很方便。

再看看Llama 3 8B的版本的回答:

一开始理解成随机算法游戏了?

RAG (Randomized Algorithmic Game) is a game-theoretic framework that can be applied to various scenarios where decision-making agents need to make strategic choices in an uncertain environment. Some potential application scenarios for RAG include:

1. **Economic systems**: RAG can model market behavior, predict price fluctuations, and optimize resource allocation.

2. **Finance**: RAG can analyze risk management strategies, portfolio optimization, and asset pricing models.

3. **Supply chain management**: RAG can simulate logistics, inventory control, and production planning to optimize supply chain performance.

4. **Network games**: RAG can model network behavior, predict node centrality, and optimize network topology for communication networks, social networks, or other types of interconnected systems.

5. **Healthcare**: RAG can analyze healthcare resource allocation, patient flow management, and disease spread dynamics to optimize healthcare outcomes.

6. **Military operations**: RAG can simulate military strategy, predicting enemy movements, and optimizing resource allocation for battlefield success.

7. **Social networks**: RAG can model social network dynamics, predict user behavior, and optimize influence campaigns or opinion diffusion.

8. **Environmental systems**: RAG can analyze ecosystem dynamics, predict species populations, and optimize conservation efforts to maintain ecological balance.

These scenarios illustrate the potential applications of RAG in various domains where strategic decision-making is crucial.

特意注明是什么样的RAG:

>>> what is RAG(Retrieval-Augmented Generation)’s application scenario?

I apologize for the mistake earlier! RAG (Retrieval-Augmented Generation) is a text generation framework that combines both retrieval and generation capabilities to produce high-quality text. Some potential application scenarios for RAG include:

1. **Content creation**: RAG can be used to generate high-quality content, such as articles, blog posts, or social media updates, by combining the strengths of human-written texts with the abilities of AI models.

2. **Chatbots and conversational interfaces**: RAG can power chatbots and other conversational interfaces by generating responses that are both informative and engaging.

3. **Text summarization**: RAG can summarize long pieces of text into concise and accurate summaries, making it an excellent tool for news articles, research papers, or other types of documents.

4. **Question answering**: RAG can be used to answer complex questions by retrieving relevant information from a knowledge base and generating a response that takes into account the context and nuances of the question.

5. **Language translation**: RAG can be applied to machine translation tasks, allowing it to generate more accurate and natural-sounding translations.

6. **Writing assistance tools**: RAG can be used as an AI-powered writing assistant, helping humans with ideas, suggestions, and even entire drafts for various types of texts.

7. **Content moderation**: RAG can help automate content moderation by identifying and flagging potentially harmful or inappropriate content, reducing the need for human intervention.

8. **Product description generation**: RAG can generate product descriptions that are both informative and engaging, helping e-commerce businesses to create high-quality product pages.

9. **Speech synthesis**: RAG can be used to synthesize speech from text inputs, enabling applications like voice assistants or audiobooks.

10. **Creative writing tools**: RAG can assist creative writers with ideas, suggestions, and even entire drafts for novels, screenplays, or other types of creative writing.

These scenarios illustrate the potential applications of RAG in various domains where  high-quality text generation is essential.

对比之下,结果还是可以的。

近期要考虑做嵌入式环境下的离线大模型的应用,所以先看看8B的。

RPA的商业模式

  • 卖工具:这个很常见,细分下去就是本地软件或者SaaS服务,目前趋势是SaaS服务,但RPA的工作性质又涉及工作内容安全性
  • 咨询服务:提供开发和使用上的辅导和咨询
  • 外包开发:比较好理解,熟能生巧,不用自己再学习怎么开发了
  • 整合RPA到其他软件服务中
  • 数据分析、优化

客户终身价值

整理笔记发现这一条,觉得这比ESG之类更值得深入,毕竟是to B的生意啊。

kimi的表现不错,你问他,他就抽取几条搜索到的相关结果,然后用大模型去分析这几个结果的文本,总结出来作为回答。

这样避免了对互联网内容的过度检索和分析。只是根据需要去做事。

找到了 3 篇资料作为参考:正在尝试为您在互联网搜索相关资料…开始获取资料…找到了第 1 篇资料:计算客户终身价值(CLV)必须了解的五个公式-知乎找到了第 2 篇资料:客户终身价值(CLV)如何计算|运营派找到了第 3 篇资料:客户终身价值(CLV)如何计算|人人都是产品经理一共找到 3 篇资料,正在阅读…找到了 3 篇资料作为参考:

客户终身价值(CLV,Customer Lifetime Value)是衡量企业在整个业务关系中可以从单个客户帐户中合理预期的总收入的指标。识别客户终身价值对于企业来说至关重要,因为它可以帮助企业了解客户的价值,并据此制定相应的市场策略、提高客户满意度和忠诚度、优化客户服务和产品开发等。以下是识别客户终身价值的一些关键步骤和方法:

1. 数据收集与分析

首先,企业需要收集有关客户交易的历史数据,包括购买频率、平均购买价值、购买时间等。这些数据可以帮助企业了解客户的购买行为和偏好。

2. 计算客户价值

客户价值可以通过以下公式计算: 客户价值 = 平均购买价值 * 平均购买频率

3. 估算客户生命周期

客户生命周期是指客户与企业保持关系的平均时间长度。这可以通过以下公式计算: 平均客户寿命 = 客户总寿命 / 客户总数

4. 计算CLV

结合客户价值和平均客户生命周期,可以计算出CLV: 客户生命周期价值 = 客户价值 * 平均客户寿命

5. 使用预测模型

除了基于历史数据的计算,企业还可以使用预测模型来估算未来的客户价值。这些模型可能会考虑市场趋势、客户行为变化等因素。

6. 提高CLV的策略

识别CLV后,企业可以采取一系列措施来提高客户的终身价值,例如:

  • 优化客户引导流程:确保新客户能够快速熟悉产品和服务。
  • 超额交付承诺:提供超出客户期望的产品和服务,以增加客户满意度。
  • 增加平均订单价值:通过交叉销售和推荐相关产品来提高每笔交易的价值。
  • 与客户建立关系:通过社交聆听、客户反馈和个性化服务来增强客户忠诚度。
  • 改善客户服务:提供卓越的客户服务体验,包括全渠道支持和灵活的退货政策。

7. 持续监测与调整

企业应持续监测CLV的变化,并根据市场和客户行为的变化进行相应的调整。这可能包括更新预测模型、调整市场策略或优化客户服务流程。

通过上述步骤,企业可以更准确地识别和理解客户终身价值,从而制定更有效的业务战略,提高客户满意度和忠诚度,最终推动企业的长期增长和成功。

技术封建主义

原文链接:https://medium.com/light-years/techno-feudalism-then-05fcdd81cdc7

这里用google translate的翻译结果:

那么技术封建主义呢?——这是我们所知的资本主义的终结吗

技术封建主义的膨胀似乎正在取代资本主义并演变成更令人震惊的东西

作者:Gaurav Krishnan

2024 年伊始,孟买的空气质量却恶化了。我那部简陋的中国制造的 Android 智能手机经常向我发送通知,称我所在地区的空气质量很差。一位老朋友还在她的 Instagram 上分享了一位出生于孟买的著名喜剧演员的帖子,抱怨无法在 Versova 露台上看到 Madh。

在什么时候,我们厌倦了追逐每一缕烟雾、车辆的碳排放以及化石燃料工业燃烧的余烬,一直到北极看看有多少冰融化?我在本出版物的一篇较旧的文章中谈到了我们必须如何重新构想资本主义来解决气候变化,以及一些可以帮助这场古老斗争的技术解决方案。尽管乔治·卡林的“塑料袋”和“地球很好,人们都操蛋”等关于这种情况的其他笑话仍然新颖。

但如果不大规模转向绿色解决方案并驱逐那些紧紧抓住所有液体黄金的石油巨头,情况就会发生改变。“我的意思是,我对未来以及技术的意义非常乐观,我认为嗯,我认为有一些东西……” 播客主持人说。“但要对未来持乐观态度,就需要极其天真!” 雅尼斯·瓦鲁法基斯敦促道。

切尔西队的科尔·帕尔默,被称为“冷”帕尔默,在客场对阵卢顿的比赛中打进了一个大胆的进球,几乎是梅苏特·厄齐尔对卢多格雷茨的进球,当我坐在 Instagram 上以慢动作重新观看那个进球的片段时,我开始想知道这个新的一年什么时候会到来在开始上涨后,随着潮汐的出现,它迎来了第一次平静。

我最近一次前往印度西海岸的另一个海滩目的地时,对海岸线的最后记忆仍然铭刻在我脑海中逐渐褪色的艺术画廊中,现在只剩下几笔的痕迹,距离返回几天后来自跨年短暂而宁静的假期。

当我和姐姐交换了一些年度反思工作表时,你知道那些生产力/反思文件,在 23 世纪到来后不久,现在已经进入 2024 年 3 天了,事后看来,有很多进步和进步,特别是在 2024 年。过去 5 年,我们见证了各种技术的发展。去年可以说是人工智能年(AI23)。

ChatGPT 于 2023 年 1 月首次亮相(如果我没记错的话),在劳动力、教育及其在可预见的未来的未来轨迹方面,在很多方面改变了整个格局,我们才刚刚开始了解它。但我们在 2024 年看到的社会经济转变又如何呢?

我通常(或者至少尝试)在 Instagram 上发布有趣且发人深省的故事、引言、文学、励志或音乐或文章,但时不时地我也会尝试在我的故事中分享有趣的故事。不祥的是,几乎预示着今天我们在首选应用程序上消费的数字食品提要中将会发生什么,我看到了电视节目“费城总是阳光明媚”中的一个滑稽卷轴,其中弗兰克(丹尼·德维托) )和这群人相当幽默和讽刺地讨论“通货膨胀”。

我之所以告诉你这一点,是因为除了它是本文的基础主题的一部分之外,对于世界上大多数人都在使用的应用程序(即 Instagram)的这种看似无害的使用,在某些方面颇有争议。 。“我们正在转向美丽新世界。《美丽新世界》的问题是,我们都是快乐的小奴隶,热爱我们的奴隶制,对吗?”瓦鲁法基斯在提到奥尔德斯·赫胥黎的经典著作时说道。

我们正处于一个不断变化的过程中,资本主义正在让位给techno(不是那个techno)封建主义——techno是“科技”的缩写。但这种 techno 并不是一种可以像其音乐对应物那样跳舞的曲子。这是一种相当阴暗、阴暗和阴暗的突变,一种直接来自《X战警》电影的基因,它正在疯狂地突变,导致不平衡,权力转移到少数首席执行官手中,反过来,导致社会的愤怒和幻灭增加。

从本质上讲,技术不是问题,也从来都不是问题;技术从来都不是问题。技术的复杂性逐年增长,但这可能是我们使用技术的方式,以及我们因如何使用这项技术而产生的社会经济影响和社会结构。

回到 Instagram 的例子,细则中的关键细节是——我们受到算法的影响。这些算法比我们更了解我们自己。就我们的需求、兴趣、习惯、我们搜索什么、我们购买什么而言,一切都被监控和存储在服务器场的海洋中。关于你的数据比你自己更了解你,而这些数据正是这些算法所利用的。

此外,这些算法旨在建议为我们每个人量身定制的最佳内容或产品,简而言之——行为修正——让我们沉迷于屏幕,像麻木的僵尸一样在街上艰难前行,不知不觉中像钩子扎克一样被射中寺庙。德拉罗查在《Rage Against The Machine》的《Bullet In The Head》中演唱,在他的后社交网络活动中被杰西·艾森伯格的 Zombieland 团队射杀。

《卫报》的卡罗尔·卡德瓦拉德尔 (Carole Cadwalladr)在去年 9 月的文章中写道:“瓦鲁法基斯认为,我们现在处于新的全球主人——Facelandia 的扎克伯格勋爵和 X 区的马斯克爵士——的奴役之下。”

问题不在于算法。相反,正是拥有这些平台的人所掌握的权力,在全球范围内煽动了这种社会行为改变,并带来了高度集中的消费主义,同时以租金的形式吸走了资本来使用他们的平台。

现在经济学家们各抒己见,但希腊经济部长亚尼斯·瓦鲁法基斯(Yanis Varoufakis)出版了一本题为《技术封建主义:是什么杀死了资本主义》的书,似乎表明这是我们所知的资本主义终结和文艺复兴的开始。一种类似于旧封建主义的新型封建主义在 18 世纪被资本主义所取代。

如果你愿意的话,可以将其称为“经济业力”,因为没有更好的名字。但这是一个令人大开眼界的假设,尽管是一个颇有争议的假设。是的,世界上有很多末日论者,但考虑到瓦鲁法基斯多产的过去——与国际货币基金组织等人的正面交锋,瓦鲁法基斯并不属于这一类。

2024 年的封建主义,不是封建主义的典型例子,但有一些一致性。我们现在生活在一个商业土地或空间数字化和在线化的世界。房东是这片数字土地或这些数字财产的亿万富翁所有者。

“我的看法是这样的:假设这是 1776 年,我们在伦敦,正在讨论世界状况。现在,在 1776 年我们所看到的任何地方,我们都会看到封建主义,我们会在上议院、下议院、政府、世界各地的每个地方议会中看到封建主义。

在这片土地上,我们会看到农民,我们会看到贵族,但我们确实知道,我们的封建主义不是已经消亡了,并且正在逐渐但迅速地被所谓的资本主义所取代。

权力从土地所有者到后来的电网蒸汽船机械所有者的宏伟转移,以及财富创造从租金积累利润的转变。

我的观点是,我们今天已经在经历类似的转变。无论我们往哪里看,我们都看到资本,我们看到市场,我们看到资本家做得非常好,但我认为我们已经经历了向封建主义的转变,但技术非常先进。市场已被平台取代。”

根据瓦鲁法基斯的说法,我们现在看到了以最大的科技公司及其所有者为标志的转变,他们允许我们在他们的在线平台上“租用”空间。瓦鲁法基斯将此与过去的封建主义进行比较,即地主将其土地出租,以便在其控制的地区生活和工作的公民可以经营自己的生意,同时抽取他们的大部分收入并收取租金。

“所以亚马逊网站不是一个市场。它看起来像一个市场,但它更像是属于一个人的数字云,他的财富积累不是基于利润,而是基于某种形式的租金。每次你从亚马逊购买商品时,价格的 30% 到 40% 都会归贝索斯先生所有,而不是制造商手中,”Varoufakis 说道。

瓦鲁法基斯将这种新的突变或资本形式称为“云资本”:

“大约十年前,资本一直是一种生产出来的生产资料。因此,无论你有鲁滨逊漂流记的钓鱼竿、蒸汽机还是工业、非常先进的工业机器人,今天它都是一种生产资料,我们生产这些东西是为了生产其他东西。但这种新的资本变异,我称之为‘云资本’,它就存在于你的手机中。”

在谈到技术封建主义如何运作并以亚马逊为例时,瓦鲁法基斯解释道:

“Alexa 说服你购买一些东西,比如一辆健身自行车,或者一副双筒望远镜,然后绕过世界上每个市场将其卖给你。

现在,这是一个封地,你看,现在积累的大部分收入都是以租金的形式积累的,贝索斯向资本家收取进入这个数字封地的租金。

因此,我们将回到对土地的访问系统,只是这一次是数字土地——我称之为云资本——是受到限制的、至关重要的、在市场之外、在资本主义之外,并为新的“土地”获取巨大的租金。云领主。”

在《卫报》引用的他的书中的摘录中,他写道:“想象一下直接从科幻故事书中出现的以下场景,”“你被传送到一个小镇,那里挤满了人们在忙着自己的生意,买卖小玩意、衣服,鞋子、书籍、歌曲、游戏和电影。起初一切看起来都很正常。直到你开始注意到一些奇怪的事情。事实证明,所有的商店,甚至每栋建筑,都属于一个名叫杰夫的小伙子。更重要的是,每个人都走在不同的街道上,看到不同的商店,因为一切都是由他的算法调节的……一种按照杰夫的节奏跳舞的算法。”

“它可能看起来像一个市场,但瓦鲁法基斯说它根本不是。杰夫(贝索斯,亚马逊的所有者)认为,他并不生产资本。他收房租。这不是资本主义,这是封建主义。而我们呢?我们是农奴。“云农奴”,如此缺乏阶级意识,以至于我们甚至没有意识到我们所做的推文和发帖实际上正在为这些公司创造价值。”卡德瓦拉德尔在接受《卫报》瓦鲁法基斯采访时写道。

他作为技术的无限可能性的支持者和支持者,但对这种新兴的宏观经济转变提出警告,他表示:

“今天的人工智能正在设计抗生素,可以杀死人类思维无法设计的超级细菌……这太棒了,这是人类精神的胜利,但没有看到我们的收入呈指数级集中在那些除了生产之外什么也不生产的人手中。从他人那里获取收入的权利和机会。”

瓦鲁法基斯描绘了这种向技术封建主义转变的出现和原因,解释道:

“这种转变发生在 2008 年之后,很大程度上是因为 2008 年,因为七国集团政府和央行通过银行社会主义组合来应对巨大的金融灾难,你知道,我们从我们的银行中抽出了数万亿美元。央行进入金融领域,对其他所有人都造成了巨大打击。”

“所以你知道,你创造了很多钱,你拥有世界历史上从未有过的流动性,由于需求水平低,这些流动性从未进入投资领域,因此从央行获得这笔钱的公司回购了自己的股票,造成了资产价格通胀,唯一进行投资的是云精英:拥有云资本的人。”

“你知道技术领主,你知道很棒的机器等等,但这些投资用于创建云资本,然后云资本平台取代了市场,并将收入的很大一部分从利润转移到了租金,这正在破坏稳定。为了全球体系。”

“技术从来都不能解决我们用技术造成的问题”,瓦鲁法基斯几乎以简洁而详尽的方式说道,“问题是政治性的,是社会性的”,他恳求道。

雅尼斯·瓦鲁法基斯(Yanis Varoufakis)的书《技术封建主义杀死了资本主义》封面

当谈到这项技术的功能带来了这种技术封建潮流时,我谈到了这些平台上的算法如何改变消费者与卖家直接互动的购买和销售方式,同时也征服了我们,即消费者,在算法和平台所有者政策的限制下运作,但瓦鲁法基斯认为这是技术封建主义的核心。

“亚马逊或 Facebook 并不是一种生产出来的生产方式,而是一种行为改变的生产方式。云资本赋予所有者巨大的权力和特权,可以改变人们的行为,从而创造出替代市场,在这个市场中,我们都作为买家和卖家而陷入困境,但在一个我们可以选择合作伙伴的市场中。算法为我们做出选择,并且算法以最大化云资本所有者的云租金的方式进行选择。”

瓦鲁法基斯进一步恳求在这些平台上运行的这些算法失控的危险,他指出:

“我更担心他们拥有什么!他们拥有这种资本,这种资本能够将我们分开,将我们作为市场、社区和社会进行分裂,以我们不理解的方式影响我们,以编写算法的人不理解的方式,这更令人担忧,对吧”。

“你从人工智能的编码员那里听到更真实的说法,就像人工智能是一个很好的例子,人们感到惊讶,所以对于我这个老左撇子来说,是的,答案必须始终是生产资料的社会化。”

因此,也许我们知道这是一种迫在眉睫的邪恶,但由于这些平台和技术的性质,我们尚未完全理解。但根据瓦鲁法基斯的说法,如果我们负责的话,隧道尽头就会有一线微光。

Varoufakis 建议两种解决方案:

“首先,我们必须终止免费服务,因为你不需要我解释,如果你拥有云资本家或云主义者的完全暴政,那么当你拥有有效的免费服务时。如果我们有一个小额支付系统,如果有些人买不起,他们应该获得社会保障金来支付这些小额支付,那就太棒了,这样你就可以创建一个应用程序,好吧,你可以直接获得报酬是的,不是通过广告间接通过使用该应用程序的人,因为这样你就无法完全接管我们的灵魂。”

对于他的第二个例子,瓦鲁法基斯将其称为近乎“科幻小说”并呼吁修改公司法,但他提出了一个看似乌托邦但现实的解决方案。他的想法是,这些大型科技公司可以公平分配公司股票,每家公司的每位员工只分配一股,但这些股票将是特殊的非交易投票权股票,类似于大学生的图书卡。不可交易但可投票的股份,允许每位员工对公司政策及其领导者进行投票。

“你会拥有基于市场的合作社,但以一种非掠夺性的方式拥有算法,如果他们必须从实际使用算法的人那里获得小额付款,那么我们谈论的技术将是为了一个人的利益。自由与正义的结合,”他补充道。

在与欧洲新闻播客的 30 分钟聊天中,雅尼斯·瓦鲁法基斯 (Yanis Varoufakis) 从历史和经济的角度概述了他所说的技术封建主义的含义,以及他书中所包含的思想,这些思想使得这部作品相当有趣,同时还对播客主持人进行了一些嘲笑和挖苦。很有趣,但相当直率和诚实。这是一个关于 2024 年蓬勃发展的经济气候的有趣理论。

大力出奇迹的sora

本来我对专注于视频生成的sora并没有非常大的兴趣,中文自媒体太high了,动辄中国全面落后云云。其实以stable diffusion之前的表现来说,剩下的再创新只是在窄小的领域里面逐渐调优的过程,不存在大的突破。

sora被顶会退稿也是出于这个原因。那为何sora要出及能出如此惊艳的生成视频效果呢?

应该还是资本使然,资本需要在AI领域上绑架各种资本加大投入,以进一步推动泡沫的盛宴。Open AI应该是已经完全被资本左右,不惜动用大量的算力资源去驱动一个并不具备创新的方向,而只是工程上的堆叠(大白象工程)。

说一下sora没有太大意义的地方在于,我们看过独立日(Independent Day),第一次看的时候觉得太震撼了,原来天地冲撞是这样的场景。

今天,如果你让sora生成一个天地冲撞的视频,它应该是没问题的。

但假如电影史上从来没出现过独立日或者类似的电影,这时候让sora(幻想)生成这样的场景,能做到什么样的效果?

这就是基于已知信息训练出来的结果,它无法超越前人,只是模仿,组合模仿,这种AI最大的对手是China?//laf

转djq师兄(97广东理科状元,FreeWheel CTO)朋友圈的评论:

比如说Sora爆红,几篇中文文章基本都是要么车轱辘话说了等于没说,要么就几个名词狗屁不通的拼凑一起,毫无AI痕迹。其实各种基于Stable Diffusion的创新还是不少来自国内的,IP adapter, LCM什么的,但是都算技巧派的。而Sora某种程度上就是Stable Diffusion的升级版本,完美体现了OpenAI大力出奇迹的精神。
Sora的技术报告有13个作者,带头的是两个博士刚毕业和一个本科工作几年的,都是年轻人,据说肝了一年撸出来的。这个项目相当多的数据处理和计算,到PB规模都不奇怪,体力要求不是一般的高,过程还很不确定。Stable Diffusion其实不是一个模型,而是一个带三个模型的pipeline。它的核心就是先用CLIP(也是OpenAI的作品)先把文字转成一个类似于图像模子的东西,然后用U-net(一个类似于U型锁的网络,也是广泛应用的结构)做Diffusion,大致是逐步无中生有根据模子把图像生成出来(但是在一个所谓Latent空间),最后用VAE(这个应该是stability ai训练的一个auto encoder)恢复到像素空间。Diffusion是一个相对比较坚实的数学模型,所以名字带了stable字样。CLIP和VAE都是单独训练的。而Sora估计也是类似的结构,只不过三个模型都换了。VAE对应的他们叫视频压缩网络,U-net则被换成了基于transformer的扩散模型,虽然叫Diffusion Transformer,其实是个误导人的名字,因为本质上是transformer based diffusion,同时把视频分解成时空小块然后tokenize,都是基本操作。而对应CLIP那个condition的生成模型可能也差不多,还用GPT做了增强。所以一年搞这么多,虽然可能没有特别高深的东西,但都是超多工作量。
所以网文说什么这是个transformer多么先进都是胡扯,transformer是个基础模块,OpenAI的模型就没有不用的。Google发明的时候还有encoder和decoder,一个decoder block还有两个注意力层,都被OpenAI简化掉了,就一个注意力加个MLP,然后就往死里加参数和数据,奇迹就出现了。然后condition也不是条件,而更像是用模子来引导或者塑造最终结果的意思,conditioning这个词很难用中文描述。总之Stable Diffusion那一套可以再玩一次。反正就还是attention is all you need。OpenAI主打一个暴力美学碾压一切包括人类。

sora指出一个方向,国内也可以在stable diffusion的基础上把几层结构再按需优化,中国也是大力出奇迹的好地方。

Google Gemini

开始试用一下Google Gemini,没有GPT-4那么多限制,用google账号就可以了。

全球零售业设备展会有哪些? 1. **NRF 零售业大会与博览会 (NRF Retail’s Big Show & Expo):** NRF 零售业大会与博览会是全球最大的零售业展会,每年吸引来自全球各地的数万名零售商和供应商参会。该展会涵盖了零售业的各个方面,包括人工智能、电子商务、数据分析、支付技术等。
2. **CES 国际消费电子展 (CES):** CES 国际消费电子展是全球最大的消费电子展,每年吸引来自全球各地的数十万名与会者。该展会展示了最新的消费电子产品和技术,包括智能手机、平板电脑、电视、无人机等。
3. **EuroShop 零售业贸易博览会 (EuroShop):** EuroShop 零售业贸易博览会是欧洲最大的零售业展会,每年吸引来自全球各地的数十万名参会者。该展会涵盖了零售业的各个方面,包括商店设计、展示技术、支付技术等。
4. **China Retail Expo 中国零售业博览会:** China Retail Expo 中国零售业博览会是亚洲最大的零售业展会之一,每年吸引来自全国各地的数千名零售商和供应商参会。该展会涵盖了零售业的各个方面,包括电子商务、大数据、人工智能等。
5. **ShopTalk 零售与电子商务大会 (ShopTalk):** ShopTalk 零售与电子商务大会是全球最大的零售与电子商务大会之一,每年吸引来自全球各地的数千名零售商、电子商务企业和供应商参会。该大会涵盖了零售业和电子商务的各个方面,包括人工智能、数据分析、支付技术等。
6. **GlobalShop 零售设计和展示博览会 (GlobalShop):** GlobalShop 零售设计和展示博览会是全球最大的零售设计和展示展会,每年吸引来自全球各地的数万名参会者。该展会展示了最新的零售设计和展示技术,包括商店设计、陈列设计、数字标牌等。
7. **National Retail Federation Retail Supply Chain Conference & Exhibition:** 该展会每年举办一次,汇集了零售业的供应链专业人士,涵盖了从供应商管理到配送和物流等各个方面的主题。
8. **MODE EXPO:** 该展会每年举办两次,展示了来自世界各地的时尚和服装产品,吸引了来自世界各地的采购商和零售商。
9. **Retail Asia Expo:** 该展会每年举办一次,展示了来自亚洲各地的零售产品和服务,吸引了来自世界各地的采购商和零售商。
10. **World Retail Congress:** 该展会每年举办一次,汇集了来自世界各地的零售业高管和专家,探讨零售业的最新趋势和发展。
Show me the top ten exhibitions of retail equipment.

1. **NRF Retail’s Big Show & Expo:** Held annually in New York City, NRF Retail’s Big Show & Expo is the world’s largest retail trade show, bringing together retailers, vendors, and industry experts from around the globe.

2. **EuroShop:** Taking place every three years in Düsseldorf, Germany, EuroShop is the world’s largest trade fair for the retail industry, showcasing the latest innovations in store design, technology, and equipment.

3. **China Retail Expo:** Held annually in Shanghai, China Retail Expo is the largest retail trade show in Asia, attracting thousands of retailers, suppliers, and industry professionals from across the region.

4. **ShopTalk:** ShopTalk is a leading retail and e-commerce conference held annually in Las Vegas, Nevada. It brings together thousands of retailers, e-commerce executives, and solution providers to discuss the latest trends and technologies shaping the industry.

5. **GlobalShop:** GlobalShop is the world’s largest retail design and expo, held annually in Las Vegas, Nevada. It showcases the latest in retail design, technology, and equipment, attracting thousands of attendees from around the world.

6. **National Retail Federation Retail Supply Chain Conference & Exhibition:** This annual event in Atlanta, Georgia, brings together retail supply chain professionals to discuss the latest trends and technologies in the field, covering everything from supplier management to distribution and logistics.

7. **MODE EXPO:** MODE EXPO is a bi-annual fashion and apparel trade show held in Paris, France. It showcases collections from designers and brands from around the world, attracting buyers and retailers from across the globe.

8. **Retail Asia Expo:** Held annually in Hong Kong, Retail Asia Expo is the largest retail trade show in Asia, bringing together retailers, suppliers, and industry experts from across the region.

9. **World Retail Congress:** The World Retail Congress is an annual event that gathers retail executives and experts from around the world to discuss the latest trends and developments shaping the industry. It is held in different cities around the world each year.

10. **International Franchise Expo:** The International Franchise Expo is held annually in New York City and Las Vegas, Nevada. It brings together franchisors and potential franchisees from a wide range of industries, including retail, food service, and hospitality.

中英文结果会略有差异。也没有ChinaShop。

关于语言异化

搬家前继续整理meme。

ChatGPT的兴起带来了一门新的技术,prompt engineering,很多朋友很快就成为其中的“专家”。

其本质就是为了加快AI的使用者如何更高效调用AI来进行创作,是一种新的人机协作的语言。

人机之前的交流是双向的,最开始是工程师如何调用机器的故事:编写指令–汇编语言–高级语言,另一条线是如何让机器理解人的语言:机器理解人想做什么(人类编写程序)–算法理解人想做什么(网页内容进行SEO)–AI精确理解人类想要什么(Prompt engineering)

这里的发展,依然是局限于人机之间。慢慢地,机器对自然语言的理解已经非常贴近人了,人与人之间的沟通也逐渐演进为人与agent的沟通,再到人–agent–agent–人的链条。

当世界已经无法区分agent还是人的时候,agent之间可能又出现更简单的做法——机器间通讯,即协议。星球大战里面,3PO和R2D2之间就是通过简单的声音信号和灯信号来通讯,只是电影会让3PO再翻译给观众看。

说点悲观的,一旦世界回到不需要语言进化的阶段,即agent-agent通讯,人类文明将停止进化,机器世界也不会自行发展出新的meme。因为写过通讯协议的都知道,协议本身是不允许出现异常的。

近期AI…5

海尔的case

看起来海尔是AWS的一个大客户。展示了AIGC的几个例子:

  • 文生图(没看明白跟海尔的产品有什么关系)
  • 图生图,通过输入设计线稿,生成产品概念图
  • 批量图,用于家装的,从3D数据到效果图
  • 全场景图,生成产品图、营销图

主要受益是加速设计。

西门子的case

内部业务助手,以及打通业务数据分析的平台。

店匠科技的case

产品模特图的生成(真人模特图替换模特与背景场景)

总结的几个难点有点意思,比如:服装区域的精准分割,残缺人台的骨骼检测优化,精准控制生成过程

近期AI…4

企业在介入生成式AI应用时会思考的问题,这一页归纳得挺好,当然了,这也是来参加这个会的目的吧?

  • 什么样的User Case能帮到业务?(重点是“真”)
  • 如何衡量一个生成式AI User Case的成功?(投入产出,未来,明的利益,暗的优势等等)
  • 如何选择大模型去构建应用?(企业自身必须要有靠得住的AI咨询方)
  • 如何保证企业私有数据不被大模型吸收?(这些问题开始就有较多的技术解决方案了)
  • 我们缺乏高质量的数据怎么办?(买吧,但是还是要有质量标准)
  • 构建生成式AI应用工程化的挑战有哪些?如何克服?
  • 如何去购买xx加速去做生成式AI User Case的实验?(还是实验,现在让资本市场很短视的,不大允许费资源只是做个实验)
  • 模式适配/调优,Prompt Engineering/RAG/Finetune用哪种方法合适?(细节,专业的问题,还是要有专业咨询或内部专家)
  • 如何设定Guardrail(护栏)为负责任的生成式AI应用?(先把合规性准备好)
  • 构建生成式AI应用需要团队的Skills有哪些改变?(目前的回答是有的,但是答案本身也在动态更新中)

不得不说,是不是刻意留了不少英文单词在里面,导致读起来不大爽。

接着是讲端到端构建AIGC应用的关键路径

  1. 应用范围:定义使用场景与用例
  2. 模型选择:选择现有基础模型或预训练自己的模型
  3. 模型适配和模型调整:Prompt Engineering + 知识增强 + 微调 –>评估效果
  4. 应用程序集成:部署模型及运行推理 –> 构建由基础模型驱动的应用程序

几种适配调整的成本与效果的排列,原图是平面坐标图,改成顺序排列:

  • 成本:RAG < Prompt Engineering < 预训练 == 微调
  • 效果:PE < RAG = 微调 < 预训练

预训练当然好,但优质数据贵啊

AIGC的业务风险

法律/监管/偏见/幻觉/隐私保护/问责制/业务透明度/滥用/有害内容/知识产权保护

ISV和SI就不罗列了。天天变的东西。

AIGC工程化“最后三公里”的挑战

UI用户界面开发(用户体验) / 工具链 / 模型调优(持续的?) / 数据工程(提取、清晰、治理、数据模型) / 云基座(这里就涉及到AWS提供的系列支撑了)

近期AI…3

AWS中国区组织了这个生成式AI的高管峰会,其意义在于将他们在AWS上做的AI IaaS及PaaS介绍给之前用云服务不错的客户,一起来挖掘更好的AI SaaS,达到双赢。

基于对AWS发展历程的了解,我相信如果纯粹做SaaS的话,应该不用担心AWS的抄袭问题。

Gartner的演讲嘉宾上来,肯定是标准的Hype Cycle了。

没有细看各种技术点的位置,感觉Gartner已经入魔了,什么行业都搞Hype Cycle,网上一搜,经常有新的图出来,有些位置感觉就是拍脑袋了。

Gartner将AI技术栈格局分成四层:模型——工程工具——应用领域——基础设施和支持

AWS自然是基础设施和支持这一层,而应用领域,是在座的去挖掘,前面两个,有太多AI团队在做了。

企业对AI的关注:

保护投资:AI信任、风险、安全管理(即用AI来增强企业安全)

开发者增强:用AI来增强开发能力

交付价值:AI自动化增强互联劳动力

这三个领域有交错需要有:行业AI云平台、智能化应用、可持续的民主化生成式人工智能

讲得能理解,但原PPT有点诘屈聱牙。

以零售行业为例,AI已经产生的作用:提高生产力、节约成本、提高用户体验、驱动新产品开发、提高准确性、改进型号。

机遇(其实也有不少新的case了):增强搜索向上营销、助理招聘入职、社交媒体情绪分析、供应链优化、增强文本(文案、话术)

制造业方面的也一样是老生常谈(至少对我来说)……不罗列了。

对于生成式AI,建议关注的层面,除了技术栈四个层面之外,

风险与价值:注意偏见、过度投资、合规风险

自研与生态:寻找生态系统中的合作伙伴、培养内部专家

(未完待续)