一码难求的 Manus金融杠杆投资,带火了整个 agent 赛道。OpenAI 推出 agent 工具包,开源项目 OpenManus 复现 Manus,同时,一些已经面世的 agent 产品也扩大了知名度,其中就包括 Flowith。
Flowith 是一个画布式 AI 创作平台,2024 年初开始布局 agent 方向,2024 年 8 月正式上线了 agent 框架——Flowith Oracle,这比 OpenAI 的 o1 模型还要早。至今,Oracle 已经解决了超过 2000 万次复杂问题。
2024 年 8 月 8 日,Flowith 发布 Oracle 并获得当日 Product Hunt 榜首
Oracle 好用吗?和 Manus 有什么不同?agent 的理想形态可能是怎样的?最近,APPSO 体验了 Oracle,并专访了 Flowith 团队的拐子,有了一些新的发现。
展开剩余92%解放双手的 agent,仍然需要人类的参与
使用 Oracle 的方式很简单,打开网页 flowith.net,然后在对话框点亮「Oracle」模式,输入你的问题。
如果需要深度的分析,建议使用高算力的Ultra模式
不少网友尝试用 Oracle 复刻 Manus 的案例,而在我的体验过程中,对于可视化、交互式的工作,Oracle 都能完成得比较好。
Oracle 生成,GPT 模型的演进路线图
Oracle 生成,自言自语的贪吃蛇游戏
同时,Oracle 有个鲜明的特点,和其他 agent 都不太一样:让人类体会到,自己和 AI 在协作。
当我让 Oracle 写篇可以通过晋江签约的小说,Oracle 先把完整的工作流搭建好了,分出了 13 个步骤,每个步骤包括多个子任务。
在 Oracle 执行任务之前,我们可以选中文字修改步骤,点击右边的「垃圾桶」图标删除步骤,或者点击左下角的「加号」添加新的步骤。确认无误,Oracle 再开始干活。
Oracle 先对平台和热门作品进行市场调查,然后确定小说的核心定位、主要情节线和矛盾冲突,再开始写大纲和章节。多线程画布的形式,让过程看起来条理分明。
虽然 Oracle 给出的大纲和正文,离真正的网文作者还是差点火候,但交付的过程和结果都很完整,尤其前期的调研工作做得很充分,确实把事情给做完了。
另一个有参与感的例子是,让 Oracle 帮我生成一个网页,参考史努比漫画的风格,给不懂技术的小白讲解什么是强化学习。
Oracle 觉得我的需求还不够清晰,主动向我追问了一些细节,我做了回复,明确只讲奖励机制,需要分章节,必须有互动元素,其他让它自己揣摩。
最终设计好的网页确实非常适合不懂技术的读者,各种静态的图示做得简单易懂。
交互的方式也很有趣和直观,比如,通过不同的方式教史努比找骨头和弹钢琴,对应了不同的奖励机制。
甚至,我们还可以向 Oracle 上传自己的内容。直接让 agent 生成一个网页,结果可能是同质化的、没有个性的,这其中缺少的,是我们自己的资料。
但只要在提示词里写到一些个人化的请求,比如「按照我的年终总结.....」,Oracle 就会设计一个步骤,让我们上传文档。
除了设计好工作流后向用户确认、信息不足时向用户追问和请求文件,Oracle 还会在完成每个步骤之后,询问用户满不满意。
如果满意,任务可以自动进行下去。如果不满意,用户可以修改步骤,重新运行。
如果给体验做个小结,可以说,大部分的工作确实由 Oracle 完成,但这并非意味着,我是被动的,恰恰相反,被解放了双手的我,能够更自由地指导 AI,体会到翻身当甲方的快乐。
传统的 AI 交互,是由我们给出提示词、AI 生成结果,人类是无情的任务发布和结果接收机器,我们的创造力发挥得有限,但像 Oracle 这种,AI 负责干活,人类负责督工和给出关键的 idea,实时参与、完善和优化 AI 生成的工作流,结果更可能让人满意。
按 Flowith 市场营销与商务拓展负责人拐子的话说,「人机结合」是 Flowith 的核心哲学,这并不意味着让 AI 更像人,关键是找到人类和 AI 各自最擅长的协作方式,「不是 AI 取代人类,也不是人类限制 AI,而是两个不同认知系统的深度融合与互补」。
交互独特的 agent,让 AI 不困在聊天框里
除了强调人的参与,画布的交互形式,也是 Oracle 和其他 agent 不同的地方之一。
每当用户输入指令,Oracle 会根据其功能和可以使用的工具,分解出较小的子任务,然后这些子任务会被传递到任务分配器,从而逐步执行。
Flowith Oracle 当前支持的部分外部工具
当这样的工作过程被画布所承载,我们便可以在画布纵向和横向展开的每张卡片里,看到子任务以及所调用的工具。
上下文无限延展,并行完成多个任务,拐子认为,这就是为什么,与线性的聊天框和打开网页一个个查看的 agent 相比,画布更加高效,「电脑是为人设计的,AI 完全不用被束缚住」。目前,Oracle 执行一个任务,基本都控制在 10 分钟内。
而且,AI 执行任务有出错的可能性,但画布的每个节点都可以控制,如果一个节点失败,可以让 AI 重新跑一次。能够干预中间步骤,也是画布形态的一个优点。
学生、教师、自媒体等内容创作者,构成了 Flowith 的核心用户社区,拐子强调,「这是一场双向选择」,Flowith 的愿景,就是打造一个为创作者而生的 AI 赋能工具。
不过,对于一些用户来说,画布的交互形式,可能意味着一定的使用门槛,特别是完成复杂任务的时候,流程和节点会呈现更多的信息量。拐子表示理解,但他也认为,画布恰恰反映了人类思维的本质——并非一条单一直线,而是多维度、多分支的发散过程。
虽然现阶段 Oracle 执行任务时已能并行搜索和处理多维度信息,本质上仍是单一 agent 在进行思考和决策。这就像你有一个非常聪明的助手,但终究只有一个大脑在运转。
但很快,我们就能看到 Flowith 的进化。拐子预告,即将推出真正的「多智能体协作」模式,用户可以同时指挥多个专精不同领域的 AI 智能体,比如,一个负责研究,一个专注创意,一个擅长整合,彼此之间还能进行思想碰撞,「这不再是简单的工具使用,而是一种全新的创作生态系统」。
画布形式的另外一大优势在于,知识库的构建与激活。知识库的意义不难理解,如果我们不告诉 AI 自己是谁,不向 AI 输入我们个性化的知识,AI 输出的往往是千人一面的通用信息,接入了知识库后,AI 才能真正为我们所用。
2025 年 1 月,Flowith 正式发布 2.0 版本,其中一个核心升级便是「知识花园」功能,它比传统的知识库更灵活,可以将各类素材、灵感和资料,有机整合到一个或多个动态空间中,由 AI 进行智能管理和激活。
图片来自:即刻@Bruce-拐子
目前,Oracle 还没有和知识库功能打通,但拐子透露,他们正在快速推进这项工作,「当 agent 与个人知识花园结合,它将不仅仅是执行任务的工具,而是真正理解你思维模式、掌握你私有化信息的协作伙伴」。
和主打通用 agent 的 Manus 不同,Oracle 只是 Flowith 生态中的一个关键组件,Flowith 真正想打造的,是一个「终极形态的 AI 创作工具」,以二维画布为交互基础,同时集成 agent、知识花园以及多样化的模型能力,构建一个完整的思维创作空间。所以,拐子认为,Manus 与 Oracle 不存在直接的可比性,尽管它们都被称为 agent。
用 agent 解决问题,关键在于交付有价值及品味的结果
Manus 火了以后,出现了一个很有意思的现象:很多用户会尝试用它直接生成视频。这符合了人类指挥 AI 干活最好一步到位的微妙心理,但生成视频的任务,并不适合由现在的 agent 完成,反而会浪费较多的算力。
目前,Oracle 暂未接入视频生成工具,拐子解释,这是从体验决策的角度考虑的,视频生成的成本高,体验又没法做到极致,「如果用户付费却只得到平庸结果,还不如引导他们使用专门的 AI 视频工具」。
兜兜转转,我们又回到了最基础的问题上:用 agent 做什么?在产品调研时,拐子发现了一个很有意思的现象:很多用户,包括他自己,一开始都并不知道,用 agent 解决什么实际的问题。
从拐子的经验来看,目前 Oracle 在深度调研类任务中表现尤为出色,能将复杂的调研成果转化为交互式网页等高价值媒介。
Flowith 社区里的一个例子,让他印象特别深刻。一位用户利用 Oracle,生成了一个完整的交互式网页,集成了上汽的四个汽车品牌,包含时间线、技术分析等元素,不是简单地罗列信息,而是将思维具象地呈现,水准接近专业汽车品牌官网。
作为 Flowith 团队核心成员和 Oracle 的深度用户,拐子还亲自进行了一系列和 agent 有关的创新实验,其中最有意思的是,将 Oracle 纳入个人内容创作工作流,特别是小红书运营。
从选题到发布的全流程,Oracle 都能提供系统性支持,自动拆解创作任务,智能推荐素材资源,提供深度修改建议,甚至生成精准引流话术。这套 AI 加持的创作流程,帮助拐子在短短一个月内就涨了 5000 多名粉丝,AI 生成的内容,在互动数据上也表现优异。
拐子体会到,AI 已经不只是一个简单模仿的「内容生成工具」,而是一个「创作伙伴」。当我们把自己的语言风格、思维模式输入到知识库中,让 AI 学会用我们的口吻说话,AI 就能帮我们打造一个独特且有吸引力的个人 IP。同时,人类的价值排序,可能会随之变化,「如果大家都会使用 AI,那品味将是我们人类最后的壁垒」。
从实验延伸开去,未来,Flowith 计划设计更多垂直化的「子 Oracle」,针对特定场景,提供深度优化的 agent 能力。比如,专门用于小红书经营的 agent,可以帮助那些技术过硬但不擅长运营的独立开发者,获得更多的曝光和用户支持。
Manus 的爆火,让 agent 概念进入更广泛的讨论,同时也引发了更深层次的思考:agent 的理想形态究竟是什么?是模拟人类操作电脑、手机,还是与工具和数据直接交互,或是多种方式的有机结合?
拐子给出了自己的见解:「没有所谓的终极答案,Flowith 提供的只是众多可能性中的一种。但有一点是确定的:agent 的核心价值在于解决实际问题,交付有价值的结果。所谓有价值,不仅是功能上的实用,更是优质产品、思维模式与个人知识的融合,最终生成既满足创作者,也打动用户的方案。」
对于 agent 的边界和可能性金融杠杆投资,拐子认为最重要的是用户亲自探索:「agent 到底能做什么,不能做什么,这些边界需要在实际应用中不断验证。更关键的是,我们需要习惯这种全新的 AI 交互方式。诚然 AI 还有很长的路要走,但每一位用户都可以随着 AI 一起成长,共同探索可能的未知。 」
发布于:广东省