齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

發表人 **mtr** 發表於 2025-03-06, 11:41

中文介紹：
https://36kr.com/p/3193925689146755

幕後團隊，就係小弟之前介紹過的 AI 工具 "Monica" ...

viewtopic.php?f=7&t=335011

同一堆人。

https://manus.im/

不過可能因為太屈機，現時想登記做會員都登記唔到，而且暫時只接受佢地團隊發出邀請碼的行內人及友好使用。

發表人 **mtr** 發表於 2025-03-06, 12:07

AI 應用三部曲：

Stage 1 : LLM Chatbot - 舉例：你想煮一碟菜，佢會幫搵晒網上所有同款食譜再做綜合分析你知最正路的做法，話埋你知煮既時候要注意乜野，但你仍要自己洗菜，預備調味料，切定薑等

Stage 2 : Copilot : 好比你炒菜只需做後鑊，佢幫你執碼，預備醃料，開定個獻汁，洗定個鑊

Stage 3 : AI Agent - 落手落腳接近一腳踢幫你辦事，好比你煮一碟菜，佢唔止幫你洗菜，預備調味 ... 連後鑊都做埋, manus.im 已做到呢一步

發表人 **mtr** 發表於 2025-03-06, 16:46

https://36kr.com/p/3194320365534597

發表人 **joe** 發表於 2025-03-06, 19:31

發表人 **mtr** 發表於 2025-03-07, 10:30

- 主要靠 python 運行，電腦要預先裝 python - conda 環境，唔明上網搜尋 "How to create a new conda environment on my computer"

- 要一條 LLM 的 API key，github 的範本預你用 chatgpt4o，試下改用 grok3 / deepseek r1 的

https://x.com/aigclink/status/1897833217774043204

复刻Manus，无需邀请码，开源版Manus！

支持在电脑上完成很多任务，包括网页浏览、文件操作、写代码等

OpenManus使用了传统的ReAct模式，优势是基于当前的状态进行决策，上下文和记忆方便管理，无需单独处理，需要注意，Manus有使用Plan进行规划

OpenManus目前也已初步加入了具有 Plan&ReAct的功能，正在优化调试，大家也可以尝试更改System Prompt 让OpenManus学会记录文档和Todo List的习惯

主要依赖的几个工具：
1. PythonExecute：执行Python代码与电脑系统交互，可以进行文件操作、数据处理、自动化任务等
2. FileSaver：保存文件到本地，比如txt、python、html等
3. BrowserUseTool：打开、浏览和控制浏览器
4. GoogleSearch：进行网络信息检索

开源链接见下条
https://github.com/mannaandpoem/OpenManus
有 demo video。

發表人 **joe** 發表於 2025-03-07, 15:33

發表人 **mtr** 發表於 2025-03-07, 19:17

个人三小时复刻开源版Manus，邀请码也不需要了
https://36kr.com/p/3195860372536711

發表人 **joe** 發表於 2025-03-07, 19:23

發表人 **mtr** 發表於 2025-03-07, 22:11

另一個近似 Manus 的應用：MetaGpt

https://github.com/geekan/MetaGPT

Camel AI

https://github.com/camel-ai/camel/pkgs/container/camel

發表人 **mtr** 發表於 2025-03-07, 22:38

重有其他開源的替代品

https://x.com/karminski3/status/1897881743912522226

發表人 **joe** 發表於 2025-03-07, 23:22

發表人 **streamboy** 發表於 2025-03-08, 17:50

嘩好勁揪啊，啲AI太犀利，跟都跟唔切 :clap2hands

發表人 **mtr** 發表於 2025-03-08, 19:06

解畫既係前 wechat 高級工程師。

https://x.com/idoubicc/status/1897500402226225301

以 manus 为例，拆解以 multi-agent 为基础的通用任务智能体的工作流程：

一. 意图识别

1. 获取用户输入内容，进行必要的意图识别和关键词提取，比如用户输入的是“想去日本旅游，需要一个旅行计划”，拆解之后得到的关键词是： japan-trip，任务类型为：travel

2. 如果用户输入的需求比较简单，不能识别用户的意图，此步骤可以引导用户继续对话，补充更多的信息，或者上传文档 / 图片等资料

二. 任务初始化

1. 用识别出来的任务关键词创建任务文件夹，启动 docker 容器，为后续的任务执行做环境隔离

2. 任务执行过程中的内容产物，写入到任务文件夹，任务结束之后清理 docker 容器

三. 步骤规划

1. 使用意图识别的结果 + 补充背景信息，请求一个推理模型，对任务进行步骤拆分

2. 将任务拆分的步骤信息，写入到任务文件夹的 http://todo.md

四. 任务执行

1. 遍历任务文件夹中的 http://todo.md，[ ] 表示待执行的任务，[x] 表示已执行的任务

2. 取出待执行的任务，带上任务上下文信息，做一次 function call，这里带上的 function tools 是系统内置的可以执行不同任务的 agent，比如 search agent / code agent / data-analysis agent

3. 根据 function call 的结果，调度指定的 agent 执行任务，把执行过程中产生的内容，写入到容器中的任务文件夹

4. 任务执行完，由主线程，更新 http://todo.md，继续下一个任务

五. 归纳整理

1. http://todo.md 里面的任务全部执行完之后，主线程针对用户的初始需求，做一次整理输出

2. 把任务的内容产物，给到用户浏览或下载（文档 / 代码 / 图片 / 链接等）

3. 收集用户对任务的满意度

----

整个方案理下来，核心在于执行任务的 agent 设计，以及主线程的调度流程，以 search agent 为例，在处理“日本旅行计划”这个任务中，主要的执行步骤：

1. 拿到 japan-trip 等关键词信息，调用谷歌第三方 API，获取 10-20 条搜索结果

2. 模拟浏览器点开第一个网页，浏览网页内容，获取网页文本内容 + 浏览器截图拿到网页视觉信息

3. 调用支持多模态输入的模型，输入当前任务要求，从当前浏览的网页中提取有效信息（是否有符合要求的结果，如果不满足要求，返回下一个该点击的 button 元素）

4. 模拟浏览器点击 + 网页滚动行为，拿到更多的网页内容 + 视觉信息，重复几次，直到收集到的内容满足任务要求为止

5. 把收集到的内容保存到任务文件夹

这个 search agent 的核心在于模拟用户浏览网页行为，需要用到无头浏览器和多模态模型。

code agent 和 data-analysis agent 相对而言比较简单：

1. 根据任务需求，创建本地文件，写入代码（python 代码做数据分析，html 代码做视觉呈现）

2. 通过系统调用执行代码，把执行结果保存到任务文件夹

3. 通过 code-preview 服务，预览 html 文件的内容

---

此类 multi-agent 产品，还有一些改进的空间：

1. http://todo.md 的多个任务，是线性依赖关系，可以使用 DAG（有向无环图）实现更加复杂的任务依赖

2. 需要引入自动化测试 agent，对任务结果进行判断和矫正，如果对某个步骤评分过低，需要回溯到之前的某个任务节点重新执行

3. 允许全自动 + 用户介入的混合模式，在某个步骤执行完，先寻求用户反馈，如果几秒内没收到反馈，则自动继续运行

---

整体评价：manus 在工程层面做了很多工作，整体交互比其他产品好很多。技术层面，依然是没什么壁垒，对模型有比较深的依赖：

1. 也许有个小模型，做任务执行前的意图识别

2. 任务规划和推理，用 deepseek-r1

3. 图片识别 + 代码生成，用 claude-3.7-sonnet

token 消耗会很高，能不能广泛用起来，取决于谁来负担这个成本。

最终的任务准确性和用户满意度，还需要更多的案例来说明。

發表人 **joe** 發表於 2025-03-08, 22:47

發表人 **mtr** 發表於 2025-03-10, 18:18

Manus 比人踢爆係 "套殼" 應用：

https://x.com/aigclink/status/1898981907762930091

誰在線上

齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

Re: 齋睇 demo，感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用