誰在線上

正在瀏覽這個版面的使用者: 沒有註冊會員 和 3 位訪客

齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

歡迎各位影音 fans 齊齊吹水

齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 mtr 發表於 2025-03-06, 11:41

中文介紹:
https://36kr.com/p/3193925689146755

幕後團隊,就係小弟之前介紹過的 AI 工具 "Monica" ...

viewtopic.php?f=7&t=335011


同一堆人。

https://manus.im/

不過可能因為太屈機,現時想登記做會員都登記唔到,而且暫時只接受佢地團隊發出邀請碼的行內人及友好使用。
圖檔
mtr
Fun區守護神 - 變淫大金剛
Fun區守護神 - 變淫大金剛
  頭像
 
文章: 55422

註冊時間:
2007-04-17, 19:21

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 mtr 發表於 2025-03-06, 12:07

AI 應用三部曲:

Stage 1 : LLM Chatbot - 舉例:你想煮一碟菜,佢會幫搵晒網上所有同款食譜再做綜合分析你知最正路的做法,話埋你知煮既時候要注意乜野,但你仍要自己洗菜,預備調味料,切定薑等

Stage 2 : Copilot : 好比你炒菜只需做後鑊,佢幫你執碼,預備醃料,開定個獻汁,洗定個鑊

Stage 3 : AI Agent - 落手落腳接近一腳踢幫你辦事,好比你煮一碟菜,佢唔止幫你洗菜,預備調味 ... 連後鑊都做埋, manus.im 已做到呢一步
圖檔
mtr
Fun區守護神 - 變淫大金剛
Fun區守護神 - 變淫大金剛
  頭像
 
文章: 55422

註冊時間:
2007-04-17, 19:21

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 mtr 發表於 2025-03-06, 16:46

附加檔案
1.jpg
1.jpg (26.15 KiB) 被瀏覽 665 次
圖檔
mtr
Fun區守護神 - 變淫大金剛
Fun區守護神 - 變淫大金剛
  頭像
 
文章: 55422

註冊時間:
2007-04-17, 19:21

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 joe 發表於 2025-03-06, 19:31

:eusa_clap: :eusa_clap: :eusa_clap:
joe
Fun區皇室 - 出野大魔王
Fun區皇室 - 出野大魔王
  頭像
 
文章: 13611

註冊時間:
2005-03-17, 09:35

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 mtr 發表於 2025-03-07, 10:30

- 主要靠 python 運行,電腦要預先裝 python - conda 環境,唔明上網搜尋 "How to create a new conda environment on my computer"

- 要一條 LLM 的 API key,github 的範本預你用 chatgpt4o,試下改用 grok3 / deepseek r1 的

https://x.com/aigclink/status/1897833217774043204

复刻Manus,无需邀请码,开源版Manus!

支持在电脑上完成很多任务,包括网页浏览、文件操作、写代码等

OpenManus使用了传统的ReAct模式,优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理,需要注意,Manus有使用Plan进行规划

OpenManus目前也已初步加入了具有 Plan&ReAct的功能,正在优化调试,大家也可以尝试更改System Prompt 让OpenManus学会记录文档和Todo List的习惯

主要依赖的几个工具:
1. PythonExecute:执行Python代码与电脑系统交互,可以进行文件操作、数据处理、自动化任务等
2. FileSaver:保存文件到本地,比如txt、python、html等
3. BrowserUseTool:打开、浏览和控制浏览器
4. GoogleSearch:进行网络信息检索

开源链接见下条
https://github.com/mannaandpoem/OpenManus
有 demo video。
圖檔
mtr
Fun區守護神 - 變淫大金剛
Fun區守護神 - 變淫大金剛
  頭像
 
文章: 55422

註冊時間:
2007-04-17, 19:21

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 joe 發表於 2025-03-07, 15:33

:a012: :a012: :a012:
joe
Fun區皇室 - 出野大魔王
Fun區皇室 - 出野大魔王
  頭像
 
文章: 13611

註冊時間:
2005-03-17, 09:35

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 mtr 發表於 2025-03-07, 19:17

个人三小时复刻开源版Manus,邀请码也不需要了
https://36kr.com/p/3195860372536711
圖檔
mtr
Fun區守護神 - 變淫大金剛
Fun區守護神 - 變淫大金剛
  頭像
 
文章: 55422

註冊時間:
2007-04-17, 19:21

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 joe 發表於 2025-03-07, 19:23

:eusa_clap: :eusa_clap: :eusa_clap:
joe
Fun區皇室 - 出野大魔王
Fun區皇室 - 出野大魔王
  頭像
 
文章: 13611

註冊時間:
2005-03-17, 09:35

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 mtr 發表於 2025-03-07, 22:11

圖檔
mtr
Fun區守護神 - 變淫大金剛
Fun區守護神 - 變淫大金剛
  頭像
 
文章: 55422

註冊時間:
2007-04-17, 19:21

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 mtr 發表於 2025-03-07, 22:38

圖檔
mtr
Fun區守護神 - 變淫大金剛
Fun區守護神 - 變淫大金剛
  頭像
 
文章: 55422

註冊時間:
2007-04-17, 19:21

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 joe 發表於 2025-03-07, 23:22

:clap2hands :clap2hands :clap2hands
joe
Fun區皇室 - 出野大魔王
Fun區皇室 - 出野大魔王
  頭像
 
文章: 13611

註冊時間:
2005-03-17, 09:35

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 streamboy 發表於 2025-03-08, 17:50

嘩好勁揪啊,啲AI太犀利,跟都跟唔切 :clap2hands :clap2hands
streamboy
Fun區 - 小頭目
Fun區 - 小頭目
 
文章: 220

註冊時間:
2008-02-09, 09:10

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 mtr 發表於 2025-03-08, 19:06

解畫既係前 wechat 高級工程師。

https://x.com/idoubicc/status/1897500402226225301

以 manus 为例,拆解以 multi-agent 为基础的通用任务智能体的工作流程:

一. 意图识别

1. 获取用户输入内容,进行必要的意图识别和关键词提取,比如用户输入的是“想去日本旅游,需要一个旅行计划”,拆解之后得到的关键词是: japan-trip,任务类型为:travel

2. 如果用户输入的需求比较简单,不能识别用户的意图,此步骤可以引导用户继续对话,补充更多的信息,或者上传文档 / 图片等资料

二. 任务初始化

1. 用识别出来的任务关键词创建任务文件夹,启动 docker 容器,为后续的任务执行做环境隔离

2. 任务执行过程中的内容产物,写入到任务文件夹,任务结束之后清理 docker 容器

三. 步骤规划

1. 使用意图识别的结果 + 补充背景信息,请求一个推理模型,对任务进行步骤拆分

2. 将任务拆分的步骤信息,写入到任务文件夹的 http://todo.md

四. 任务执行

1. 遍历任务文件夹中的 http://todo.md,[ ] 表示待执行的任务,[x] 表示已执行的任务

2. 取出待执行的任务,带上任务上下文信息,做一次 function call,这里带上的 function tools 是系统内置的可以执行不同任务的 agent,比如 search agent / code agent / data-analysis agent

3. 根据 function call 的结果,调度指定的 agent 执行任务,把执行过程中产生的内容,写入到容器中的任务文件夹

4. 任务执行完,由主线程,更新 http://todo.md,继续下一个任务

五. 归纳整理

1. http://todo.md 里面的任务全部执行完之后,主线程针对用户的初始需求,做一次整理输出

2. 把任务的内容产物,给到用户浏览或下载(文档 / 代码 / 图片 / 链接等)

3. 收集用户对任务的满意度

----

整个方案理下来,核心在于执行任务的 agent 设计,以及主线程的调度流程,以 search agent 为例,在处理“日本旅行计划”这个任务中,主要的执行步骤:

1. 拿到 japan-trip 等关键词信息,调用谷歌第三方 API,获取 10-20 条搜索结果

2. 模拟浏览器点开第一个网页,浏览网页内容,获取网页文本内容 + 浏览器截图拿到网页视觉信息

3. 调用支持多模态输入的模型,输入当前任务要求,从当前浏览的网页中提取有效信息(是否有符合要求的结果,如果不满足要求,返回下一个该点击的 button 元素)

4. 模拟浏览器点击 + 网页滚动行为,拿到更多的网页内容 + 视觉信息,重复几次,直到收集到的内容满足任务要求为止

5. 把收集到的内容保存到任务文件夹

这个 search agent 的核心在于模拟用户浏览网页行为,需要用到无头浏览器和多模态模型。

code agent 和 data-analysis agent 相对而言比较简单:

1. 根据任务需求,创建本地文件,写入代码(python 代码做数据分析,html 代码做视觉呈现)

2. 通过系统调用执行代码,把执行结果保存到任务文件夹

3. 通过 code-preview 服务,预览 html 文件的内容

---

此类 multi-agent 产品,还有一些改进的空间:

1. http://todo.md 的多个任务,是线性依赖关系,可以使用 DAG(有向无环图)实现更加复杂的任务依赖

2. 需要引入自动化测试 agent,对任务结果进行判断和矫正,如果对某个步骤评分过低,需要回溯到之前的某个任务节点重新执行

3. 允许全自动 + 用户介入的混合模式,在某个步骤执行完,先寻求用户反馈,如果几秒内没收到反馈,则自动继续运行

---

整体评价:manus 在工程层面做了很多工作,整体交互比其他产品好很多。技术层面,依然是没什么壁垒,对模型有比较深的依赖:

1. 也许有个小模型,做任务执行前的意图识别

2. 任务规划和推理,用 deepseek-r1

3. 图片识别 + 代码生成,用 claude-3.7-sonnet

token 消耗会很高,能不能广泛用起来,取决于谁来负担这个成本。

最终的任务准确性和用户满意度,还需要更多的案例来说明。
圖檔
mtr
Fun區守護神 - 變淫大金剛
Fun區守護神 - 變淫大金剛
  頭像
 
文章: 55422

註冊時間:
2007-04-17, 19:21

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 joe 發表於 2025-03-08, 22:47

:great: :great: :great:
joe
Fun區皇室 - 出野大魔王
Fun區皇室 - 出野大魔王
  頭像
 
文章: 13611

註冊時間:
2005-03-17, 09:35

Re: 齋睇 demo,感覺內地繼 deepseek 後又出到樣震撼全球的 AI 應用

文章發表人 mtr 發表於 2025-03-10, 18:18

Manus 比人踢爆係 "套殼" 應用:

https://x.com/aigclink/status/1898981907762930091
圖檔
mtr
Fun區守護神 - 變淫大金剛
Fun區守護神 - 變淫大金剛
  頭像
 
文章: 55422

註冊時間:
2007-04-17, 19:21

下一頁

回到 影音 fun 區