manus ai大模型從昨晚開始引爆科技圈話題熱榜,有點(diǎn)復(fù)刻一個(gè)月前deepseek的爆紅出圈的路徑。
國(guó)產(chǎn)AI大模型各個(gè)都要對(duì)標(biāo)ChatGPT,各個(gè)都說(shuō)吊打?qū)κ,manus也不例外,這款manus究竟是何方神圣呢,是炒作還是真有實(shí)力,讓我們來(lái)了解下manus。
#manus ai大模型介紹#
先來(lái)看一張圖,為什么說(shuō)manus吊打ChatGPT,是有數(shù)據(jù)支撐的:
超越OpenAI的DeepResearch,成為第一。
GAIA是什么野雞榜單嗎,并不是,也給大家科普下GAIA:
GAIA(General AI Assistants)是一個(gè)面向通用AI助手能力的基準(zhǔn)評(píng)測(cè)體系,由 Meta AI(FAIR)、Hugging Face 等研究團(tuán)隊(duì)于 2023 年提出。
GAIA通過(guò)466個(gè)精心設(shè)計(jì)的問(wèn)題,來(lái)測(cè)試ai大模型的實(shí)力如何,是有一定參考性的,最起碼和OpenAI的DeepResearch是在同一個(gè)競(jìng)爭(zhēng)環(huán)境下,所以manus實(shí)力肯定是值得認(rèn)可的。
#Manus的創(chuàng)始人背景#
Manus 是一款多功能AI助手,可高效處理復(fù)雜任務(wù):如簡(jiǎn)歷篩選(媲美專業(yè)招聘)、結(jié)合家庭需求在紐約智能選房、股票分析、網(wǎng)站創(chuàng)建部署,以及旅行規(guī)劃、保險(xiǎn)比價(jià)等。
其技術(shù)核心為“l(fā)ess structure more intelligence”,依托優(yōu)質(zhì)數(shù)據(jù)、強(qiáng)大模型與靈活架構(gòu)驅(qū)動(dòng)能力涌現(xiàn)。創(chuàng)始人肖弘(華中科技大學(xué)校友)曾創(chuàng)立夜鶯科技,旗下產(chǎn)品包括AI助手Monica。
#Manus能干嘛有什么用#
這張圖是從manus官網(wǎng)上截取的,主要作用也都介紹到了。
最簡(jiǎn)單的理解就是manus會(huì)把你提出的需求拆解,一步步的實(shí)現(xiàn)。和deepseek以及現(xiàn)在的部分ai大模型app,你問(wèn)他回答的模式略有區(qū)別。
比如之前的那篇GAIA的論文,PDF文檔轉(zhuǎn)化為PPT,是可以讓manus來(lái)執(zhí)行實(shí)現(xiàn)的。案例:連續(xù)提出多條需求1. 寫一段Python程序,用OCR把這篇論文的PDF信息提取出來(lái)。 2. 把PDF里面的內(nèi)容,提煉整理出來(lái)。 3. 將提煉的內(nèi)容整理成一篇科普風(fēng)格的PPT。4. 將PPT生成好后,發(fā)送給我。
然后就是manus的表演時(shí)間,你可以看到正在執(zhí)行中。
虛擬機(jī)開啟后,可以看到manus的執(zhí)行步驟拆解。
然后,就會(huì)開始執(zhí)行第一個(gè)任務(wù),安裝python庫(kù)。完成的項(xiàng)目,會(huì)全部在右邊的預(yù)覽窗口打x。
你能可視化的看到manus正在做什么,進(jìn)行到了哪一步,非常贊的交互體驗(yàn)。
所有的指令執(zhí)行完成后,真的會(huì)給你一份PPT,雖然不是那么美觀,打開看到內(nèi)容大差不差,相當(dāng)牛。
#manus和deepseek哪個(gè)更厲害#
1. 定位與目標(biāo)
Manus
定位:面向個(gè)人和企業(yè)的多功能AI助手,側(cè)重生活化場(chǎng)景(招聘、房產(chǎn)、金融、旅行等)。
優(yōu)勢(shì):任務(wù)覆蓋面廣,注重實(shí)用性與用戶交互體驗(yàn),技術(shù)理念強(qiáng)調(diào)“靈活架構(gòu)驅(qū)動(dòng)能力涌現(xiàn)”。
局限:未公開模型規(guī)模和技術(shù)細(xì)節(jié),能力邊界尚不明確。
DeepSeek
定位:專注通用人工智能(AGI)研究,代表產(chǎn)品如DeepSeek-R1、DeepSeek-MoE等大模型。
優(yōu)勢(shì):技術(shù)透明度高,模型在學(xué)術(shù)基準(zhǔn)測(cè)試(如MMLU、GSM8K)表現(xiàn)突出,開源生態(tài)完善。
局限:更偏重技術(shù)探索,直接面向終端用戶的產(chǎn)品化案例較少。
2. 技術(shù)能力對(duì)比
維度 | Manus | DeepSeek |
---|---|---|
核心技術(shù) | 未公開細(xì)節(jié),強(qiáng)調(diào)“優(yōu)質(zhì)數(shù)據(jù)+靈活架構(gòu)” | 基于Transformer變體,支持長(zhǎng)上下文理解、復(fù)雜推理 |
訓(xùn)練數(shù)據(jù) | 多模態(tài)生活場(chǎng)景數(shù)據(jù)(推測(cè)) | 萬(wàn)億級(jí)多語(yǔ)言文本、代碼、科學(xué)文獻(xiàn) |
開源程度 | 閉源,商業(yè)化產(chǎn)品導(dǎo)向 | 部分模型開源(如DeepSeek-MoE) |
應(yīng)用場(chǎng)景 | 生活服務(wù)、辦公自動(dòng)化 | 學(xué)術(shù)研究、企業(yè)級(jí)解決方案、開發(fā)者工具 |
3. 用戶適用性
選擇Manus的場(chǎng)景:
需解決具體生活或工作問(wèn)題(如招聘、房產(chǎn)投資)。
偏好“即插即用”的輕量化工具,無(wú)需技術(shù)背景。
選擇DeepSeek的場(chǎng)景:
開發(fā)者或企業(yè)需定制化AI能力(如代碼生成、數(shù)據(jù)分析)。
追求模型技術(shù)前沿性,需透明技術(shù)文檔和API支持。
4. 實(shí)際案例驗(yàn)證
Manus:
在招聘場(chǎng)景中可異步處理簡(jiǎn)歷,但未公布準(zhǔn)確率或效率提升數(shù)據(jù)。
房產(chǎn)推薦依賴本地化數(shù)據(jù),在紐約等特定區(qū)域可能表現(xiàn)較好。
DeepSeek:
在權(quán)威評(píng)測(cè)中數(shù)學(xué)推理(GSM8K)準(zhǔn)確率超90%,代碼生成(HumanEval)達(dá)80%+。
支持超長(zhǎng)文本(128K tokens)上下文理解,適合科研與工程場(chǎng)景。
總結(jié)
Manus更“實(shí)用”:適合非技術(shù)用戶解決生活化任務(wù),但技術(shù)深度待驗(yàn)證。
DeepSeek更“硬核”:技術(shù)實(shí)力強(qiáng)、透明度高,適合開發(fā)者與企業(yè)級(jí)需求。
建議:個(gè)人用戶可嘗試Manus的便捷性,企業(yè)或開發(fā)者優(yōu)先考慮DeepSeek的技術(shù)擴(kuò)展性。