熟女久久中文,黄91久久久人妻,日本黄五区,青青久久久,色999日韩,欧美熟女草逼,99国内精品久久,色天使亚洲,人妻丰满精品一区二

正在閱讀:ChatGPT Agent正式發(fā)布了,看看實力如何

ChatGPT Agent正式發(fā)布了,看看實力如何

2025-07-18 13:29:03來源:TechWeb.com.cn 關(guān)鍵詞:ChatGPTChatGPT Agent閱讀量:24955

導(dǎo)讀:即日起,專業(yè)版(Pro)、增強版(Plus)和團隊版(Team)ChatGPT 用戶都可使用ChatGPT Agent。ChatGPT Agent的使用入口沒變,還是在ChatGPT原頁面,“工具”下拉選擇“Agent mode”即可。
  7月18日消息,OpenAI CEO 奧特曼(Sam Altman)帶隊直播25分鐘發(fā)布“ChatGPT Agent”,首個統(tǒng)一智能體,大大提升了ChatGPT處理現(xiàn)實世界任務(wù)需求的能力。
 
  例如,通過ChatGPT Agent,可以讓ChatGPT處理以下請求:“查看我的日歷,并根據(jù)最新消息簡要介紹即將召開的客戶會議”、“計劃和購買食材,為四人做日式早餐”以及“分析三個競爭對手并創(chuàng)建幻燈片”。ChatGPT將智能地瀏覽網(wǎng)站、過濾結(jié)果、在需要時提示你安全登錄、運行代碼、進行分析,甚至提供可編輯的PPT、Excel,總結(jié)其分析結(jié)果。
 
  奧特曼稱:“ChatGPT Agent使用計算機執(zhí)行復(fù)雜任務(wù),對自己來說是一個真正感受AGI的時刻。”
 
  即日起,專業(yè)版(Pro)、增強版(Plus)和團隊版(Team)ChatGPT 用戶都可使用ChatGPT Agent。
 
  ChatGPT Agent的使用入口沒變,還是在ChatGPT原頁面,“工具”下拉選擇“Agent mode”即可。
 
  融合三大能力,PPT比人做得好
 
  今年1月,OpenAI發(fā)布了首個智能體Operator,讓AI像人類一樣直接與GUI交互,可以自主上網(wǎng)、點擊和輸入。
 
  Operator推出2周后,OpenAI又推出了首個Deep Research,推理模型直接可以使用工具,開展研究,擅長分析和總結(jié)信息。
 
  現(xiàn)在,ChatGPT Agent融合了此前三大技術(shù)突破的優(yōu)勢:Operator與網(wǎng)站交互的能力,Deep Research整合信息的技巧,以及ChatGPT智能對話優(yōu)勢。
 
  “Agent mode”下的ChatGPT可以直接使用用戶的計算機資源,包括智能瀏覽網(wǎng)頁、篩選結(jié)果,在需要時提醒安全登錄、運行代碼、進行分析,還能直出PPT和Excel匯總發(fā)現(xiàn)結(jié)果。
 
  為了展示ChatGPT Agent能力,團隊演示了一個真實場景:上傳一張團隊吉祥物圖片,ChatGPT 可以制作公司吉祥物漫畫風(fēng)貼紙,然后再訂購500張并送到某個地址。
 
  在理解提示詞后,ChatGPT 先整合搜索-再推理創(chuàng)作-再執(zhí)行任務(wù),調(diào)用用工具Imagen生成動漫版圖片,設(shè)計貼紙,最后從StickerMule訂購500份寄到的用戶指定的地址。
 
  另外,團隊還演示了ChatGPT Agent做PPT的能力。
 
  要求ChatGPT從Google云中提取分析評估數(shù)據(jù)并制作成PPT,直接用圖表展示結(jié)果。
 
  ChatGPT Agent 鏈接Google云API進行搜索,并讀取相關(guān)內(nèi)容信息,并編寫一些代碼。
 
  模型使用圖像生成功能,為PPT 圖表做一些裝飾和優(yōu)化。
 
  制作出第一張PPT,還不夠精致。
 
  強化學(xué)習(xí)的一個關(guān)鍵特性是模型會審視自己的結(jié)果,并加以完善,以交付出色的最終結(jié)果。
 
  最終,ChatGPT Agent調(diào)用模型生成了PPT圖表。
 
  ChatGPT Agent “跑分”情況
 
  在網(wǎng)頁瀏覽、現(xiàn)實任務(wù)完成能力的評估中,ChatGPT Agent全部刷新了SOTA。
 
  在人類最后考試(HLE)中,ChatGPT Agent以41.6%的得分,刷新了最高紀錄。當(dāng)研究團隊采用并行策略后,即同時運行最多8次并選取自信度最高結(jié)果,HLE得分直接刷到了44.4%。
 
  在最難的數(shù)學(xué)基準(zhǔn)測試FrontierMath中,通過使用工具,如訪問終端執(zhí)行代碼,ChatGPT Agent的準(zhǔn)確率達到27.4%,遠遠優(yōu)于之前的o3和o4-mini兩種模型。
 
  在旨在評估模型在復(fù)雜、經(jīng)濟上有價值的知識工作任務(wù)上的性能的內(nèi)部基準(zhǔn)上,ChatGPT Agent的輸出大約有一半的情況下與人類相當(dāng)或更好,同時明顯優(yōu)于o3和o4 mini。
 
  在評估數(shù)據(jù)科學(xué)生產(chǎn)力任務(wù)的DSBench中,ChatGPT Agent顯著超越了人類表現(xiàn)。
 
  在Excel編輯能力的SpreadsheetBench測試中,當(dāng)能夠直接編輯電子表格時,ChatGPT Agent的得分甚至更高,為45.5%,而Excel中的Copilot為20.0%。
 
  在投行分析師1-3年級建模任務(wù)的內(nèi)部評估中,ChatGPT Agent表現(xiàn)優(yōu)于Deep Research和o3模型。
 
  在OpenAI發(fā)布的BrowseComp基準(zhǔn)測試(衡量瀏覽代理在網(wǎng)絡(luò)上定位難以找到的信息的能力),ChatGPT Agent以68.9%的準(zhǔn)確率成為新SOTA,比Deep Research高出17.4%。
 
  最后,關(guān)于WebArena?(在新窗口中打開),這是一個旨在評估網(wǎng)絡(luò)瀏覽代理在完成現(xiàn)實世界網(wǎng)絡(luò)任務(wù)方面的性能的基準(zhǔn)測試,ChatGPT Agent比基于o3的CUA(為Operator提供動力的模型)有所改進。
 
  AI Agent三維競爭格局形成
 
  2025年是全球AI Agent技術(shù)爆發(fā)元年,行業(yè)從基礎(chǔ)大模型競爭全面轉(zhuǎn)向智能體落地,競爭格局呈現(xiàn)多層級分化。
 
  在通用領(lǐng)域,今年年初,中國團隊開發(fā)的全球首個通用Agent“Manus”發(fā)布即引發(fā)震撼,6月訪問量達1616萬次。
 
  在垂直領(lǐng)域,就在OpenAI ChatGPT Agent發(fā)布前一天,亞馬遜云科技發(fā)布了企業(yè)級Agent部署平臺Amazon Bedrock AgentCore,提供七大核心服務(wù)(如運行時隔離、代碼沙盒、瀏覽器工具),支持8小時異步任務(wù),幫助開發(fā)者打通AI agent從概念驗證到生產(chǎn)部署之間的關(guān)鍵環(huán)節(jié)。
 
  隨著OpenAI ChatGPT Agent的強勢加入,當(dāng)前AI Agent已形成 “通用 vs 垂直”、“端到端 vs 多模型”、“C端工具 vs B端平臺”的三維競爭格局。
我要評論
文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)。

  • 互聯(lián)網(wǎng)AI生成內(nèi)容數(shù)量首超人類:52%比48%

    自ChatGPT問世以來,越來越多的企業(yè)開始采用大模型來生成內(nèi)容,相較于聘請真人的高昂成本,AI生成內(nèi)容憑借其成本優(yōu)勢,成為了企業(yè)爭奪搜索引擎、社交媒體及廣告渠道流量的新工具。
    AI大模型文本內(nèi)容ChatGPT
    2025-10-29 10:28:50
  • 沃爾瑪同OpenAI合作 允許用戶通過ChatGPT即時支付功能直接購物

    同OpenAI合作,允許消費者通過ChatGPT直接購物,沃爾瑪用戶的消費體驗也將改善,也有利于他們零售業(yè)務(wù)的發(fā)展。他們在上就提到,通過人工智能優(yōu)選購物,零售體驗從被動變?yōu)橹鲃?,通過學(xué)習(xí)、計劃和預(yù)測,人工智能能幫助用戶提前預(yù)測他們的需求。
    Open AI沃爾瑪ChatGPT
    2025-10-16 10:51:33
  • 比ChatGPT更快!Sora下載量5天突破100萬次

    Sora允許用戶通過輸入提示詞免費生成短視頻。盡管目前僅支持iOS設(shè)備,且需邀請碼才能訪問,該應(yīng)用仍在發(fā)布后迅速攀升至蘋App Store榜首。
    ChatGPTSora人工智能
    2025-10-10 09:39:47
  • ChatGPT變身App Store“對話即應(yīng)用”時代到了

    就在 10 月 6 日,OpenAI 正式宣布,Booking、Canva、Coursera、Expedia、Spotify 、Figama、Zillow 等應(yīng)用在 ChatGPT 上線。這意味著,用戶在對話中可以直接訂機票、設(shè)計海報、生成圖表,甚至打開播放列表。所有這些操作,都在 ChatGPT 的聊天窗口里完成,不再需要切換網(wǎng)頁或打開獨立 App。
    ChatGPTOpenAI人工智能
    2025-10-09 10:16:08
  • 早報|千億高空機器人賽道迎來爆發(fā);OpenAI發(fā)布ChatGPT Agent

    高空機器人賽道兩家頭部企業(yè)完成大額融資,將這條千億美元的“垂直賽道”瞬間點燃;OpenAI通過技術(shù)直播發(fā)布重磅產(chǎn)品ChatGPT Agent......
    高空機器人OpenAIChatGPT Agent
    2025-07-18 09:42:29
  • ChatGPT重磅升級GPT-4.1:編程專家模型登場

    在實際測試中,GPT-4.1比GPT-4o更注重效率,不再過度聊天,這讓它在專業(yè)場景中更可靠。與舊版GPT-4o相比,GPT-4.1帶來了更全面的提升。
    ChatGPTGPT-4.1
    2025-05-15 11:56:23
版權(quán)與免責(zé)聲明:

凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責(zé)任。

本站轉(zhuǎn)載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、平臺或個人從本站轉(zhuǎn)載時,必須保留本站注明的作品第一來源,并自負版權(quán)等法律責(zé)任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責(zé)任。

鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問題,請與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

不想錯過行業(yè)資訊?

訂閱 智能制造網(wǎng)APP

一鍵篩選來訂閱

信息更豐富

推薦產(chǎn)品/PRODUCT 更多
智造商城:

PLC工控機嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機械包裝機械工程機械倉儲物流環(huán)保設(shè)備化工設(shè)備分析儀器工業(yè)機器人3D打印設(shè)備生物識別傳感器電機電線電纜輸配電設(shè)備電子元器件更多

我要投稿
  • 投稿請發(fā)送郵件至:(郵件標(biāo)題請備注“投稿”)1271141964.qq.com
  • 聯(lián)系電話0571-89719789
工業(yè)4.0時代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務(wù)平臺
智能制造網(wǎng)APP

功能豐富 實時交流

智能制造網(wǎng)小程序

訂閱獲取更多服務(wù)

微信公眾號

關(guān)注我們

抖音

智能制造網(wǎng)

抖音號:gkzhan

打開抖音 搜索頁掃一掃

視頻號

智能制造網(wǎng)

公眾號:智能制造網(wǎng)

打開微信掃碼關(guān)注視頻號

快手

智能制造網(wǎng)

快手ID:gkzhan2006

打開快手 掃一掃關(guān)注
意見反饋
我要投稿
我知道了
华宁县| 淮滨县| 西畴县| 黔江区| 昌平区| 怀宁县| 新野县| 临桂县| 贵港市| 新野县| 三明市| 永济市| 叙永县| 丰都县| 明水县| 扎兰屯市| 阳东县| 吉水县| 玉田县| 玛曲县| 夹江县| 内丘县| 延津县| 甘泉县| 朝阳区| 伊春市| 苍山县| 永宁县| 弋阳县| 南平市| 桂林市| 达州市| 若尔盖县| 临沭县| 洛宁县| 桂东县| 平南县| 普安县| 甘孜县| 合江县| 婺源县|