」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 人工智慧 > GPT-5:我們希望看到的 4 個新功能

GPT-5:我們希望看到的 4 個新功能

發佈於2024-08-17
瀏覽:255

至少,这是我们所希望的。 GPT-5 没有具体的发布日期,我们认为我们所知道的大部分信息都来自拼凑其他信息并试图将各个点联系起来。

尽管如此,无论截止日期如何,我们希望在 GPT-5 发布时看到一些关键功能。

OpenAI 的 GPT-5 是什么?

GPT-5 是备受期待的 OpenAI GPT-4 人工智能模型的继任者,人们普遍认为该模型将成为市场上最强大的生成模型。虽然目前还没有 GPT-5 的官方发布日期,但有迹象表明它最早可能会在 2024 年夏天发布。目前关于该模型的细节知之甚少,但可以通过一些信息来说明一些事情。确定性:

OpenAI 已向美国专利商标局申请了该名称的商标。 几位 OpenAI 高管已经讨论或暗示了该模型的可能功能。 OpenAI 首席执行官 Sam Altman 在 2024 年 3 月接受 Lex Fridman 的 YouTube 采访时多次提到该模型。

这些都指向一个令人兴奋的现实:GPT-5 即将到来!也就是说,目前很多事情都只是猜测。但我们希望在模型中看到一些东西,并且相当有信心看到这些东西。以下是其中的一些:

1. 更多多模态

GPT-5: 4 New Features We Want to See

GPT 人工智能模型系列最令人兴奋的改进之一就是多模态。为清楚起见,多模态是指人工智能模型不仅能够处理文本,还能够处理图像、音频和视频等其他类型输入的能力。多模态将成为 GPT 系列模型未来的重要进步基准。

GPT-4 已经擅长处理图像输入和输出,音频和视频处理方面的改进是 OpenAI 的下一个里程碑,而 GPT-5 是一个很好的起点。谷歌已经通过 Gemini AI 模型在这种多模态方面取得了重大进展。不做出回应是 OpenAI 的一贯做法。但是,当然,不要相信我们的话。在他的 Unconfuse Me 播客 [PDF 文字记录] 中,比尔·盖茨 (Bill Gates) 询问 OpenAI 首席执行官 Sam Altman,他预计 GPT 系列在未来两年将实现哪些里程碑。他的第一个答案?视频处理。

因此,对于 GPT-5,我们希望能够使用视频——根据提示上传视频、随时随地创建视频、使用文本提示编辑视频、从视频中提取片段以及查找特定场景来自大型视频文件。我们希望能够对音频文件执行类似的操作。这是一个很大的问题,是的。但考虑到人工智能的发展速度,这是一个非常合理的期望。

2. 更大、更高效的上下文窗口

GPT-5: 4 New Features We Want to See

尽管是市场上最复杂的 AI 模型之一,GPT 系列 AI 模型却拥有最小的上下文窗口之一。例如,Anthropic 的 Claude 3 拥有 200,000 个令牌的上下文窗口,而 Google 的 Gemini 可以处理惊人的 100 万个令牌(标准使用为 128,000 个)。相比之下,GPT-4 的上下文窗口相对较小,只有 128,000 个令牌,实际可用于 ChatGPT 等界面的令牌约为 32,000 个或更少。

随着先进的多模态技术的出现,改进上下文窗口几乎是不可避免的。也许增加两到四倍就足够了,但我们希望看到大约十倍。这将使 GPT-5 能够以更有效的方式处理更多信息。现在,更大的上下文窗口并不总是意味着更好。因此,我们希望看到上下文处理效率的提高,而不仅仅是增加上下文窗口。

你看,一个模型可能有 100 万个 token 上下文窗口(大约 700,000 个单词的容量),但当被要求总结一本 500,000 字的书时,它无法生成全面的摘要,因为它无法充分处理整个内容尽管理论上有能力这样做。你能读一本 50 万字的书并不意味着你能回忆起其中的所有内容或明智地处理它。

3. GPT Agents

GPT-5: 4 New Features We Want to See

也许 GPT-5 版本中最令人兴奋的可能性之一就是 GPT Agents 的首次亮相。虽然“游戏规则改变者”这个词在人工智能中可能被过度使用,但 GPT 代理在各个实际意义上都将真正成为游戏规则改变者。但这将会如何改变游戏规则呢?

目前,像 GPT-4 这样的 AI 模型可以帮助你完成任务。他们可以为您写电子邮件、讲笑话、解决数学问题或起草博客文章。但是,他们只能执行该特定任务,而无法完成完成您的工作所需的一组相关任务。

假设您是一名 Web 开发人员。作为工作的一部分,您需要做很多事情:设计、编写代码、排除故障等等。目前,您一次只能将其中一部分任务委托给 AI 模型。也许您可以要求 GPT-4 模型为主页编写代码,然后要求它为联系页面编写代码,然后为“关于”页面编写代码,等等。您需要迭代地完成这些任务。有些任务是模型根本无法完成的。

这种提示人工智能模型执行特定子任务的迭代过程既耗时又低效。在这种情况下,您(Web 开发人员)是负责协调和提示 AI 模型一次执行一项任务的人工代理,直到您完成一整套相关任务。

GPT Agents 承诺由 GPT-5 协调的专业专家机器人能够自我提示并自主处理复杂任务的所有子集。强调“自我提示”和“自主”。

因此,如果 GPT-5 附带 GPT Agents,您可以要求它“为 Maxwell Timothy 构建一个投资组合网站”,而不仅仅是“为我编写主页代码”。理论上,GPT-5 能够通过调用专家人工智能代理来进行自我提示,以处理构建网站所需的各种子任务。它可能会调用一个 GPT 来获取有关 Maxwell Timothy 的网络信息,调用另一个代理来为不同页面编写代码,另一个代理来生成和优化图像,甚至调用另一个 AI 代理来部署网站,所有这些都不需要重复的人工操作。提示。

4. 减少幻觉

尽管 OpenAI 在处理 AI 模型中的幻觉方面已经取得了长足的进步,但 GPT-5 真正的试金石将是其解决长期存在的问题的能力幻觉阻碍了人工智能在医疗保健、航空和网络安全等高风险、安全关键领域的广泛采用。这些领域都将从人工智能的大量参与中受益匪浅,但目前正在避免大规模采用。

为了清楚起见,这里的幻觉是指人工智能模型以高度置信度生成并呈现听起来似乎合理但完全捏造的信息的情况。

想象一下这样的场景:GPT-4 被集成到诊断系统中,用于分析患者症状和医疗报告。幻觉可能会导致人工智能自信地提供错误的诊断,或根据想象的事实和错误的逻辑推荐潜在危险的治疗方案。这种错误在医学领域的后果可能是灾难性的。

类似的保留意见也适用于其他高后果领域,例如航空、核电、海上作业和网络安全。我们并不期望 GPT-5 能完全解决幻觉问题,但我们期望它能显着降低此类事件发生的可能性。

当我们热切等待这个备受期待的人工智能模型的正式发布时,有一点是确定的:GPT-5 有潜力重新定义人工智能的边界,开创人类的新时代-机器协作和创新。

版本聲明 本文轉載於:https://www.makeuseof.com/gpt-5-features-we-want-to-see/如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • AI Agents是什麼? - 解析與應用指南
    AI Agents是什麼? - 解析與應用指南
    Artificial Intelligence (AI) is rapidly evolving, and 2025 is shaping up to be the year of AI agents. But what are AI agents...
    人工智慧 發佈於2025-05-01
  • Python中使用OpenCV和Roboflow進行性別檢測 - 分析Vidhya
    Python中使用OpenCV和Roboflow進行性別檢測 - 分析Vidhya
    介绍 从面部图像中检测是计算机视觉的众多迷人应用之一。在此项目中,我们将OPENCV结合起来,以面对位置和用于性别分类的Roboflow API,制作一种识别面部的设备,检查它们并预测其性别。我们将利用Python(尤其是在Google Colab中)输入和运行此代码。该直接提供了易于遵循的代码的演...
    人工智慧 發佈於2025-04-29
  • 機器先行思考:戰略AI崛起
    機器先行思考:戰略AI崛起
    STRATEGIC AI Prologue 11. May 1997, New York City. It was a beautiful spring day in New York City. The skies were clear, and temperatures were climbin...
    人工智慧 發佈於2025-04-29
  • LLM必備的8個免費與付費API推薦
    LLM必備的8個免費與付費API推薦
    利用LLMS的力量:大型語言模型的API指南 在當今的動態業務格局中,API(應用程序編程接口)正在革新我們如何整合和利用AI功能。 它們充當必不可少的橋樑,無縫將大型語言模型(LLM)連接到不同的軟件生態系統。 這種有效的數據交換和功能共享允許應用程序充分利用開放和封閉源LLM的功率。本文探討...
    人工智慧 發佈於2025-04-21
  • 使用指南:Falcon 3-7B Instruct模型
    使用指南:Falcon 3-7B Instruct模型
    中的革命性飛躍 關鍵功能和改進 可擴展的模型大小:有各種尺寸(1b,3b,7b和10b parameters),為各種應用程序提供了靈活性。 高級文本生成:文本生成中的異常功能,包括細微的上下文理解和特定於任務的應用程序。 本文是數據科學博客馬拉鬆的一部分。 目錄 架構設計 性能基準 [2 [2 使...
    人工智慧 發佈於2025-04-20
  • DeepSeek-V3對比GPT-4o與Llama 3.3 70B:最強AI模型揭秘
    DeepSeek-V3對比GPT-4o與Llama 3.3 70B:最強AI模型揭秘
    The evolution of AI language models has set new standards, especially in the coding and programming landscape. Leading the c...
    人工智慧 發佈於2025-04-18
  • 盤點Top 5 AI智能預算工具
    盤點Top 5 AI智能預算工具
    通過AI解鎖財務自由:印度的最高預算應用程序 您是否厭倦了不斷想知道您的錢去了哪裡? 賬單似乎會吞噬您的收入嗎? 人工智能(AI)提供了強大的解決方案。 AI預算工具提供實時財務見解,個性化建議和動態計劃,使資金管理更簡單,更準確。 有些甚至使用生成AI提供基於聊天的財務分析!本文探討了印度可...
    人工智慧 發佈於2025-04-17
  • Excel SUMPRODUCT函數詳解 - 數據分析學院
    Excel SUMPRODUCT函數詳解 - 數據分析學院
    Excel的SumProduct函數:數據分析PowerHouse 解鎖Excel的Sumproduct函數的功能,以用於簡化數據分析。這種多功能功能毫不費力地結合了求和功能,擴展到跨相應範圍或數組的加法,減法和分裂。 無論您是分析趨勢還是解決複雜的計算,Sumproduct都會將數字轉換為可...
    人工智慧 發佈於2025-04-16
  • 深度研究全面開放,ChatGPT Plus用戶福利
    深度研究全面開放,ChatGPT Plus用戶福利
    Openai的深入研究:改變遊戲的AI研究 Openai已為所有Chatgpt加上訂戶釋放了深入的研究,並承諾在研究效率方面具有重大提高。 在測試了雙子座,Grok 3和困惑等競爭對手的類似功能之後,我可以自信地將Openai的深入研究宣佈為出色的選擇。此博客深入研究了它的功能。 目錄 什麼是...
    人工智慧 發佈於2025-04-16
  • 亞馬遜Nova Today真實體驗與評測 - Analytics Vidhya
    亞馬遜Nova Today真實體驗與評測 - Analytics Vidhya
    亚马逊最近的回复:Invent 2024活动展示了Nova,这是其最先进的基础模型套件,旨在彻底改变AI和内容创建。本文深入研究了Nova的架构,通过动手实例探索其功能,并检查基准结果。 我们将介绍功能,评论,基准和对AI应用程序的影响。 [2 此探索将涵盖Amazon Nova的功能,详细的评论...
    人工智慧 發佈於2025-04-16
  • ChatGPT定時任務功能的5種使用方法
    ChatGPT定時任務功能的5種使用方法
    Chatgpt的新計劃任務:使用AI 自動化您的一天 Chatgpt最近引入了一個改變遊戲規則的功能:計劃的任務。 這允許用戶自動化重複提示,即使在離線時,也可以在預定時間接收通知或響應。想像一下每天策劃的新聞通訊,自動化工作時間表或及時的習慣提醒 - 所有這些都是由Chatgpt自動處理的。...
    人工智慧 發佈於2025-04-16
  • 三款AI聊機器人對同一提示的反應,哪個最佳?
    三款AI聊機器人對同一提示的反應,哪個最佳?
    這是我發現的。 在精心策劃且詳細的提示中扮演著質量良好的提示,在輸出的質量中扮演任何cathbot生產的質量。與所有工具一樣,輸出僅與使用該工具的人的技能一樣好。 AI聊天機器人沒有什麼不同。 有了這種理解,我指示每個模型創建一個針對個人理財的基本指南。這種方法使我能夠評估多個相互聯繫的主題(特...
    人工智慧 發佈於2025-04-15
  • ChatGPT足矣,無需專用AI聊機
    ChatGPT足矣,無需專用AI聊機
    在一個新的AI聊天機器人每天啟動的世界中,決定哪一個是正確的“一個”。但是,以我的經驗,chatgpt處理了我所丟下的幾乎所有內容,而無需在平台之間切換,只需稍有及時的工程。 在許多實踐應用程序中可能會讓您感到驚訝。它的範圍令人印象深刻,使用戶可以生成代碼段,草稿求職信,甚至翻譯語言。這種多功能性...
    人工智慧 發佈於2025-04-14
  • 印度AI時刻:與中美在生成AI領域競賽
    印度AI時刻:與中美在生成AI領域競賽
    印度的AI抱負:2025 Update 與中國和美國在生成AI上進行了大量投資,印度正在加快自己的Genai計劃。 不可否認的是,迫切需要迎合印度各種語言和文化景觀的土著大語模型(LLM)和AI工具。 本文探討了印度新興的Genai生態系統,重點介紹了2025年工會預算,公司參與,技能開發計劃...
    人工智慧 發佈於2025-04-13
  • 使用Airflow和Docker自動化CSV到PostgreSQL的導入
    使用Airflow和Docker自動化CSV到PostgreSQL的導入
    本教程演示了使用Apache氣流,Docker和PostgreSQL構建強大的數據管道,以使數據傳輸從CSV文件自動化到數據庫。 我們將介紹有效工作流程管理的核心氣流概念,例如DAG,任務和操作員。 該項目展示了創建可靠的數據管道,該數據管線讀取CSV數據並將其寫入PostgreSQL數據庫。我們...
    人工智慧 發佈於2025-04-12

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3