」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 人工智慧 > 為什麼 Gemini 1.5 的 100 萬代幣上下文會改變遊戲規則

為什麼 Gemini 1.5 的 100 萬代幣上下文會改變遊戲規則

發佈於2024-08-21
瀏覽:744

Google Gemini 1.5 現在配備了一個巨大的 100 萬個代幣上下文窗口,使其在 ChatGPT、Claude 和其他 AI 聊天機器人中的直接競爭對手相形見絀。

這聽起來像是一次大規模升級,可以讓雙子座與眾不同。要全面了解它的範圍有點困難,但雙子座巨大的上下文視窗可能會改變遊戲規則。

什麼是上下文視窗?

在回答您的查詢時,例如解釋概念或總結文本,AI 模型在產生回應時可以考慮的資料量是有限的。它可以考慮的文字大小的限制稱為上下文視窗。

這是另一種看待它的方式。假設您去雜貨店購買雜貨,但沒有雜貨清單。您在購物時記住的雜貨數量的限制是您的上下文視窗。您記住的雜貨越多,不打亂您的購物計劃的機會就越大。同樣,人工智慧模型的上下文視窗越大,模型記住為您提供最佳結果所需的一切的機會就越大。

在撰寫本文時,Anthropic 的 Claude 2.1 的 200k 上下文視窗是任何通用 AI 模型中最大的上下文視窗。其次是具有 128k 上下文視窗的 GPT-4 Turbo。 Google Gemini 1.5 帶來了 100 萬個上下文窗口,是市場上任何產品的四倍。這就引出了一個大問題:一百萬個令牌上下文視窗有什麼大不了的?

為什麼Gemini 1.5 的上下文視窗很重要

Why Gemini 1.5\'s One Million Token Context Is a Game Changer

從更清晰的角度來看,Claude AI 的200k 上下文視窗意味著它可以消化一本大約15 萬字的書,並提供答案。那是巨大的。但 Google 的 Gemini 1.5 一次就能消化 70 萬個單字!

當您將大文本塊輸入 ChatGPT 或 Gemini 等 AI 聊天機器人時,它會嘗試消化盡可能多的文本,但它能消化多少取決於其上下文視窗。因此,如果您的對話在只能處理 28k 字的模型上進行了 100k 字,然後開始提出要求其完全了解整個 100k 字對話的問題,那麼您將使其失敗。

想像一下,一小時長的電影只看了 20 分鐘,卻被要求解釋整部電影。你的結果會有多好?你要嘛拒絕回答,要嘛乾脆編造一些東西,這正是人工智慧聊天機器人會做的事情,導致人工智慧幻覺。

現在,如果您認為您從未需要向聊天機器人輸入 10 萬個單詞,那麼這並不是全部考慮因素。上下文視窗超越了您在單一提示中向 AI 模型提供的文字。人工智慧模型會考慮您在聊天會話期間進行的整個對話,以確保他們的回應盡可能相關。

因此,即使您沒有給它一本 100k 單字的書,您的來回對話和它提供的回應都會添加到上下文視窗計算中。想知道為什麼 ChatGPT 或 Google 的 Gemini 總是忘記你之前在對話中告訴它的事情?它可能耗盡了上下文視窗空間並開始忘記東西。

較大的上下文視窗對於需要深入理解上下文的任務尤其重要,例如總結長文章、回答複雜問題或在生成的文本中保持連貫的敘述。想要寫一本 5 萬字且敘事自始至終一致的小說嗎?想要一個可以「觀看」一小時影片檔案並回答問題的模型嗎?您需要更大的上下文視窗!

簡而言之,Gemini 1.5 更大的上下文視窗可能會顯著提高其 AI 模型的效能,減少幻覺,並顯著提高準確性和更好地遵循指令的能力。

Gemini 1.5能否不負眾望?

Why Gemini 1.5\'s One Million Token Context Is a Game Changer

如果一切按計劃進行,Gemini 1.5 可能會超越市場上最好的人工智慧模型。然而,考慮到谷歌在建立穩定的人工智慧模型方面多次失敗,謹慎行事是很重要的。單獨增加模型的上下文視窗並不會自動使模型變得更好。

自發布以來,我已經使用Claude 2.1 的200k 上下文窗口幾個月了,有一點我很清楚——更大的上下文窗口確實可以提高上下文敏感性,但是核心模型性能的問題可能會導致更大的背景本身就是一個問題。

Google Gemini 1.5 會為我們帶來遊戲規則改變者嗎?目前,社群媒體上充斥著搶先體驗用戶對 Gemini 1.5 的熱烈評論。然而,大多數 5 星級評論都源於倉促或簡化的用例。 Google 的 Gemini 1.5 技術報告 [PDF] 是檢視 Gemini 1.5 在野外表現的好地方。該報告顯示,即使在「受控測試」期間,該模型也無法在其上下文視窗的大小範圍內很好地檢索文件的所有微小細節。

100萬個token上下文窗口確實是一項令人印象深刻的技術壯舉,但是如果不能可靠地檢索文檔的詳細信息,那麼更大的上下文窗口沒有什麼實用價值,甚至可能成為下降的原因準確性和幻覺。

版本聲明 本文轉載於:https://www.makeuseof.com/why-gemini-context-window-is-a-game-changer/如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • AI Agents是什麼? - 解析與應用指南
    AI Agents是什麼? - 解析與應用指南
    Artificial Intelligence (AI) is rapidly evolving, and 2025 is shaping up to be the year of AI agents. But what are AI agents...
    人工智慧 發佈於2025-05-01
  • Python中使用OpenCV和Roboflow進行性別檢測 - 分析Vidhya
    Python中使用OpenCV和Roboflow進行性別檢測 - 分析Vidhya
    介绍 从面部图像中检测是计算机视觉的众多迷人应用之一。在此项目中,我们将OPENCV结合起来,以面对位置和用于性别分类的Roboflow API,制作一种识别面部的设备,检查它们并预测其性别。我们将利用Python(尤其是在Google Colab中)输入和运行此代码。该直接提供了易于遵循的代码的演...
    人工智慧 發佈於2025-04-29
  • 機器先行思考:戰略AI崛起
    機器先行思考:戰略AI崛起
    STRATEGIC AI Prologue 11. May 1997, New York City. It was a beautiful spring day in New York City. The skies were clear, and temperatures were climbin...
    人工智慧 發佈於2025-04-29
  • LLM必備的8個免費與付費API推薦
    LLM必備的8個免費與付費API推薦
    利用LLMS的力量:大型語言模型的API指南 在當今的動態業務格局中,API(應用程序編程接口)正在革新我們如何整合和利用AI功能。 它們充當必不可少的橋樑,無縫將大型語言模型(LLM)連接到不同的軟件生態系統。 這種有效的數據交換和功能共享允許應用程序充分利用開放和封閉源LLM的功率。本文探討...
    人工智慧 發佈於2025-04-21
  • 使用指南:Falcon 3-7B Instruct模型
    使用指南:Falcon 3-7B Instruct模型
    中的革命性飛躍 關鍵功能和改進 可擴展的模型大小:有各種尺寸(1b,3b,7b和10b parameters),為各種應用程序提供了靈活性。 高級文本生成:文本生成中的異常功能,包括細微的上下文理解和特定於任務的應用程序。 本文是數據科學博客馬拉鬆的一部分。 目錄 架構設計 性能基準 [2 [2 使...
    人工智慧 發佈於2025-04-20
  • DeepSeek-V3對比GPT-4o與Llama 3.3 70B:最強AI模型揭秘
    DeepSeek-V3對比GPT-4o與Llama 3.3 70B:最強AI模型揭秘
    The evolution of AI language models has set new standards, especially in the coding and programming landscape. Leading the c...
    人工智慧 發佈於2025-04-18
  • 盤點Top 5 AI智能預算工具
    盤點Top 5 AI智能預算工具
    通過AI解鎖財務自由:印度的最高預算應用程序 您是否厭倦了不斷想知道您的錢去了哪裡? 賬單似乎會吞噬您的收入嗎? 人工智能(AI)提供了強大的解決方案。 AI預算工具提供實時財務見解,個性化建議和動態計劃,使資金管理更簡單,更準確。 有些甚至使用生成AI提供基於聊天的財務分析!本文探討了印度可...
    人工智慧 發佈於2025-04-17
  • Excel SUMPRODUCT函數詳解 - 數據分析學院
    Excel SUMPRODUCT函數詳解 - 數據分析學院
    Excel的SumProduct函數:數據分析PowerHouse 解鎖Excel的Sumproduct函數的功能,以用於簡化數據分析。這種多功能功能毫不費力地結合了求和功能,擴展到跨相應範圍或數組的加法,減法和分裂。 無論您是分析趨勢還是解決複雜的計算,Sumproduct都會將數字轉換為可...
    人工智慧 發佈於2025-04-16
  • 深度研究全面開放,ChatGPT Plus用戶福利
    深度研究全面開放,ChatGPT Plus用戶福利
    Openai的深入研究:改變遊戲的AI研究 Openai已為所有Chatgpt加上訂戶釋放了深入的研究,並承諾在研究效率方面具有重大提高。 在測試了雙子座,Grok 3和困惑等競爭對手的類似功能之後,我可以自信地將Openai的深入研究宣佈為出色的選擇。此博客深入研究了它的功能。 目錄 什麼是...
    人工智慧 發佈於2025-04-16
  • 亞馬遜Nova Today真實體驗與評測 - Analytics Vidhya
    亞馬遜Nova Today真實體驗與評測 - Analytics Vidhya
    亚马逊最近的回复:Invent 2024活动展示了Nova,这是其最先进的基础模型套件,旨在彻底改变AI和内容创建。本文深入研究了Nova的架构,通过动手实例探索其功能,并检查基准结果。 我们将介绍功能,评论,基准和对AI应用程序的影响。 [2 此探索将涵盖Amazon Nova的功能,详细的评论...
    人工智慧 發佈於2025-04-16
  • ChatGPT定時任務功能的5種使用方法
    ChatGPT定時任務功能的5種使用方法
    Chatgpt的新計劃任務:使用AI 自動化您的一天 Chatgpt最近引入了一個改變遊戲規則的功能:計劃的任務。 這允許用戶自動化重複提示,即使在離線時,也可以在預定時間接收通知或響應。想像一下每天策劃的新聞通訊,自動化工作時間表或及時的習慣提醒 - 所有這些都是由Chatgpt自動處理的。...
    人工智慧 發佈於2025-04-16
  • 三款AI聊機器人對同一提示的反應,哪個最佳?
    三款AI聊機器人對同一提示的反應,哪個最佳?
    這是我發現的。 在精心策劃且詳細的提示中扮演著質量良好的提示,在輸出的質量中扮演任何cathbot生產的質量。與所有工具一樣,輸出僅與使用該工具的人的技能一樣好。 AI聊天機器人沒有什麼不同。 有了這種理解,我指示每個模型創建一個針對個人理財的基本指南。這種方法使我能夠評估多個相互聯繫的主題(特...
    人工智慧 發佈於2025-04-15
  • ChatGPT足矣,無需專用AI聊機
    ChatGPT足矣,無需專用AI聊機
    在一個新的AI聊天機器人每天啟動的世界中,決定哪一個是正確的“一個”。但是,以我的經驗,chatgpt處理了我所丟下的幾乎所有內容,而無需在平台之間切換,只需稍有及時的工程。 在許多實踐應用程序中可能會讓您感到驚訝。它的範圍令人印象深刻,使用戶可以生成代碼段,草稿求職信,甚至翻譯語言。這種多功能性...
    人工智慧 發佈於2025-04-14
  • 印度AI時刻:與中美在生成AI領域競賽
    印度AI時刻:與中美在生成AI領域競賽
    印度的AI抱負:2025 Update 與中國和美國在生成AI上進行了大量投資,印度正在加快自己的Genai計劃。 不可否認的是,迫切需要迎合印度各種語言和文化景觀的土著大語模型(LLM)和AI工具。 本文探討了印度新興的Genai生態系統,重點介紹了2025年工會預算,公司參與,技能開發計劃...
    人工智慧 發佈於2025-04-13
  • 使用Airflow和Docker自動化CSV到PostgreSQL的導入
    使用Airflow和Docker自動化CSV到PostgreSQL的導入
    本教程演示了使用Apache氣流,Docker和PostgreSQL構建強大的數據管道,以使數據傳輸從CSV文件自動化到數據庫。 我們將介紹有效工作流程管理的核心氣流概念,例如DAG,任務和操作員。 該項目展示了創建可靠的數據管道,該數據管線讀取CSV數據並將其寫入PostgreSQL數據庫。我們...
    人工智慧 發佈於2025-04-12

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3