”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 人工智能 > 如何在本地下载并安装 Llama 2

如何在本地下载并安装 Llama 2

发布于2024-08-21
浏览:568

考虑到这一点,我们创建了一个分步指南,介绍如何使用 Text-Generation-WebUI 在计算机上本地加载量化的 Llama 2 LLM。

为什么在本地安装 Llama 2

人们选择直接运行 Llama 2 的原因有很多。有些是出于隐私考虑,有些是为了定制,还有一些是为了离线功能。如果您正在为您的项目研究、微调或集成 Llama 2,那么通过 API 访问 Llama 2 可能不适合您。在PC上本地运行LLM的目的是减少对第三方AI工具的依赖,并随时随地使用AI,而不必担心将潜在的敏感数据泄露给公司和其他组织。

话虽如此,让我们从本地安装 Llama 2 的分步指南开始。

第 1 步:安装 Visual Studio 2019 构建工具

为了简化操作,我们将使用 Text-Generation-WebUI 的一键安装程序(用于通过 GUI 加载 Llama 2 的程序) 。但是,要使此安装程序正常工作,您需要下载 Visual Studio 2019 构建工具并安装必要的资源。

下载:Visual Studio 2019(免费)

继续下载该软件的社区版。 现在安装 Visual Studio 2019,然后打开该软件。打开后,勾选“使用 C 进行桌面开发”复选框并点击安装。How to Download and Install Llama 2 Locally

现在您已经安装了使用 C 进行的桌面开发,是时候下载 Text-Generation-WebUI 一键安装程序了。

步骤 2:安装 Text-Generation-WebUI

Text-Generation-WebUI 一键安装程序是一个脚本,它会自动创建所需的文件夹并设置 Conda 环境和所有必要的要求运行人工智能模型。

要安装脚本,请单击“代码”>“下载 ZIP”来下载一键式安装程序。

下载:Text-Generation-WebUI 安装程序(免费)

下载后,将 ZIP 文件解压到您的首选位置,然后打开解压的文件夹。 在该文件夹中,向下滚动并查找适合您的操作系统的启动程序。通过双击相应的脚本来运行程序。如果您使用的是 Windows,则对于 MacOS 选择 start_windows 批处理文件,对于 Linux 选择 start_macos shell script,对于 Linux 选择 start_linux shell script。How to Download and Install Llama 2 Locally

您的防病毒软件可能会发出警报;这很好。该提示只是运行批处理文件或脚本的防病毒误报。仍然单击“运行”。 终端将打开并开始设置。早些时候,安装程序将暂停并询问您正在使用什么 GPU。选择计算机上安装的适当类型的 GPU,然后按 Enter 键。对于没有专用显卡的,选择无(我想在CPU模式下运行模型)。请记住,与使用专用 GPU 运行模型相比,在 CPU 模式下运行要慢得多。How to Download and Install Llama 2 Locally 设置完成后,您现在可以在本地启动 Text-Generation-WebUI。您可以通过打开您喜欢的 Web 浏览器并在 URL 上输入提供的 IP 地址来执行此操作。How to Download and Install Llama 2 Locally WebUI 现已可供使用。How to Download and Install Llama 2 Locally

但是,该程序只是一个模型加载器。让我们下载 Llama 2 以启动模型加载器。

步骤 3:下载 Llama 2 模型

在决定​​您需要哪一个版本的 Llama 2 时,需要考虑很多事情。其中包括参数、量化、硬件优化、大小和用法。所有这些信息都可以在模型名称中找到。

参数:用于训练模型的参数数量。更大的参数可以产生更强大的模型,但会牺牲性能。用法:可以是标准的,也可以是聊天的。聊天模型经过优化可用作 ChatGPT 等聊天机器人,而标准模型是默认模型。硬件优化:指什么硬件最能运行模型。 GPTQ 意味着模型针对在专用 GPU 上运行进行了优化,而 GGML 则针对在 CPU 上运行进行了优化。量化:表示模型中权重和激活的精度。对于推理,q4 的精度是最佳的。尺寸:指具体型号的尺寸。

请注意,某些模型可能排列不同,甚至可能不显示相同类型的信息。然而,这种类型的命名约定在 HuggingFace 模型库中相当常见,因此仍然值得理解。

How to Download and Install Llama 2 Locally

在此示例中,该模型可以被识别为中型 Llama 2 模型,该模型使用专用 CPU 针对聊天推理进行了优化,并使用 130 亿个参数进行训练。

对于在专用 GPU 上运行的,选择 GPTQ 模型,而对于使用 CPU 的,选择 GGML。如果您想像使用 ChatGPT 一样与模型聊天,请选择聊天,但如果您想试验模型的全部功能,请使用标准模型。至于参数,要知道使用更大的模型会以牺牲性能为代价提供更好的结果。我个人建议您从 7B 型号开始。至于量化,请使用 q4,因为它仅用于推理。

下载:GGML(免费)

下载:GPTQ(免费)

既然您知道您需要什么版本的 Llama 2,请继续下载您想要的模型。

就我而言,由于我在超级本上运行此程序,因此我将使用针对聊天进行微调的 GGML 模型,llama-2-7b-chat-ggmlv3.q4_K_S.bin。

How to Download and Install Llama 2 Locally

下载完成后,将模型放置在text- Generation-webui-main > models中。

How to Download and Install Llama 2 Locally

现在您已下载模型并将其放置在模型文件夹中,是时候配置模型加载器了。

步骤 4:配置 Text-Generation-WebUI

现在,让我们开始配置阶段。

再次通过运行 start_(您的操作系统)文件打开 Text-Generation-WebUI(请参阅上面的步骤)。 在 GUI 上方的选项卡上,单击模型。单击模型下拉菜单中的刷新按钮并选择您的模型。 现在单击模型加载器的下拉菜单,并为使用 GTPQ 模型的用户选择 AutoGPTQ,为使用 GGML 模型的用户选择 ctransformers。最后,单击 Load 加载您的模型。How to Download and Install Llama 2 Locally 要使用模型,请打开 Chat 选项卡并开始测试模型。How to Download and Install Llama 2 Locally

恭喜您,您已在本地计算机上成功加载 Llama2!

尝试其他 LLMs

既然您知道如何使用 Text-Generation-WebUI 直接在计算机上运行 Llama 2,那么除了 Llama 之外,您还应该能够运行其他 Llama 。只需记住模型的命名约定,并且只有模型的量化版本(通常是 q4 精度)才能加载到常规 PC 上。 HuggingFace 上提供了许多量化的法学硕士。如果您想探索其他模型,请在 HuggingFace 的模型库中搜索 TheBloke,您应该会找到许多可用的模型。

版本声明 本文转载于:https://www.makeuseof.com/how-to-download-and-install-llama-2-locally/如有侵犯,请联系[email protected]删除
最新教程 更多>
  • AI Agents是什么?- 解析与应用指南
    AI Agents是什么?- 解析与应用指南
    Artificial Intelligence (AI) is rapidly evolving, and 2025 is shaping up to be the year of AI agents. But what are AI agents...
    人工智能 发布于2025-05-01
  • Python中使用OpenCV和Roboflow进行性别检测 - 分析Vidhya
    Python中使用OpenCV和Roboflow进行性别检测 - 分析Vidhya
    介绍 从面部图像中检测是计算机视觉的众多迷人应用之一。在此项目中,我们将OPENCV结合起来,以面对位置和用于性别分类的Roboflow API,制作一种识别面部的设备,检查它们并预测其性别。我们将利用Python(尤其是在Google Colab中)输入和运行此代码。该直接提供了易于遵循的代码的演...
    人工智能 发布于2025-04-29
  • 机器先行思考:战略AI崛起
    机器先行思考:战略AI崛起
    STRATEGIC AI Prologue 11. May 1997, New York City. It was a beautiful spring day in New York City. The skies were clear, and temperatures were climbin...
    人工智能 发布于2025-04-29
  • LLM必备的8个免费与付费API推荐
    LLM必备的8个免费与付费API推荐
    利用LLMS的力量:大型语言模型的API指南 在当今的动态业务格局中,API(应用程序编程接口)正在革新我们如何整合和利用AI功能。 它们充当必不可少的桥梁,无缝将大型语言模型(LLM)连接到不同的软件生态系统。 这种有效的数据交换和功能共享允许应用程序充分利用开放和封闭源LLM的功率。本文探讨...
    人工智能 发布于2025-04-21
  • 使用指南:Falcon 3-7B Instruct模型
    使用指南:Falcon 3-7B Instruct模型
    中的革命性飞跃 关键功能和改进 可扩展的模型大小:有各种尺寸(1b,3b,7b和10b parameters),为各种应用程序提供了灵活性。 高级文本生成:文本生成中的异常功能,包括细微的上下文理解和特定于任务的应用程序。 本文是数据科学博客马拉松的一部分。 目录 架构设计 性能基准 [2 [2 使...
    人工智能 发布于2025-04-20
  • DeepSeek-V3对比GPT-4o与Llama 3.3 70B:最强AI模型揭秘
    DeepSeek-V3对比GPT-4o与Llama 3.3 70B:最强AI模型揭秘
    The evolution of AI language models has set new standards, especially in the coding and programming landscape. Leading the c...
    人工智能 发布于2025-04-18
  • 盘点Top 5 AI智能预算工具
    盘点Top 5 AI智能预算工具
    通过AI解锁财务自由:印度的最高预算应用程序 您是否厌倦了不断想知道您的钱去了哪里? 账单似乎会吞噬您的收入吗? 人工智能(AI)提供了强大的解决方案。 AI预算工具提供实时财务见解,个性化建议和动态计划,使资金管理更简单,更准确。 有些甚至使用生成AI提供基于聊天的财务分析!本文探讨了印度可...
    人工智能 发布于2025-04-17
  • Excel SUMPRODUCT函数详解 - 数据分析学院
    Excel SUMPRODUCT函数详解 - 数据分析学院
    Excel的SumProduct函数:数据分析PowerHouse 解锁Excel的Sumproduct函数的功能,以用于简化数据分析。这种多功能功能毫不费力地结合了求和功能,扩展到跨相应范围或数组的加法,减法和分裂。 无论您是分析趋势还是解决复杂的计算,Sumproduct都会将数字转换为可...
    人工智能 发布于2025-04-16
  • 深度研究全面开放,ChatGPT Plus用户福利
    深度研究全面开放,ChatGPT Plus用户福利
    Openai的深入研究:改变游戏的AI研究 Openai已为所有Chatgpt加上订户释放了深入的研究,并承诺在研究效率方面具有重大提高。 在测试了双子座,Grok 3和困惑等竞争对手的类似功能之后,我可以自信地将Openai的深入研究宣布为出色的选择。此博客深入研究了它的功能。 目录 什么是...
    人工智能 发布于2025-04-16
  • 亚马逊Nova Today真实体验与评测 - Analytics Vidhya
    亚马逊Nova Today真实体验与评测 - Analytics Vidhya
    亚马逊最近的回复:Invent 2024活动展示了Nova,这是其最先进的基础模型套件,旨在彻底改变AI和内容创建。本文深入研究了Nova的架构,通过动手实例探索其功能,并检查基准结果。 我们将介绍功能,评论,基准和对AI应用程序的影响。 [2 此探索将涵盖Amazon Nova的功能,详细的评论...
    人工智能 发布于2025-04-16
  • ChatGPT定时任务功能的5种使用方法
    ChatGPT定时任务功能的5种使用方法
    Chatgpt的新计划任务:使用AI 自动化您的一天 Chatgpt最近引入了一个改变游戏规则的功能:计划的任务。 这允许用户自动化重复提示,即使在离线时,也可以在预定时间接收通知或响应。想象一下每天策划的新闻通讯,自动化工作时间表或及时的习惯提醒 - 所有这些都是由Chatgpt自动处理的。...
    人工智能 发布于2025-04-16
  • 三款AI聊机器人对同一提示的反应,哪个最佳?
    三款AI聊机器人对同一提示的反应,哪个最佳?
    这是我发现的。在精心策划且详细的提示中扮演着质量良好的提示,在输出的质量中扮演任何cathbot生产的质量。与所有工具一样,输出仅与使用该工具的人的技能一样好。 AI聊天机器人没有什么不同。 有了这种理解,我指示每个模型创建一个针对个人理财的基本指南。这种方法使我能够评估多个相互联系的主题(特别是...
    人工智能 发布于2025-04-15
  • ChatGPT足矣,无需专用AI聊机
    ChatGPT足矣,无需专用AI聊机
    在一个新的AI聊天机器人每天启动的世界中,决定哪一个是正确的“一个”。但是,以我的经验,chatgpt处理了我所丢下的几乎所有内容,而无需在平台之间切换,只需稍有及时的工程。 在许多实践应用程序中可能会让您感到惊讶。它的范围令人印象深刻,使用户可以生成代码段,草稿求职信,甚至翻译语言。这种多功能性...
    人工智能 发布于2025-04-14
  • 印度AI时刻:与中美在生成AI领域竞赛
    印度AI时刻:与中美在生成AI领域竞赛
    印度的AI抱负:2025 Update 与中国和美国在生成AI上进行了大量投资,印度正在加快自己的Genai计划。 不可否认的是,迫切需要迎合印度各种语言和文化景观的土著大语模型(LLM)和AI工具。 本文探讨了印度新兴的Genai生态系统,重点介绍了2025年工会预算,公司参与,技能开发计划...
    人工智能 发布于2025-04-13
  • 使用Airflow和Docker自动化CSV到PostgreSQL的导入
    使用Airflow和Docker自动化CSV到PostgreSQL的导入
    本教程演示了使用Apache气流,Docker和PostgreSQL构建强大的数据管道,以使数据传输从CSV文件自动化到数据库。 我们将介绍有效工作流程管理的核心气流概念,例如DAG,任务和操作员。 该项目展示了创建可靠的数据管道,该数据管线读取CSV数据并将其写入PostgreSQL数据库。我们...
    人工智能 发布于2025-04-12

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3