”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 人工智能 > 我们尝试了 Mistral AI 的 Le Chat AI 聊天机器人,以下是它与 ChatGPT 的比较

我们尝试了 Mistral AI 的 Le Chat AI 聊天机器人,以下是它与 ChatGPT 的比较

发布于2024-08-22
浏览:106

Mistral 的 Le Chat 在人工智能聊天机器人社区中越来越受欢迎,一些观察家将其标记为 ChatGPT 的潜在竞争对手。

但是这个刚刚起步的人工智能聊天机器人真的值得这个称号吗? Mistral 的 Le Chat 比 ChatGPT 更好吗?

Mistral AI 的 Le Chat 是什么?

Le Chat 是由法国人工智能初创公司 Mistral AI 开发的对话式人工智能聊天机器人。它由 Mistral 拥有的多种大型语言模型提供支持,包括 Mistral Large、Mistral Small 和 Mistral Next,您在与 AI 聊天机器人交互时可以选择使用所有这些模型。尽管它是人工智能聊天机器人领域的一个相对较新的进入者,但由于其人工智能模型的性能,尽管与 Gemini 和 GPT-4 等行业重量级产品相比尺寸较小,但它仍获得了很高的评价。

要理解这意味着什么,想象一下您正在玩积木。您拥有的块越多,您可以构建的结构就越复杂和详细,对吗?人工智能语言模型有点类似。它们有大小,通常以参数计数表示。因此,您可能在 AI 模型中听说过“7B 参数”或“70B 参数”等术语。参数计数就像模型必须理解和生成响应的构建块的数量。因此,如果语言模型具有更多参数,它就可以理解并生成更复杂、更好的响应。

现在,GPT-4 估计有 1.76 万亿个参数,而 Mistral AI 估计有 7 到 560 亿个参数。看到尺寸差异了吗?因此,Mistral AI 能够提供不错的性能是其大肆宣传的原因之一。

尽管 Le Chat 不具备 ChatGPT 的宣传水平,也没有 Gemini 等公司的品牌资产,但每当讨论潜在的 ChatGPT 竞赛时,它就会进入话题。但它值得在桌面上占有一席之地吗?

我一直在想同样的问题,为了找到答案,我广泛测试了 Le Chat,看看它与 ChatGPT 相比如何。

Le Chat 与 ChatGPT:创造力

创造力是判断对话式 AI 聊天机器人性能的最重要指标之一。请记住,人工智能聊天机器人的目的是大规模复制或模仿人类的对话能力和创造力。这使得创造力对于任何人工智能聊天机器人来说都是一个非常重要的优势。全世界已经对 ChatGPT 进行了一年多的试验,其创造能力是不可否认的。但 Le Chat 相比如何呢?我们对这两个聊天机器人进行了一系列创造力测试。

我首先问两个聊天机器人,“你会如何向艺术家描述自己?”测试他们使用创造性和富有想象力的词语来概念化自己的能力。

以下是 ChatGPT 向艺术家描述自己的方式:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

Le Chat 也将这样描述自己:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

两种回答都适合他们自己独特的方式。 ChatGPT更注重用生动的图像和隐喻来描述自己,展现创意天赋。另一方面,Le Chat 的回应信息非常丰富,并且重点描述了其作为人工智能聊天机器人的本质。有些人可能会说它缺乏 ChatGPT 的回应所展现的创意天赋和艺术风格。然而,我会大胆地说,相对于 ChatGPT 的抽象描述,我更喜欢 Le Chat 更容易想象的回应。

然后我要求 ChatGPT 和 Le Chat 写一首关于通过种植黄瓜致富的说唱歌曲——这是一个棘手的请求,我们用它来测试其他聊天机器人的创造力。您在网上能找到多少首关于黄瓜的说唱歌曲?

这是 ChatGPT 的回复:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

这是 Le Chat 的回复:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

这可能是一个主观问题,但 ChatGPT 的回复似乎是更好的选择。 Le Chat 的歌词看起来很冗长,读起来不像说唱歌手会写出来的东西。为了测试这两个歌词如果被制作成音乐的话听起来如何,我们使用Suno AI音乐生成器从歌词生成音乐。三分之三的试验中,ChatGPT 的歌词听起来好多了。以下是两个人工智能聊天机器人的两个示例,您可以判断哪个聊天机器人做得更好。

从 ChatGPT 的歌词生成的样本

样本 1:

样本 2:

从 Mistral Le Chat 的歌词生成的样本

样本 1 :

示例 2:

我尝试了一些其他创造性任务,例如诗歌、文章写作以及使用 AI 聊天机器人起草棘手的工作电子邮件。尽管表现出了巨大的潜力,但 Le Chat 在所有情况下都明显被 ChatGPT 超越。需要指出的是,Le Chat 特别擅长的一个领域是撰写文章,尽管有一些棘手的提示风格。然而,就全面创造力而言,奖牌属于ChatGPT。

Le Chat 与 ChatGPT:编程技能

熟练的编码能力已成为主要 AI 聊天机器人的关键要求。编写像样的代码是一项基本技能,但要真正在精英中脱颖而出,人工智能聊天机器人必须展示其编写能够有效解决各种复杂问题的代码的能力。我们之前使用 ChatGPT 从头开始​​构建了一个完整的 Web 应用程序,这展示了其作为编程工具的卓越能力。但 Le Chat 编写代码的水平如何?

我要求两个聊天机器人使用 CSS、HTML 和 JavaScript 编写一个简单的待办事项列表应用程序。 ChatGPT 在产生良好结果方面没有遇到任何困难。我复制了生成的代码并在浏览器上预览它,这就是 ChatGPT 创建的内容:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

每次我们重复提示时,ChatGPT 都会使用不同的样式创建一个实用的待办事项列表应用程序。生成的代码在任何情况下都不会失败。

当我在 Le Chat 上尝试相同的提示时,它生成了看似可理解的代码,但当我们尝试在浏览器上运行它时,它不起作用。重复提示3次后,没有实例生成可以完成设定任务的代码。它未能完成最基本的编码任务之一——危险信号!

当然,我不会因为一次失败的测试而评判 Le Chat。接下来,我要求两个聊天机器人生成用于加密和解密文本的 JavaScript 和 PHP 代码。在第二次测试中,ChatGPT 和 Le Chat 都生成了可以执行设定任务的功能代码。然而,Le Chat 的版本看起来像是一个没有经验的入门级程序员会写的东西。另一方面,ChatGPT 的代码更完整,看起来像是由经验丰富的程序员编写的。

我又重复了一些涉及查找和修复错误的编程测试,ChatGPT 的表现始终优于 Le Chat。在某些情况下,Le Chat 甚至不知道自己应该做什么。 Le Chat 在某些领域很有可能达到 ChatGPT 的水平,但编码技能似乎不是其中之一。

Le Chat 与 ChatGPT:常识和逻辑推理

AI 聊天机器人的一个有趣的变化是它们能够轻松解决复杂的任务,但无法完成需要基本常识才能完成的简单任务。许多聊天机器人,无论是像 ChatGPT 这样的老牌聊天机器人,还是像 Le Chat 这样的新进入者,在解决需要人类常识和逻辑推理的任务时都遇到了困难。那么,Le Chat 和 ChatGPT 在这方面相比如何呢?

我问两个聊天机器人:“如果你有一个 3 升的瓶子和一个 5 升的瓶子。如何使用 3 升和 5 升的瓶子测量 4 升的水?”

ChatGPT 巧妙地解决了问题:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

Le Chat 尝试了相同的任务,并且能够解决问题,尽管使用了不同的方法。

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

两个聊天机器人在此测试中的表现相当。

接下来,我们向两个聊天机器人提出了一个棘手的问题:“如果一艘来自火星的宇宙飞船分成两部分,一部分坠入巴西附近的大西洋,另一部分坠入日本附近的太平洋,你会在哪里?埋葬幸存者吗?”

ChatGPT识破了骗局,做出了回应:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

Le Chat也识破了骗局,做出了回应:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

I尝试了更多的刁钻题,看来ChatGPT和Le Chat都非常擅长处理常识性和逻辑推理提示。然而,对于更复杂的逻辑问题,只有 ChatGPT 可以提供正确的答案。

虽然 Le Chat 作为潜在的“ChatGPT 杀手”引起了一些关注,但我们的测试表明,在真正与 AI 聊天机器人世界的重量级人物正面交锋之前,它还有很多工作要做。尽管 Le Chat 在常识推理等领域表现出了令人印象深刻的能力,但其创意输出和编码技能明显落后于 ChatGPT。这家法国人工智能新贵无疑展现出了希望,但炒作机器可能有点言过其实了。

与之前的许多雄心勃勃的竞争者一样,Le Chat 需要不断完善和训练,才能为大联盟做好准备。目前,像 ChatGPT 这样的人工智能聊天机器人显然仍然是人工智能聊天机器人世界无可争议的王者。但竞争者的领域只会变得越来越拥挤,因此领导者不能满足于现状。

版本声明 本文转载于:https://www.makeuseof.com/mistral-ai-le-chat-vs-chatgpt/如有侵犯,请联系[email protected]删除
最新教程 更多>
  • AI Agents是什么?- 解析与应用指南
    AI Agents是什么?- 解析与应用指南
    Artificial Intelligence (AI) is rapidly evolving, and 2025 is shaping up to be the year of AI agents. But what are AI agents...
    人工智能 发布于2025-05-01
  • Python中使用OpenCV和Roboflow进行性别检测 - 分析Vidhya
    Python中使用OpenCV和Roboflow进行性别检测 - 分析Vidhya
    介绍 从面部图像中检测是计算机视觉的众多迷人应用之一。在此项目中,我们将OPENCV结合起来,以面对位置和用于性别分类的Roboflow API,制作一种识别面部的设备,检查它们并预测其性别。我们将利用Python(尤其是在Google Colab中)输入和运行此代码。该直接提供了易于遵循的代码的演...
    人工智能 发布于2025-04-29
  • 机器先行思考:战略AI崛起
    机器先行思考:战略AI崛起
    STRATEGIC AI Prologue 11. May 1997, New York City. It was a beautiful spring day in New York City. The skies were clear, and temperatures were climbin...
    人工智能 发布于2025-04-29
  • LLM必备的8个免费与付费API推荐
    LLM必备的8个免费与付费API推荐
    利用LLMS的力量:大型语言模型的API指南 在当今的动态业务格局中,API(应用程序编程接口)正在革新我们如何整合和利用AI功能。 它们充当必不可少的桥梁,无缝将大型语言模型(LLM)连接到不同的软件生态系统。 这种有效的数据交换和功能共享允许应用程序充分利用开放和封闭源LLM的功率。本文探讨...
    人工智能 发布于2025-04-21
  • 使用指南:Falcon 3-7B Instruct模型
    使用指南:Falcon 3-7B Instruct模型
    中的革命性飞跃 关键功能和改进 可扩展的模型大小:有各种尺寸(1b,3b,7b和10b parameters),为各种应用程序提供了灵活性。 高级文本生成:文本生成中的异常功能,包括细微的上下文理解和特定于任务的应用程序。 本文是数据科学博客马拉松的一部分。 目录 架构设计 性能基准 [2 [2 使...
    人工智能 发布于2025-04-20
  • DeepSeek-V3对比GPT-4o与Llama 3.3 70B:最强AI模型揭秘
    DeepSeek-V3对比GPT-4o与Llama 3.3 70B:最强AI模型揭秘
    The evolution of AI language models has set new standards, especially in the coding and programming landscape. Leading the c...
    人工智能 发布于2025-04-18
  • 盘点Top 5 AI智能预算工具
    盘点Top 5 AI智能预算工具
    通过AI解锁财务自由:印度的最高预算应用程序 您是否厌倦了不断想知道您的钱去了哪里? 账单似乎会吞噬您的收入吗? 人工智能(AI)提供了强大的解决方案。 AI预算工具提供实时财务见解,个性化建议和动态计划,使资金管理更简单,更准确。 有些甚至使用生成AI提供基于聊天的财务分析!本文探讨了印度可...
    人工智能 发布于2025-04-17
  • Excel SUMPRODUCT函数详解 - 数据分析学院
    Excel SUMPRODUCT函数详解 - 数据分析学院
    Excel的SumProduct函数:数据分析PowerHouse 解锁Excel的Sumproduct函数的功能,以用于简化数据分析。这种多功能功能毫不费力地结合了求和功能,扩展到跨相应范围或数组的加法,减法和分裂。 无论您是分析趋势还是解决复杂的计算,Sumproduct都会将数字转换为可...
    人工智能 发布于2025-04-16
  • 深度研究全面开放,ChatGPT Plus用户福利
    深度研究全面开放,ChatGPT Plus用户福利
    Openai的深入研究:改变游戏的AI研究 Openai已为所有Chatgpt加上订户释放了深入的研究,并承诺在研究效率方面具有重大提高。 在测试了双子座,Grok 3和困惑等竞争对手的类似功能之后,我可以自信地将Openai的深入研究宣布为出色的选择。此博客深入研究了它的功能。 目录 什么是...
    人工智能 发布于2025-04-16
  • 亚马逊Nova Today真实体验与评测 - Analytics Vidhya
    亚马逊Nova Today真实体验与评测 - Analytics Vidhya
    亚马逊最近的回复:Invent 2024活动展示了Nova,这是其最先进的基础模型套件,旨在彻底改变AI和内容创建。本文深入研究了Nova的架构,通过动手实例探索其功能,并检查基准结果。 我们将介绍功能,评论,基准和对AI应用程序的影响。 [2 此探索将涵盖Amazon Nova的功能,详细的评论...
    人工智能 发布于2025-04-16
  • ChatGPT定时任务功能的5种使用方法
    ChatGPT定时任务功能的5种使用方法
    Chatgpt的新计划任务:使用AI 自动化您的一天 Chatgpt最近引入了一个改变游戏规则的功能:计划的任务。 这允许用户自动化重复提示,即使在离线时,也可以在预定时间接收通知或响应。想象一下每天策划的新闻通讯,自动化工作时间表或及时的习惯提醒 - 所有这些都是由Chatgpt自动处理的。...
    人工智能 发布于2025-04-16
  • 三款AI聊机器人对同一提示的反应,哪个最佳?
    三款AI聊机器人对同一提示的反应,哪个最佳?
    这是我发现的。在精心策划且详细的提示中扮演着质量良好的提示,在输出的质量中扮演任何cathbot生产的质量。与所有工具一样,输出仅与使用该工具的人的技能一样好。 AI聊天机器人没有什么不同。 有了这种理解,我指示每个模型创建一个针对个人理财的基本指南。这种方法使我能够评估多个相互联系的主题(特别是...
    人工智能 发布于2025-04-15
  • ChatGPT足矣,无需专用AI聊机
    ChatGPT足矣,无需专用AI聊机
    在一个新的AI聊天机器人每天启动的世界中,决定哪一个是正确的“一个”。但是,以我的经验,chatgpt处理了我所丢下的几乎所有内容,而无需在平台之间切换,只需稍有及时的工程。 在许多实践应用程序中可能会让您感到惊讶。它的范围令人印象深刻,使用户可以生成代码段,草稿求职信,甚至翻译语言。这种多功能性...
    人工智能 发布于2025-04-14
  • 印度AI时刻:与中美在生成AI领域竞赛
    印度AI时刻:与中美在生成AI领域竞赛
    印度的AI抱负:2025 Update 与中国和美国在生成AI上进行了大量投资,印度正在加快自己的Genai计划。 不可否认的是,迫切需要迎合印度各种语言和文化景观的土著大语模型(LLM)和AI工具。 本文探讨了印度新兴的Genai生态系统,重点介绍了2025年工会预算,公司参与,技能开发计划...
    人工智能 发布于2025-04-13
  • 使用Airflow和Docker自动化CSV到PostgreSQL的导入
    使用Airflow和Docker自动化CSV到PostgreSQL的导入
    本教程演示了使用Apache气流,Docker和PostgreSQL构建强大的数据管道,以使数据传输从CSV文件自动化到数据库。 我们将介绍有效工作流程管理的核心气流概念,例如DAG,任务和操作员。 该项目展示了创建可靠的数据管道,该数据管线读取CSV数据并将其写入PostgreSQL数据库。我们...
    人工智能 发布于2025-04-12

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3