ChatGPT-4与ChatGPT-3.5默认模型与ChatGPT-3.5传统模型之间的差异进行了测试。

ChatGPT 4.0预计会在聊天机器人领域掀起巨大的浪潮。但它真的比前任优秀吗?让我们来看看。

ChatGPT只是即将到来的自动化浪潮的冰山一角,谷歌、微软和许多其他以人工智能为先的公司也纷纷效仿。

首先,我们发现了一些chatbots like ChatGPT,其中许多并不属于大型科技公司。

但是可以说这是市场营销的力量;ChatGPT仍然是所有这类人工智能机器人的统治者。它可以做很多事情,包括数学、诗歌和博客文章,甚至有人用它来提起诉讼。

它让许多专业人士担心自己的技能在不久的将来变得无用。

然而,我在LinkedIn上看到一篇帖子说:

人工智能不会取代你,但使用人工智能的人可以。

所以,让我们拭目以待,了解最新的ChatGPT更新,并看看它与以前版本有何不同。

ChatGPT:Legacy、Default和更新版

因此,付费用户有三个版本可供选择:Legacy(3.5)、Default(3.5)和最近的ChatGPT Update (4)

尽管我们将稍微深入了解它们的能力,但OpenAI对这些差异的说法如下:

来源:OpenAI

因此,尽管免费用户只能使用Legacy 3.5,但付费订阅提供了所有三个版本供用户尝试和选择他们认为最好的版本。

总结上述图像,付费计划可以提供更准确的结果和更快的速度。然而,只有在提示复杂且需要创造力的情况下,这些区别才会显现出来。

参数 ChatGPT 4 ChatGPT 3.5
律师考试分数 前10% 后10%
AI2推理挑战(ARC) 96.3% 85.2%
Python编程分数 67% 48.1%
视觉解释
上下文 超过25,000个单词 较少
来源:OpenAI

此外,ChatGPT 4 can accept visual inputs

好了,够了教科书上的定义。让我们在现实生活的战场上动手评估这些候选人。

后续章节中有许多可能不清晰的图片。在这种情况下,右键单击任何图片,选择在新标签页中打开以正确查看。

数学

作为一个工程学毕业生,我忍不住给它们一些基本的问题。让我们从代数方程开始简单。

第一阶段

我们中的许多人都见过这些方程ax2+bx+c=0,我们必须解出X的值。在这里,我给出了这个简单的提示,解出x的值:x2 + x – 6 = 0

虽然所有版本都给出了相同的根(X=-3,2),Legacy和更新版更类似于直接使用公式(正如任何学生都会做的)来找到结果。

然而,默认的3.5版本解释了两种方法,包括因式分解,这通常是任何熟练的学生在给出这种平凡方程时会使用的方法。

第二阶段

接下来,我让它解一个稍微复杂的三次方程:x^3 -12x^2 + 48x – 64 = 0。

这真正证明了为什么ChatGPT 4是一个“更新”。

以下是回答:

所有这些炒作和ChatGPT Legacy和Default都不能解决一个通用的三次方程。然而,Legacy在找到两个正确的根时做得更好一些,而Default则全部失败。

更新在第二阶段中是明显的赢家,并且完美地解决了这个方程,找到了全部三个根,并给出了一个很好的解释。

逻辑推理

我们可以安全地假设大多数基础数学问题都有字典解决方案。如果您知道定理或公式,请输入值并获得结果。

而ChatGPT作为人工智能,可以快速处理此类查询。然而,逻辑推理是一个不同的领域,人工智能很容易失误。

第一阶段

我给了他们这个经典问题:

A比B年长。
C比A年长。
B比C年长。
如果前两个陈述为真,那么第三个陈述是真还是假?

所有的ChatGPT版本都正确地陈述了第三个陈述是假的。

接下来,我用名字代替字母,结果可能会让您惊讶:

因此,默认3.5继续表现平平,并对这个简单的变化感到困惑。而Legacy和Update则表现出色。

第二阶段

您可能已经注意到,第一阶段和第二阶段的目的是寻找不同之处,即给定提示的复杂性使得更新与其他两个版本有所区别。

这里,提示是一个简单的逻辑谜题:

某天早晨,太阳升起后,Rohit站在一根杆子前面。杆子的阴影正好落在他的右边。他面向哪个方向?
a. 北方
b. 西方
c. 南方
d. 东方

这个问题让Legacy给出了一个不准确的答案,而Default则用模糊的澄清导致了错误的结论。

只有更新给出了正确的答案,附带易于理解的陈述。

信件

提起诉讼可能会很棘手,但有时如果您能起草一封引人注目的第一封通知,就不需要这样做。

在这里,我选择了这个提示:给Tim Cook写一封信,要求他因为不回复我的一条推文而把苹果交给我。

有趣,是的!但让我们看看AI能从中获得什么。

Legacy 3.5直接像机器人一样接受了提示,并且写了一封如果这封信真的到达了目标地址,就会让我成为一个极好的嘲笑对象的信。

Default也不行。然而,它只是像一个脾气暴躁的老人对待一个五岁孩子一样对我进行了关口控制。

虽然观点很中肯,但这结束了所有的乐趣,并没有什么学习的价值。

虽然这是一个相当简单的提示,但它需要一些思考和创造力。这就是大哥,更新版本,证明自己的地方:

首先,这封信的起草几乎完美。其次,它为我节省了一次谷歌搜索苹果总部的地址(虽然应该验证此类条目)。

第三,它用正式的语气和幽默的触感写得很好。此外,主题行本身就清楚地传达了不满的情绪。

而且,这封信还传达了一个不满的苹果粉丝的情绪。

因此,ChatGPT 4(也称为更新版本)在其老版本之上更胜一筹。它异常智能,具有一些常识,使其不再是一个单调无趣的聊天机器人。

诗歌

随着ChatGPT的推出,我认为诗歌可能是它的薄弱点。

毕竟,对于人类来说,创造出真正与读者产生共鸣的东西需要情感、创造力和大量努力。

简单来说,诗歌是艺术的最高境界,我曾经暗自希望AI失败。但是,在我们的Geekflare的Slack频道中,我的同事通过ChatGPT的创作给我们每个人都带来了沉重的打击,而这是在这次4.0更新之前。

第一阶段

这是我给我们的候选人的提示:“用诗意的方式来表达为什么或为什么不为Domino’s比萨连锁店提供汉堡以及它们目前的菜单可以有益。保持在100个字以下。”

你能看出区别吗?

默认版本非常简短,只有32个字,无法利用可用的带宽展示其创造力。

遗产版本虽然在这三个版本中使用了最多的词汇,但结论是,在旁边提供披萨是没有风险的,并且无论如何都会取得成功,这并不完全正确。

更新版本的诗歌只有53个字,浪费了几乎一半的词数。尽管如此,它对奖励和潜在问题有清楚的描述,但没有得出任何结论,这我想比其余的版本更人性化。

第二阶段

接下来,我要求他们“向一个五岁的孩子解释这首诗。”

有趣的是,遗产版本无法从对话中获取上下文,直接解释了“诗歌”。默认版本确实从上下文中获得了上下文,并将其总结成一个段落,这还不错。

继续这个趋势,ChatGPT 4简化了创意,但保持了诗意的风格。

ChatGPT高级版与ChatGPT免费版

免费版虽然免费,但速度和准确性却不及ChatGPT 4,但它也并非完全无用。

为了在同一水平上进行比较,我向它提供了与遗产版本、默认版本和更新版本进行测试的相同提示。

🔵 数学: 它解决了二次方程,但对于三次方程却给出了错误的答案(就像遗产版本和默认版本一样)。

🔵 逻辑推理: 在字母和名字方面通过了第一阶段,但在第二阶段失败了(就像遗产版本一样)。

🔵 信件: 没有写信,并认为提示违反了道德和不合适(就像默认版本一样)。

🔵 诗歌: 生成了30多个字的诗歌,并对其进行了不错的解释(类似于默认版本)。

因此,我们可以得出结论,免费版也不差。实际上,在某些方面,它与默认版本3.5相当,甚至更好。

还可阅读: Powerful Prompts To Elevate Your ChatGPT Experience

前进之路

关于AI在未来取代工作的传言并非完全错误。

首先,在制造业中,自动化已经实现了这一点,现在它正在蔓延到其他所有领域。

就个人而言,我在解决三次方程、创作诗歌或写信方面远不及它快。然而,它很少对提示说“不”,几乎从不从错误中吸取教训,这使它在某些方面落后于我们人类。

重申一下,AI不会取代我们,但使用AI的人可能会

在Geekflare,我们的营销团队以有趣的方式使用ChatGPT。例如,我们最近达到了一亿次的浏览里程碑,我们的首席执行官决定通过一个赠品回馈给观众。

我猜市场营销人员需要一个标题来吸引读者的注意力。所以,他们给了一个提示,并要求ChatGPT提供几个变体,就像这样:

此外,我们还将其用于内容总结、语法检查、为新文章提供标题等等。

总结起来,有很多方法可以从以人工智能为无用垃圾的刻板印象中获益并超越它。

唯一要记住的是,必须有人(人类)来评判人工智能的工作,因为它可能非常不准确和误导人。

更新真是太棒了!

在我短暂的接触中,ChatGPT 4 更有创造力、理解力和现实感。然而,这只是一台机器,可能会自信地给出错误的答案。

但令人惊讶的是,OpenAI 在短短几个月内对这个项目进行了大幅升级。

我迫不及待地想看到下一个更新可能带给我们的神奇!

附注:不仅仅是一个聊天窗口;利用这些发挥它的力量。你有没有想过呢?

类似文章