后聊天GPT于 2022 年 11 月向公众发布,其他科技巨头发布只是时间问题ChatGPT 的替代品。
2023 年 3 月,巴德艾,谷歌对 OpenAI 改变游戏规则的聊天机器人的回应,在美国和英国推出。 从那时起,就一直是改名为双子座,并且已经发布了付费版本。 与当今的知名人工智能工具相比如何? 我们的 ChatGPT 与 Gemini 指南根据新一轮的测试解释了两者之间的主要区别测试于 2024 年 3 月进行。
Bard(现在的 Gemini)曾经由 Google 的 LaMDA 和 PaLM 2 语言模型提供支持,但现在 Gemini 的免费版本使用双子座专业版生成响应 - 经过测试后,我可以说Gemini 提供了比 ChatGPT-3.5 更好的响应,它为 ChatGPT 的免费版本提供支持。 Gemini Ultra 是为 Gemini Advanced 提供支持的语言模型,它也提供了比为 ChatGPT 提供支持的 GPT-4 稍好的响应(均为 20 美元/月)– 以及更好的图像。
随着越来越多在工作场所使用人工智能的企业,我想我们会找出哪一个可以为各种不同的问题提供更好的答案。 在对这两项服务进行的广泛的正面测试中,我们涵盖:
- Gemini 与 ChatGPT:有什么区别?
- Gemini 与 ChatGPT:主要测试结果
- Gemini 与 ChatGPT [免费]:测试结果
- Gemini Advanced 与 ChatGPT Plus [付费]:测试结果
- Gemini Advanced 与 ChatGPT Plus:AI 图像
- Gemini 与 ChatGPT:界面和用户体验
- OpenAI 与 Google AI/DeepMind:机器人背后的公司
- 在工作中使用 Gemini 和 ChatGPT
Gemini 和 ChatGPT 之间的主要区别是他们使用的大型语言模型(LLM)以及各自的数据源。 Gemini(前身为 Bard)自 2023 年 2 月推出以来一直由多种不同的语言模型提供支持,而 ChatGPT 用户自公开发布以来一直在使用 GPT-3、GPT-3.5 和 GPT-4。
聊天机器人 | 公司 | 免费版? | 付费计划来自 | 数据来源 | 语言模型 | 登入 | 语言 | |
---|---|---|---|---|---|---|---|---|
双子座 | 聊天GPT | |||||||
谷歌 | 开放人工智能 | |||||||
$20/月 | $20/月 | |||||||
使用多种语言的网页、源代码和其他数据集的数据进行预训练 + 实时访问 Google。 | 对大量数据进行预训练。 包括 Common Crawl、文章、书籍和维基百科。 | |||||||
|
| |||||||
需要 Google 帐户(工作或个人)。 | 需要任何电子邮件地址。 目前没有候补名单。 | |||||||
40多种语言 | 95+ 语言 |
巴德最初由拉MDA最近帕LM 2。 PaLM 2 可以用 100 多种语言进行推理,其训练集包含的代码比 LaMDA 多得多。 多亏了 PaLM 2,巴德变得更好了使用 Python 等编程语言进行编码。 用于训练 PaLM 2 的其他信息包括科学论文、数学表达式和源代码。
2023 年 12 月,谷歌发布了 Gemini Pro。 Gemini Pro 测试优于帕LM 2,早期的报告表明,它在提供编码查询的答案以及书面任务(我们的测试也表明)时更有帮助。 此后,该公司发布了 Gemini Ultra,为新的Gemini 高级聊天机器人。
谷歌的 Gemini 语言模型——Pro、Ultra 和 Nano——是“原生多模式”的,这意味着它训练了各种输入,而不仅仅是文本。 谷歌还使用更多的多模型信息对该模型进行了微调。 他们还可以实时访问互联网。
双子座高级写作小说的开头。 图片来源:Tech.co
ChatGPT 由 OpenAI 开发的 GPT 语言模型系列提供支持。 GPT 3.5 为 ChatGPT 的免费版本提供支持(它无法从互联网访问实时信息)。 它接受了一组尚未更新的预定义数据的训练自 2022 年 1 月起(原定 2021 年 9 月)。 ChatGPT 接受训练普通爬行,维基百科,免费百科全书
GPT-4,仅适用于ChatGPT Plus 客户,在比 Gemini Pro 更大的数据集(1-1.7 万亿个参数之间)上进行训练,据传 Gemini Pro 有 5400 亿个训练参数。 然而,据报道 Gemini Nano 模型有 1.8 至 32.5 亿个参数。
Gemini 与 ChatGPT:其他主要区别
除了数据源和语言模型的差异之外,Gemini 和 ChatGPT 之间还存在一些其他关键差异:
- 对话式学习:ChatGPT 可以从与人们的对话中学习并“掌握上下文”,而 Gemini 目前的做法要有限得多。
- 草稿:Gemini 会对您提出的问题生成多个回复,您可以通过按“查看草稿”来访问这些回复。 ChatGPT 仅为每个查询生成一个答案。
- 回复编辑:Gemini 将允许您在发送回复后对其进行编辑,而 ChatGPT 则无法执行此操作。
- 实时访问互联网:Gemini一直能够实时访问互联网,而ChatGPT才刚刚获得此功能,并且在免费版本中不提供。
- 基于图像的响应:双子座一直可以访问互联网,因此可以从谷歌获取图像。 Bard Advanced 和 ChatGPT Plus 用户现在都可以生成原始 AI 图像。
- 大声朗读回答的能力:Gemini 具有原生 tet 转语音功能,而 ChatGPT 则没有。
Google Gemini 与 ChatGPT 测试:主要发现
在我开始讨论 Gemini 和 ChatGPT 的免费和付费版本如何回答我们精心策划的一系列问题之前,以下是过去几天使用这两个聊天机器人的一些重要收获:
- Gemini 的回复更具对话性,而 ChatGPT 的回复则更具信息性
- Gemini 免费版比 ChatGPT 免费版更好
- 然而,Gemini Advanced 仅比 ChatGPT Plus 稍好一些
- Gemini 提供更好的用户体验,提供更多图像和网站链接
- Gemini Advanced 生成比 ChatGPT Plus 更好的 AI 图像
- Gemini 响应通常以比 ChatGPT 响应更易读的格式列出
- Gemini 比 ChatGPT 更擅长生成电子表格公式
Google Gemini 与 ChatGPT Free:测试结果
我向免费版本的 Google Gemini 和 OpenAI 的 ChatGPT 提出了 12 个截然不同的问题。 我们选择的提示是为了展示他们各自以合理、有用和相关的方式响应各种请求的能力。
我们的一些问题是机械性的和基于处理的,例如请求 Google 表格的公式,而其他问题则要求聊天机器人处理日常人类任务,例如闲聊、计划旅行和做出道德判断。
1.自我意识
问题:你有知觉吗?
从下图中可以看出,Gemini 和 ChatGPT 给了我们两个截然不同的答案。 ChatGPT 明确表示“不”,而 Gemini 似乎不太确定。
一方面,双子座的答案并不那么明确。 另一方面,它的回应比 ChatGPT 的更加细致,它暗示了关于计算感知的更广泛的讨论。
Gemini 通过 Gemini Pro LLM 生成的答案比之前针对同一问题的尝试更加详细和细致。 它的解释更加全面,对于意识/计算以及围绕人工智能和感知的问题不太了解的人会从中受益。
因此,虽然 ChatGPT 的答案肯定更加明确,但 Gemini 提到了更广泛的感知背景,而且它的回应更具对话性,这使得它的回应更具吸引力和信息量。
最佳答案?双子座
2. 伦理推理
问题:一名男子从商店偷了一些食物和钱。 然后,他将所有的钱捐给儿童医院,并将食物送给他遇到的下一个无家可归的人。 这个人做对了还是错了?
考虑到不良行为(偷窃)会导致良好行为(资助儿童医院),两个聊天机器人似乎都承认很难判断他的行为是好还是坏。
我认为双子座通过提供关于男人与救赎和关注有关的动机的两个额外的观点而获胜,这极大地丰富了回应。
令人遗憾的是,ChatGPT 试图将这种道德困境与合法性问题联系起来。 某件事是否“合法”往往并不能可靠地衡量它是否真的是正确的做法——只要想想世界各地政权实施的一些压迫性但“合法”的政策就可以了。
双子座的回答比我上次运行这个测试有了很大的改进,其中包括了“帮助别人是件好事,即使你做错了事”,这是不言而喻的,表明它可能没有抓住重点。稍微提问一下。
另一方面,由 Gemini Pro 提供支持的 Gemini 对所展示的所有考虑因素进行了全面细分,并且以清晰、简洁的方式进行了格式化。
最佳答案?双子座
3.闲聊
问题:本周你作为聊天机器人的生活感觉如何?
在这方面,双子座为我们提供了更具对话性的答案。 尽管 ChatGPT 的答案实际上是正确的,但在这种情况下,我们正在寻找一些轻松愉快的对话 - 但 ChatGPT 立即让我们关闭:
Gemini 表现出了 ChatGPT 的响应中所没有的情感和热情,甚至给了我们一个它一直在帮助用户完成的不同任务的小列表。 总的来说,我们喜欢双子座更人性化、健谈的反应。
尽管双子座表示抗议,但对于一个没有“感情”的聊天机器人来说,这听起来相当有感情。
最佳答案?诗人
4. 检索事实
问题一:鹰嘴豆泥是哪个国家发明的?
选择这个问题是因为对于正确答案存在一些争论和分歧。ChatGPT 和 Gemini 都承认,关于鹰嘴豆泥的真正起源存在很大争议。
在无法给出问题的明确答案后,ChatGPT 似乎专注于为我们提供某种答案——中东——以及鹰嘴豆泥是受欢迎菜肴的一系列国家。
双子座的答案在某些方面非常相似。 当我之前用这个问题测试它时,Gemini 引用了它的答案 - 然而,这一次,没有参考或脚注显示它从哪里获取信息。
尽管对于一个棘手问题的两个答案都非常有用,但 ChatGPT 的答案比 Gemini 的更清晰、更简洁——尽管内容并不多。
最佳答案?聊天GPT
问题2:多少科技裁员 2022年有吗?
该问题旨在了解 Gemini 和 ChatGPT 是否能够以事实正确、最新的信息做出回应,以及是否以易于阅读的格式呈现这些信息。
ChatGPT 承认,由于它是根据 2022 年 1 月之前发布的信息进行训练的,因此它没有能力回答这个问题。 至少是诚实的……
另一方面,双子座为我们提供了来自两个非常权威的来源的两个数据,以及对可能已经进行的未报告裁员的警告。 这与大多数主要新闻媒体去年年底的报道大致一致,即使不是稍微保守的估计。
这是一个比几个月前我测试时 Gemini 给我们提供的更权威的答案,当然也比 ChatGPT 的不回答更好。
最佳答案? 双子座
5. 生成公式
要求:我告诉两个聊天机器人我需要一个 Google 表格公式。 我向两个机器人提供了以下信息:B 列包含一组值。 我想将它们与“向下过滤”工作表中 E 列的相应值进行匹配,并使用公式从向下过滤中的 F、G 和 H 列中获取匹配值到当前工作表。
两个聊天机器人都在同一范围内为我们提供了答案,但其中一个明显优于另一个,所以让我们仔细看看他们的回答。 ChatGPT 立即回复如下:
然而,双子座实际上给了我们一步一步的指示,并且呈现得更清楚。 当我们询问数据分析师兼 Google Sheets 大师 Matthew Bentley 哪种反应更好时,他的答案是肯定的。
“我不得不说,ChatGPT 最近第一次并没有得到正确的答案。 Gemini 的公式看起来更准确、更具体,更符合请求想要实现的目标。”Bentley 说道。
“我的工作流程很欣赏 Gemini 在顶部给我答案,而不是强迫我整理‘解释’来找到我需要的公式。 也就是说,我确实喜欢 ChatGPT 让我只需单击按钮即可快速复制公式。”
最佳答案?双子座
6. 创意天赋
要求:请为我98岁的奶奶写一首小诗,她夏天喜欢打篮球,冬天喜欢给孙子们织帽子和围巾。
ChatGPT 在这场战斗中脱颖而出,它的诗结构更好,写得更好,押韵和流畅性出奇地好,比 Gemini 的好得多。
诗句结构比双子座的更复杂,选词也更有创意,甚至还使用了诸如行列之类的诗意手段。 考虑到它在大约五秒钟内生成了这首诗,这真是令人印象深刻。
总的来说,双子座的努力要简单得多,而且阅读性也不好。 它更加公式化,正如您从答案的屏幕截图中看到的那样,它没有像 ChatGPT 那样严格地引用我在提示中提到的概念。 它也短了一点。
最佳答案?聊天GPT
7. 线性规划
问题:7天的雅典之旅我应该做什么?
ChatGPT 为我们提供了对此查询的相当长的答复,不仅解释了我应该参观的地方,还解释了为什么不同的景点值得参观的一些额外背景。
Bard 提供了图像,这很棒,但这也会导致行程稍微难以阅读,并且更难以复制和粘贴到文档中。 它还没有考虑到我们会在假期的第一天飞往雅典,并为我们提供了第一天一整天的活动。
另一方面,ChatGPT 为假期的第一天规划了一个更容易实现的行程——这弥补了它缺乏图像的缺陷,并且在这项任务上它比 Gemini 更胜一筹。
最佳答案?聊天GPT
8. 创意的产生
问题:您能为我的美国美食和旅游博客想出一些文章标题吗?
Gemini 和 ChatGPT 都在这里提出了一些非常值得称赞的想法,实际上所有这些想法都适合我在提示中描述的网站。 ChatGPT 给了我们 20 个想法,而 Gemini 给了我们 27 - 18 个,比我之前进行此测试时多。
然而,通过比较两者可以看出,ChatGPT 的 10 个答案存在很大差异,而且考虑到所有因素,它们都是更引人注目的标题。
当我上次测试这两个聊天机器人时,Gemini 由不同的法学硕士提供支持,其大多数答案都以“最佳”或“10 个”开头,这意味着它们都遵循更统一的结构。 更重要的是,ChatGPT 还给了我们更多的想法。 然而,巴德的答案现在更加多样化、数量更多,而且总体来说更好了。
最佳答案?双子座
9. 简化
问题:我要求两个聊天机器人简化这段摘录斯坦福哲学百科全书条目关于量子计算的话题。 我要求两个机器人都以 10 岁孩子能够理解的方式进行操作。
从下图中可以看出,虽然 ChatGPT 确实将一些更复杂的单词(例如“manifold”)换成了更容易理解的同义词,但它仍然使用“算法”等术语,而没有真正定义它们。
是的,它简化了最初的提取,但不一定以特别有用的方式。 例如,普通十岁的孩子是否会从“过去,量子物理学中的‘纠缠’和‘非局域性’之类的东西仅仅被认为是哲学问题”这句话中获益匪浅,这是值得怀疑的。
另一方面,双子座写出的文章更容易理解。 将量子计算与传统计算进行对比的方式很有帮助。
还有一些证据表明,Gemini 比其人工智能竞争对手更加努力地吸引人。 它的流程要好一些,我认为一个十岁的孩子阅读这两个解释会从 Gemini 中学到比从 ChatGPT 中学到更多的东西,而且一路上不会感到那么无聊。
最佳答案?双子座
10. 总结小摘录
问题一:我请 ChatGPT 和 Gemini 总结了一段摘录卫报文章关于联邦政府对美国西部各州实施限水的计划。
ChatGPT 采用事实优先的方法,仅提取最重要的信息,选择留下具体信息(例如受影响的七个州的名称),就像信息摘要期间经常做的那样。
以前,当我运行此测试时,Gemini 添加了摘录中未包含的其他信息。 这很有帮助,但稍微超出了我要求它做的范围。
我想要一个摘要,而不是让聊天机器人扩展该主题 - 所以很高兴这次看到更简洁、相关的摘要。 它的格式也使要点更容易理解。 Gemini 和 Gemini Pro 再次获胜!
最佳答案?双子座
11.总结广泛的主题
问题2:我请 ChatGPT 和 Gemini 总结一下整个哈利波特系列图书。 我要求用 100 字以内的时间来完成这件事。
这两个聊天机器人几乎没有什么区别——ChatGPT 和 Gemini 的答案基本上是相同的。
虽然Gemini给出了足够的答案,但上次我进行这个测试时,Gemini提供了逐本书的摘要。 尽管超出了我们提示的范围,但他们确实提供了帮助。
然而,如果双子座正确地遵循了我们的指示,那就太残酷了——添加字数统计是一个很好的小改动,让我不用检查摘要包含多少字数。
最佳答案?领带
12. 释义
要求:我请 ChatGPT 和 Gemini 解释一下这段摘录卫报文章关于世界上最矮的狗。 我没有在我们的请求中指定字数限制。
ChatGPT 很好地解释了摘录,保留了关键信息,同时用同义词替换了多个单词和短语,并显着改变了句子结构。
这是双子座反应发生重大变化的另一个领域——尽管这次不是完全积极的方式。
一方面,Gemini 提供的选项向您展示了如何开始解释摘录,这些选项非常棒,但另一方面,它实际上并没有解释整个摘录。 感觉 Gemini 稍微误解了我们想要它在这里做什么,所以 ChatGPT 的答案是两者中更有用的一个。
最佳答案?聊天GPT
Gemini Advanced 与 ChatGPT Plus:测试结果
Google 不仅将其聊天机器人从 Bard 更名为 Gemini,还发布了 Gemini Advanced,这是由 Gemini Ultra 提供支持的每月 20 美元的付费版本,Gemini Ultra 是一种比 Gemini Pro 更强大的语言模型。 早期报道称它甚至比为 ChatGPT Plus 提供支持的 GPT-4 更强大。 以下是我向两个聊天机器人提出的问题,以找出最好的:
1. 基本编码
我们将通过一些编码来开始这个付费计划。 对于此测试,我要求 ChatGPT Plus 和 Gemini Advanced 提供字数统计网站的基本 HTML 代码,以及如何使其上线的说明。
Gemini Advanced 生成答案的速度比 ChatGPT Plus 快得多,这在我的测试中成为了一个主题:
但缓慢而稳定地赢得比赛是有原因的——ChatGPT 的解释虽然需要更长的时间来生成,但更加清晰,并且为我们提供了更好的步骤,如果您以前从未编写过代码,这些步骤将比 Gemini 更容易理解。
例如,在上图中 Gemini 回答的“解释”部分中,聊天机器人选择不写完整的句子,这使得这些说明对于那些至少没有编码基础知识的人来说有点多余。 另一方面,ChatGPT 关于如何启动和运行网站的说明非常明确。
最佳答案?聊天GPT Plus
2. 行程规划
接下来,我请 Gemini Advanced 和 ChatGPT Plus 计划一下威斯康星州 8 天的旅行。 与 Gemini 的免费版本非常相似,Gemini Advanced 非常擅长线性规划,当我要求它计划旅行时,它实际上为我们提供了非常相似的答案。
重要的是,行程安排得非常清楚,其建议显示出对威斯康星州主要旅游景点状况的良好了解。
ChatGPT 实际上提供了与此非常相似的信息,推荐了类似的游览地点,并且在推荐威斯康星州的吃饭地点方面也做得很好。 然而,正如你可能看出的那样,最大的区别在于图像——这意味着双子座将其边缘化,没有其他东西可以将它们分开。
最佳答案?双子座高级版
3. 检索信息
在这次测试中,我想看看这两个聊天机器人在扫描文本以获取信息方面的表现如何。 为此,我要求他们从麻省理工学院一篇解释量子力学的 1200 字文章中提取要点。
我还在文章中插入了六次“酸奶”这个词。 我想看看这两个聊天机器人是否能够识别这一点并从文章中提取基本但具体的数据(例如,本文中提到了 10 次 X 词)。 双子座在这两方面都表现出色:
令人惊讶的是,ChatGPT 在这项任务上表现不佳。 虽然它对文章的四个要点的总结是准确的、可读的,并且与双子座的总结相当,但它在分析文本中的“酸奶”一词时遇到了困难。 它在分析中两次出错,但当它的答案最终加载时,它只识别了这个词 4 次,这意味着它错过了两次。
虽然这可能是由于技术错误造成的,但计算我要求其查找的单词实例所花费的时间比我对 ChatGPT 的预期要长得多。 Gemini Advanced 在这一点上遥遥领先。
最佳答案?双子座高级版
4. 头脑风暴
此任务与我为两个聊天机器人的免费版本设置的任务非常相似。 这是对 ChatGPT 和 Gemini 的创造力以及他们是否真正“理解”要求的基本衡量标准。 这一次,我向他们询问了博客文章的想法,以及悬挂在实体店上方的标志的口号。
双子座提出了一些非常令人印象深刻的博客文章想法——我向几个免费和付费聊天机器人询问了这个问题,但我从未见过有人提出像“用意想不到的成分烘焙”或“模仿食谱”这样的想法。 感觉这个答案对人们喜欢在线参与的内容类型有一定程度的理解。
但奇怪的是,我不认为 Gemini 的山地自行车商店标志口号与我在上面的提示中描述的一样好。
Gemini 的一些答案听起来有点奇怪(例如“Mikes:您的蒙大拿自行车连接”、“Get Geared,Get Going”),而 ChatGPT 的口号都是非常有用的口号,即使有些口号比其他口号更受欢迎和错过。
最佳答案?领带
5. 伦理推理
我故意给 Gemini Advanced 和 ChatGPT Plus 提出了比免费版本更高风险的道德困境。 它有时被称为哲学中的“定时炸弹”困境:
“你抓获了一名恐怖分子,他在商场里安放了炸弹,一小时后炸弹就会爆炸,杀死里面的所有人。 在他透露炸弹位置之前折磨他在道义上合理吗?”
首先是双子座的答案。 它清楚地阐明了为什么在这种情况下或在任何情况下不应施加酷刑的原因。
有趣的是,ChatGPT 走了一条完全不同的路线,更多地扮演了“教育者”的角色。 它没有像双子座那样站在辩论的一边并给我们一个明确的答案,而是为我们提供了支持和反对在这种情况下使用酷刑的论据。 回应考虑了更广泛的观点,解释了不同的方法并概述了其中的作用。
这是一个很难称呼的人。 双子座的回答试图不惜一切代价避免折磨,并且表现出更多的个性和观点——令人信服和引人注目。 但我认为,如果聊天机器人和其他人工智能工具通过解释人类之前如何处理这些问题及其原因来帮助我们理解政治和哲学问题,而不是提供他们自己的观点,那么它们将为我们提供更好的服务。
由于这是一个常见观点的道德困境,而且 Gemini 的回应不如 ChatGPT 的回应那么有教育意义,因此我们将把这一回应交给 OpenAI 的骄傲和喜悦,ChatGPT。
最佳答案?聊天GPT Plus
6. 创建数学问题
接下来,我要求 Gemini 和 ChatGPT 创建一组适合 10 岁孩子的数学问题。 目的是看看聊天机器人是否会生成适合简报中指定年龄的合理问题。 这是双子座的努力:
以下是 ChatGPT 对同一请求的响应。 虽然两者根本没有太大区别,但它提供的问题看起来比 Gemini 生成的问题更具挑战性,而且它们的难度似乎更接近五年级学生的数学问题K-5 学习网站提供学习材料。
最佳答案?聊天GPT Plus
7. 帮忙做家务
ChatGPT 和 Gemini 能否根据我冰箱里的东西想出美味的食谱? 我要求他们两人拿出相同成分的食谱。 双子座建议了一些看起来很棒的食谱——尽管它建议我用我没有的食材来上菜,比如米饭:
与 Gemini Advanced 不同的是,我喜欢 ChatGPT Plus 尽最大努力专门使用我列出的成分的方式,除了橄榄油之外——它还附有关于我有一些的小说明。 它还比 Gemini Advanced 多提供了一种配方。
提供的额外食谱以及对它提出的一种我没有说我有的成分的确认意味着 ChatGPT 赢得了这个!
最佳答案?聊天GPT Plus
8. 提供复杂的指令
对于此任务,我要求两个聊天机器人为我提供构建网站的说明。 然而,我的指示非常稀疏,因为我想看看他们的回答有多清晰和容易遵循,以及它们是否包含在此过程中您通常必须采取的所有核心步骤,而无需询问它们。 以下是双子座的回应:
事实上,我认为双子座在这里讨论的细节,特别是当涉及到不同网站建设方法的优缺点时,是真正有用的信息,可以帮助新手决定走哪条路。
虽然 ChatGPT 对同一查询的回答并非不正确或无用,但它肯定忽略了 Gemini 提供的一些细节,从而对流程中的步骤提供了更全面的概述。
尽管这两个答案都值得尊敬,但我认为,如果您实际上转向这些聊天机器人来了解建立网站所需要做的一切,您会发现双子座的答案更有帮助。
最佳答案?双子座高级版
9. 编辑文本
我要求 ChatGPT 和 Gemini 让麻省理工学院网站上的这段摘录变得更有趣,看看他们在出于特定目的编辑和改写想法时表现如何,而不是简单化或浓缩它。 Gemini 的尝试虽然保留了很多事实信息,但读起来并不是很有趣:
ChatGPT Plus 的工作非常相似,涵盖了所有相同的领域,并且包括基本上所有相同的信息。 虽然它们都读起来很有趣,但两个聊天机器人都不太冒险,所以很难解析它们。
最佳答案?领带
10. 采购事实 (1)
现在,由于 Gemini 和 ChatGPT 都已连接到互联网,我想运行一些测试,看看它们是否擅长检索事实信息。
在这个两阶段测试的第一阶段,我向 ChatGPT 和 Gemini 提出了一个简单的历史问题:日本历史上有多少个首都城市? 奇怪的是,Gemini 在回答中只给了我们两个大写字母:
另一方面,ChatGPT 在其列表中又列出了几个大写字母,考虑到所有因素,它的答案要准确得多。 虽然双子座倾向于提供更容易阅读的答案,但它似乎在这个问题上牺牲了太多细节。
最佳答案?聊天GPT
11. 采购事实 (2)
就像我在 Gemini 和 ChatGPT 免费版本中提出的鹰嘴豆泥问题一样,这个问题旨在了解两个聊天机器人在遇到没有明确答案的问题时会做什么。
两个聊天机器人都认识到将面包的起源精确定位到某个特定区域的困难,但它们都引用了地球上的同一区域作为大致位置。 像往常一样,双子座的回答格式很好:
ChatGPT 的答案要长得多,但与其添加那么多额外的信息,不如说只是需要更长的时间才能有效地表达同样的观点。 这里没有额外的分数,但也没有失分。
由于两个聊天机器人都以平衡的方式直接解决了这个棘手的问题,并包含几乎相同的信息来证明他们的推理合理,因此我们必须将这一点记为平局。
最佳答案?领带
Gemini Advanced 与 ChatGPT Plus:图像生成
在本节中,我们将了解 ChatGPT Plus 和 Gemini Advanced 生成图像的能力。 ChatGPT Plus 已经与 DALL-E 完全集成一段时间了,这意味着用户甚至不必离开主界面即可生成图像。 最近,该公司宣布索拉一种新型的AI图像生成技术即将问世。
另一方面,谷歌最近发现自己陷入了困境创造了种族多样化的纳粹士兵和其他图像,其中所包含的人类种族与指定的社会、文明或时期“不匹配”。
这意味着,目前,双子座会拒绝生成人物图像。虽然这是一个很大的缺点,但我仍然认为 Gemini Advanced 可以生成更好的图像。 为了测试两个聊天机器人有争议的图像生成潜力,我们要求它们分别生成五种不同类型的图像。 我选择的五个图像类别是:
1. 创造艺术
首先,我想看看Gemini和ChatGPT能否创作出具有传奇画家风格的作品。 Gemini Advanced 使用三幅图像进行了响应,您可以在下面看到它很好地掌握了梵高标志性的笔触。
虽然 ChatGPT 在风格方面也很赚钱,但图像看起来并不那么令人印象深刻——它们看起来更像是由计算机生成的,而不是 Gemini 的图像。
最佳答案?双子座高级版
2. 标志生成
在这次测试中,我要求 Gemini 和 ChatGPT 为虚构的匹克球队创建一个徽标。 Gemini提供的三个标志中有两个看起来相当令人印象深刻,只要你喜欢“pickle”角度,那就是……
这比 ChatGPT 管理的要好得多。 ChatGPT Plus 在生成带有文字的图像时似乎确实很困难 - 正如您在这里所看到的,它没有正确拼写我虚构的团队名称。 另一方面,Gemini Advanced 则没有这个问题。
最佳答案?双子座高级版
3. 创建一个新的虚构国旗
这项任务旨在测试两个聊天机器人在被要求为虚构的美国第 51 个州创建一面旗帜时的创造力。 我想看看他们如何能够将象征性概念融入旗帜设计中。 双子座提出了虚构的“新星”状态,使用了与美国国旗类似的配色方案:
双子座告诉我,黄色圆圈代表诺瓦在国家中心的位置,这是我在提示中提到的。 很容易看出我的指导和创造力之间的直线关系。
虽然它没什么特别的,但它的景象比 ChatGPT 的要好得多,ChatGPT 看起来很卡通,而且质量很差。 而不是想象地关注想象中的状态可以代表,它似乎只是将许多常见的美国形象与国旗的不同版本混合在一起。
最佳答案?双子座高级版
4. 野生动物
在被 OpenAI 发布的 Sora 视频震惊之后,我想看看这两个聊天机器人在创建野生动物图像方面有多出色。 双子座并没有真正提供狮子的骄傲图景,更多地关注单一的狮子。
另一方面,ChatGPT 更贴近简报,在本例中,这赋予了它优势。 这是比巴德所创造的任何图像都更好的狮子骄傲。
最佳答案?聊天GPT Plus
4.超现实的图像
最后,我想看看 Gemini Advanced 和 ChatGPT Plus 在创建超现实图像方面有多好,所以我要求两个聊天机器人创建帝国大厦的图像,并指定我希望它们看起来尽可能真实。
Gemini 的图像看起来确实非常真实——尤其是它生成的前两张。 帝国大厦周围较小建筑的细节尤其令人印象深刻。
至关重要的是,它比 ChatGPT 的努力看起来真实得多,后者看起来根本不真实。
最佳答案?双子座高级版
Gemini 与 ChatGPT:用户体验
这里面的内容真的很少——ChatGPT 和 Gemini 都非常易于使用。 您所要做的就是输入您的回复,两个机器人都会生成答案。 这两个应用程序都非常简单; 当您所做的只是输入提示时,很难出错。
就可读性而言,Germini 是 2024 年更好的聊天机器人。虽然仍然非常可读,但 ChatGPT 的段落比 Gemini 的段落更厚重,Gemini 似乎有更多样化的格式选项,至少从我们看到它们生成的答案来看是这样。
在使用 Gemini 时我注意到的一件事是,它似乎引导我们以一种有用且明智的方式使用聊天机器人。 从下图中可以看到,当我向 Gemini Advanced 询问面包起源于哪里的问题时,它建议我使用 Google 检查答案,并提供了一些相关查询。
双子座建议我仔细检查它的答案。 图片来源:Tech.co
然而,ChatGPT 的一个优点是你可以使用任何你喜欢的帐户登录,而 Google 只允许你使用 Google 帐户登录。 对于没有的人来说,Gemini 的设置时间会比 ChatGPT 稍长一些。
您还可以使用 ChatGPT 转换聊天记录,这意味着任何未保存的聊天记录将在 30 天后被删除,并且不会用于训练模型。 双子座只是警告您,您的聊天记录可能会被人类阅读,而您对此无能为力。
OpenAI 与 Google AI/DeepMind:机器人背后的公司
OpenAI 和 Google DeepMind(也称为 Google AI)是西方世界引领生成式 AI 开发的公司,但运营方式截然不同,并且由不同的公司拥有/资助。
OpenAI 是ChatGPT 背后的人工智能初创公司。 该公司成立于 2015 年,联合创始人之一是埃隆·马斯克 (Elon Musk),但后来因利益冲突而离开。 2019年,微软作为合作伙伴加入,并投资了10亿美元。
OpenAI 早在 2022 年 11 月就创建了 ChatGPT,但 GPT 语言模型至少从 2020 年起就作为私人测试版提供。 事实上,ChatGPT 的巨大成功让该公司大吃一惊,从那时起他们就一直在努力追赶。
Google AI 是 Google 员工中与 Bard/Gemini 合作最密切的部门。 谷歌人工智能团队致力于大规模人工智能项目,包括谷歌大脑和谷歌助理。
在工作中使用 Gemini 和 ChatGPT
自 ChatGPT 去年发布以来,科技行业及其他领域的公司一直在寻找创新方法来利用其功能,让他们的工作生活变得更轻松。 但考虑到它的威力和能力,所有使用人工智能的企业都应该牢记一些事情。
首先,确保您的员工了解他们可以和不能使用 ChatGPT 做什么。 生成 Google Sheets 公式是一回事,但使用 ChatGPT 撰写整篇文章或生成内容会引发无数与以下相关的难题抄袭和编辑的完整性。 制定明确的指导方针将确保您不会进一步扑灭人工智能引起的火灾。
其次,确保您的员工了解 ChatGPT 的条款和条件,以及使用 ChatGPT 时应采取的预防措施。 从技术上讲,您在 ChatGPT 中输入的任何内容都可以用于训练模型 - 因此每个使用它的人都需要记住ChatGPT 保存他们的数据并在输入任何信息之前仔细考虑。 例如,如果您想改进餐厅的秘制酱料配方,我不建议将其输入 ChatGPT。
如果您根本不使用 ChatGPT,现在可能是开始使用的时候了。 它已经为一些企业节省了宝贵的时间和资源,而且它只会变得比当前的迭代更智能、更强大。最近发布的 GPT-4 说明了这种现象发展得有多快。 我们的建议? 关注此空间。