AI巅峰之作：还会犯错的GPT4对谁有用？

2023-03-17 12:16:47 腾讯网

3月15日凌晨1点，OpenAI正式推出GPT4文本生成AI系统。相比GPT3.5，GPT4的用户体验大大改进，其功能性和准确度均有不小提高，更被openAI视为里程碑。但是，不足之处仍然存在，GPT4的逻辑推理能力依然有不小的提高空间。

我们依然要冷静，一半天才一半白痴的AI雨人，不会取代底层打工人的岗位，更不能高估GPT4的消费性应用价值。

(资料图片)

GPT4真正的优势体现是在全球大国AI 军备竞赛中，GPT4具备分析全球互联网大数据情报的超能力，有人会为此积极买单。

1.GPT4比chatGPT高在哪里？

一是功能高。根据官方介绍，GPT-4是一个多模态大型语言模型，即支持图像和文本输入，以文本形式输出；扩写能力增强，能处理超过25000个单词的文本；更具创造力，并且能够处理更细微的指令。

大型语言模型已经由chatGPT科普过了，如何理解这里的黑话“多模态”？文字输入文字表达即为单模态，现在的 GPT-4可以接收图片输入，使用文字输出的表达，以后还会有视频输入文字输出，这被称为多模态。

多模态比纯文字就是高，与此前的GPT系列模型相比，这是GPT-4最大的突破之一。

不过该功能还没有全面开通。OpenAI创始人Sam Altman当晚在社交媒体介绍称，他们正在预览GPT-4的图片输入模式，以防止可能出现的安全伦理问题。

二是准确度高。

OpenAI表示，新模型产生的错误答案更少，将更少地偏离谈话轨道，更少地谈论禁忌话题，甚至在许多标准化测试中比人类表现得更好。

OpenAI称，该公司花费6个月的时间，利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4，从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果。

官方罗列了一些证据认为，GPT4高级推理能力超过chatGPT。

例如，它在模拟律师考试中的得分能够名列头部10%左右，相比之下，GPT-3.5的得分只能排在尾部10%左右。

OpenAI称，在公司内部的对抗性真实性评估中，GPT-4的得分比最新的GPT-3.5高40%，相应的“不允许内容请求的倾向”降低了 82%，根据政策响应敏感请求（如医疗建议和自我伤害）的频率提高了29%。

不仅是英语，该模型在多种语言方面均表现出优越性。OpenAI称，在测试的26种语言中，GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中GPT-4的中文能够达到80.1%的准确性，而GPT-3.5的英文准确性仅为70.1%，GPT-4英文准确性提高到了85.5%。

“这是OpenAI努力扩展深度学习的最新里程碑。”OpenAI介绍。

2.不过，AI仍然不可靠。

尽管 GPT4进步不小，但与早期的GPT模型一样，GPT4仍然存在许多不足。

我觉着吧，经过测试可以发现，GPT4在知识的广度、专业和学术表达方面的确表现较好，做到了“一本正经”；但是智商方面，近似于人类小学生，还是常常会“说胡话”，尤其是数理运算公式方面，还没上幼儿园。

这是个明显的弱点。

一半天才一半白痴，这算是人类制造的机器“雨人”。

OpenAI也认识到了这一点。“GPT-4缺乏对绝大多数数据切断后（2021年9月）发生的事件的了解，并且无法从中吸取经验教训……它有时会出现简单的推理错误，它会轻信用户明显的虚假陈述，有时它会像人类一样在难题上失败，例如在它生成的代码中引入安全漏洞。”

基于此，OpenAI提醒，用户在使用语言模型时应格外小心，最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

3.这种AI工具对谁有用?

从AI智障到AI雨人，算是整个行业的进步。为此，openAI正在积极推进。openAI正在大举招兵买马，手里有微软送过来的100亿美元新军费，未来十几年不愁资金问题，现在驾驭着微软提供的全球第二算力的微软云，正向全球顶级AI大牛发出橄榄枝。

“随着我们继续专注于可靠的扩展，我们的目标是完善我们的方法，以帮助我们越来越多地提前预测和准备未来的能力——我们认为这对安全至关重要。”

同时，为了保持核心竞争能力，openAI已经对GPT模型完全封锁。在目前OpenAI公开的技术报告或公关文稿中，不包含任何关于模型架构、硬件、算力等方面的更多信息，也不包括期待已久的 AI 视频功能，也并没有GPT4的任何核心技术论文信息。没有人能拿到GPT3.5内部细节，更别奢望现在的GPT4了。

OpenAI对用户开放API接口，你可以调用它，设计自己简陋的APP。但是，你却要源源不断的输送数据，帮它完善模型，提升模型准确度，甚至还要为此主动付费。这真是一门好生意。

鉴于GPT与中文世界一贯的保持了无形的距离，这个距离暂时无法打破；鉴于某些山寨品与GPT4.0差距实在太大，速成品就更没法比了，因此，关于市场应用和投资前景，依然不能着急。因此，你不能天真的以为，生成式AI可能快速改变各行各业，并且可能加强每个人的创造能力与挖掘每个人的新需求，更不能随意看好全球算力+软件栈行业、模型+云计算行业，应用+传感器行业。

GPT4在公开情报分析方面具备超能力，这个能力远远大于搜索引擎，也超过了许多NSA数据武器（论证略），现在解决了多模态问题，无论音视频、图片还是文字，机器人通吃。如果你要分析互联网大数据的秘密，并且发现需要的情报，那么GPT这样的机器人是不是就会很有用处？

不光如此，微软还要把旗下搜索引擎bing与GPT4融合。bing解决了AI训练所需的互联网数据源问题，GPT解决了数据分析输出问题，bing+GPT=new bing……

我想美国政府、情报机构和军方一定会积极买单。他们不光利用聊天机器人技术分析全球情报，还可以偷偷地训练机器人撒谎。

GPT从1.0走了3.5，又从3.5走到4.0，而许多国家还在停留2.0-3.0的水平上，原地不动。

眼下要钱没钱，要人没人，要算力没算力。跟是跟不上了，必须另辟蹊径。

关键词：

猜你喜欢