AI巅峰之作:还会犯错的GPT4对谁有用?
2023-03-17 12:16:47    腾讯网

3月15日凌晨1点,OpenAI正式推出GPT4文本生成AI系统 。相比GPT3.5,GPT4的用户体验大大改进,其功能性和准确度均有不小提高,更被openAI视为里程碑。但是,不足之处仍然存在,GPT4的逻辑推理能力依然有不小的提高空间。

我们依然要冷静,一半天才一半白痴的AI雨人,不会取代底层打工人的岗位,更不能高估GPT4的消费性应用价值。


(资料图片)

GPT4真正的优势体现是在全球大国AI 军备竞赛中,GPT4具备分析全球互联网大数据情报的超能力,有人会为此积极买单。

1.GPT4比chatGPT高在哪里?

一是功能高。根据官方介绍,GPT-4是一个多模态大型语言模型,即支持图像和文本输入,以文本形式输出;扩写能力增强,能处理超过25000个单词的文本;更具创造力,并且能够处理更细微的指令。

大型语言模型已经由chatGPT科普过了,如何理解这里的黑话“多模态”?文字输入文字表达即为单模态,现在的 GPT-4可以接收图片输入,使用文字输出的表达,以后还会有视频输入文字输出,这被称为多模态。

多模态比纯文字就是高,与此前的GPT系列模型相比,这是GPT-4最大的突破之一。

不过该功能还没有全面开通。OpenAI创始人Sam Altman当晚在社交媒体介绍称,他们正在预览GPT-4的图片输入模式,以防止可能出现的安全伦理问题。

二是准确度高。

OpenAI表示,新模型产生的错误答案更少,将更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

OpenAI称,该公司花费6个月的时间,利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果。

官方罗列了一些证据认为,GPT4高级推理能力超过chatGPT。

例如,它在模拟律师考试中的得分能够名列头部10%左右,相比之下,GPT-3.5的得分只能排在尾部10%左右。

OpenAI称,在公司内部的对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5高40%,相应的“不允许内容请求的倾向”降低了 82%,根据政策响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。

不仅是英语,该模型在多种语言方面均表现出优越性。OpenAI称,在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中GPT-4的中文能够达到80.1%的准确性,而GPT-3.5的英文准确性仅为70.1%,GPT-4英文准确性提高到了85.5%。

“这是OpenAI努力扩展深度学习的最新里程碑。”OpenAI介绍。

2.不过,AI仍然不可靠。

尽管 GPT4进步不小,但与早期的GPT模型一样,GPT4仍然存在许多不足。

我觉着吧,经过测试可以发现,GPT4在知识的广度、专业和学术表达方面的确表现较好,做到了“一本正经”;但是智商方面,近似于人类小学生,还是常常会“说胡话”,尤其是数理运算公式方面,还没上幼儿园。

这是个明显的弱点。

一半天才一半白痴,这算是人类制造的机器“雨人”。

OpenAI也认识到了这一点 。“GPT-4缺乏对绝大多数数据切断后(2021年9月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”

基于此,OpenAI提醒,用户在使用语言模型时应格外小心,最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

3.这种AI工具对谁有用?

从AI智障到AI雨人,算是整个行业的进步。为此,openAI正在积极推进。openAI正在大举招兵买马,手里有微软送过来的100亿美元新军费,未来十几年不愁资金问题,现在驾驭着微软提供的全球第二算力的微软云,正向全球顶级AI大牛发出橄榄枝。

“随着我们继续专注于可靠的扩展,我们的目标是完善我们的方法,以帮助我们越来越多地提前预测和准备未来的能力——我们认为这对安全至关重要。”

同时,为了保持核心竞争能力,openAI已经对GPT模型完全封锁。在目前OpenAI公开的技术报告或公关文稿中,不包含任何关于模型架构、硬件、算力等方面的更多信息,也不包括期待已久的 AI 视频功能,也并没有GPT4的任何核心技术论文信息。没有人能拿到GPT3.5内部细节,更别奢望现在的GPT4了。

OpenAI对用户开放API接口,你可以调用它,设计自己简陋的APP。但是,你却要源源不断的输送数据,帮它完善模型,提升模型准确度,甚至还要为此主动付费。这真是一门好生意。

鉴于GPT与中文世界一贯的保持了无形的距离,这个距离暂时无法打破;鉴于某些山寨品与GPT4.0差距实在太大,速成品就更没法比了,因此,关于市场应用和投资前景,依然不能着急。因此,你不能天真的以为,生成式AI可能快速改变各行各业,并且可能加强每个人的创造能力与挖掘每个人的新需求,更不能随意看好全球算力+软件栈行业、模型+云计算行业,应用+传感器行业。

GPT4在公开情报分析方面具备超能力,这个能力远远大于搜索引擎,也超过了许多NSA数据武器(论证略),现在解决了多模态问题,无论音视频、图片还是文字,机器人通吃。如果你要分析互联网大数据的秘密,并且发现需要的情报,那么GPT这样的机器人是不是就会很有用处?

不光如此,微软还要把旗下搜索引擎bing与GPT4融合。bing解决了AI训练所需的互联网数据源问题,GPT解决了数据分析输出问题,bing+GPT=new bing……

我想美国政府、情报机构和军方一定会积极买单。他们不光利用聊天机器人技术分析全球情报,还可以偷偷地训练机器人撒谎。

GPT从1.0走了3.5,又从3.5走到4.0,而许多国家还在停留2.0-3.0的水平上,原地不动。

眼下要钱没钱,要人没人,要算力没算力。跟是跟不上了,必须另辟蹊径。

关键词: