吊打ChatGPT！GPT-4在多项考试中超过人类平均水平_科讯网

【资料图】

编译 | 高腾

2023年3月14日，GPT-4正式发布。数据显示，它在各种专业和学术基准上和人类相当，优秀到令人难以置信！

根据产品白皮书，GPT-4在人类的多项考试中表现出色，包括美国律师考试（Bar）、美国法学院入学考试（LSATs）、SAT的阅读和数学考试、GRE等。

例如，GPT-4在Bar考试里击败了90%的人类，在SAT阅读考试中击败了93%人类，在SAT数学考试里击败了89%人类。

更令人惊讶的是，它的分数几乎是其前代GPT-3的两倍。

OpenAI在其网页上这样总结：“虽然在许多现实世界场景中的GPT-4能力还不及人类，但在各种专业和学术问题上和人类表现出相同的水平。”

OpenAI开发了一系列大型语言模型（LLM，large language model）。不久前火遍全球的ChatGPT用的语言模型是 GPT-3.5。虽然ChatGPT与GPT-4在随意的谈话中看起来很相似，但OpenAI 表示，在内部评估中，GPT-4 产生正确回应的可能性要比 GPT-3.5 高出 40%。

而且，GPT-4还是多模态的，不但可以接受文本输入，还可接受图像输入。

在GPT4的发布会上，OpenAI的总裁和联合创始人Greg Brockman就展示了一段它所拥有的强大编程能力：

首先在纸上简单画一个非常粗糙的草稿图；然后拍照上传给GPT-4，告诉它要做一个网站，让它生成网站代码；大约10秒钟后，GPT-4给出了完整的网站代码。

这效果应该会让众多网站开发者感到巨大的压力和职业危机。

虽然OpenAI发布上述统计数据确实令人惊叹，但该公司也承认，GPT-4仍然存在与其前身相同的缺陷。

OpenAI在其网站上指出：GPT-4仍存在与早期GPT模型相似的局限性，它并不是“完全可靠的”，最新版本的GPT仍会“幻觉”事实并出现推断错误。

“在使用LLM输出时应格外小心，特别是在容易出错的语境下，具体的使用规则应根据具体需求来确定，例如人工审查、加强背景理解甚至完全避免高风险使用等规则。”OpenAI方面称。

尤其值得关注的是，OpenAI正在加快更新迭代速度——GPT-3于2020年夏季发布；GPT 3.5于去年12月1日推出，并给世界带来了ChatGPT；而现在，仅仅3个月左右，GPT-4就面世了。

虽然人们还在分析GPT-4的全部能力，但目前可以明确的一点是，AI领域有着不断增长的发展动力和广阔的市场前景。

如果有人想要体验GPT-4，除了申请付费版应用，也可以免费体验。因为微软已经确认，新版本Bing正在GPT-4上运行。如果在过去几周内你使用过新的Bing预览版，那么你已经体验过这个强大模型的早期版本。

原文链接：

https://futurism.com/the-byte/gpt-4-exam-scores

GPT-4白皮书：

https://cdn.openai.com/papers/gpt-4.pdf

推荐内容

吊打ChatGPT！GPT-4在多项考试中超过人类平均水平

2023-03-16
焦点热文：蜜蜂导航自带“认知地图”

2023-03-16
今日热闻!“龙睛一号”太空来信：我国初步掌握空间中子能量分布识别技术

2023-03-16
自然资源部发布17项行业标准

2023-03-16
2022年度中国电子学会会士评定结果公示

2023-03-16
当前快看：生态环境部通报2月和1—2月全国环境空气质量状况

2023-03-16
濒危青头潜鸭飞抵北京野鸭湖

2023-03-16
黄河封冻河段全线开河

2023-03-16
天天速看：中国船舶集团华中光电技术研究所原所长陈福胜接受审查调查

2023-03-16
北冰洋海冰2005-2007年变得更薄更均一

2023-03-16
环球实时：湖北省科技创新大会举行，科学家寄语年轻一代

2023-03-16
最新：海南给予青年人才“第一桶金”支持，不受国籍限制

2023-03-16
研究发现三氯蔗糖甜味剂可能抑制小鼠免疫系统

2023-03-16
2022年度湖北省科学技术奖出炉！

2023-03-16
环球热讯:突破！我国科学家发现两种新矿物

2023-03-16
第十六届全国矿床会议将在太原召开

2023-03-16
当前快报:“天然电池酶”化空气为电能，提供生产清洁能源新途径

2023-03-16
“夜光”蛋白能快速分析检测病毒

2023-03-16
肝癌潜在新疗法出现

2023-03-16
自然语言处理“战国时代”即将到来？

2023-03-16
气候解决方案大中华区决赛落幕三支团队将赴联合国参加全球总决赛

2023-03-15
当前快报:我国科考队通过多方配合监测冰川变化共谋美丽生态家园

2023-03-15
天文学家发现一颗离地球最近的特殊中子星候选体

2023-03-15
快资讯：16连胜！长十一火箭成功发射试验十九号卫星

2023-03-15
每日播报!西安交大科研人员在亚稳β钛合金强韧化方面取得新进展

2023-03-15
当前热点-“白肺”是什么？甲流可能引起“白肺”吗？专家解答

2023-03-15
热文：第六批月球科研样品信息上线发布

2023-03-15
中国专家研发仿生纳米递氧系统或让更多脑卒中患者得到有效救治

2023-03-15
【世界时快讯】香港大学：在内地无委托中介机构代招生无所谓“内推”机制

2023-03-15
天天动态:上海交大邓子新团队合作揭示聚酮合酶的C-N键形成机制

2023-03-15
水利部：开展七大江河干流堤防达标建设3年提升行动

2023-03-15
天天热点评！家属、校友、社会公众均可入校！浙大最新通知

2023-03-15
快报：多地组织多场招聘会，多途径促大学生求职就业

2023-03-15
每日热文：睡眠不足或减弱抗体对疫苗反应

2023-03-15
焦点！新型碳点材料实现活细胞内颗粒高分辨成像

2023-03-15
沙尘暴蓝色预警继续！8省区有扬沙或浮尘天气

2023-03-15
我国实现多个领域新突破，推动高质量发展

2023-03-15
中国专家尝试“篮子理论”给“无药可医”肿瘤患者带去生机

2023-03-14
研究：全球变暖使干旱、强降雨降雪事件更加频繁和强烈

2023-03-14
当前通讯！北京协和医院：让健康科普知识真正被老百姓所知所获所用

2023-03-14
中国启动“星空地”监测碳排放项目空天信息技术助力“双碳”

2023-03-14
环球热讯:著名理论物理学家曾谨言逝世，所著《量子力学》教材培养几代学子

2023-03-14
世界短讯！教育发布开展第二批现代产业学院建设工作的通知

2023-03-14
癌症的故事——手术，化疗，靶向药，我们该选哪个？

2023-03-14
速讯：地大校长王焰新代表：促进“四链”深度融合

2023-03-14
天天即时：南极破纪录爆发性增温成因

2023-03-14
全球最新：研究指“中华水塔”青海本世纪前20年冰川、湖泊“一缩一扩”

2023-03-14
环球讯息：可以空缺！第四届中国化学会分子筛奖开始评选

2023-03-14
沙尘暴蓝色预警继续！内蒙古北京等11省区市有沙尘天气

2023-03-14
焦点播报:申报时间调整！博新计划和博士后基金最新通知

2023-03-14
焦点热文：蜜蜂导航自带“认知地图”

2023-03-16
吊打ChatGPT！GPT-4在多项考试中超过人类平均水平

2023-03-16
今日热讯：万人说新疆|设计美好生活的库尔班·肉孜

2023-03-16
暖身暖心护花育苗——西藏大力实施各级各类学校供暖全覆盖工程

2023-03-16
重点聚焦!新疆宜居宜业和美乡村“美”在何方？

2023-03-16
世界头条：“巴”方来才·“南”得有你重庆市巴南区科技创新暨人才工作大会隆重举行

2023-03-16
消息！我国运动康复医学产业落后欧美：专业机构供应不足人才培养成关键瓶颈

2023-03-16
今日热闻!“龙睛一号”太空来信：我国初步掌握空间中子能量分布识别技术

2023-03-16
上海今年首批供地19宗：涉及11个区总起始价483.4亿元

2023-03-16
我国首次发行网络型基础设施专题金融债券

2023-03-16
世界滚动:文旅部决定开展智慧旅游沉浸式体验新空间推荐遴选暨培育试点工作

2023-03-16
当前最新：中演协：2023年演出机构计划中的涉外演出近千场

2023-03-16
焦点速读：河南多地发布暴雪红色预警降雪成因公布

2023-03-16
自然资源部发布17项行业标准

2023-03-16
世界讯息：这种App竟是“窃听器”！工信部回应了：立即查处！

2023-03-16
国家推出稳定2023年大豆生产一揽子支持政策

2023-03-16
世界观点：托起山里娃的“足球梦”

2023-03-16
春茶开采忙

2023-03-16
三大“热词”解读1-2月国民经济：企稳回升消费被给予厚望

2023-03-16
头条焦点：广告“霸屏”、关不掉……这样的“弹窗”还要飞多久？

2023-03-16
动态焦点:国家统计局：2月份商品住宅销售价格环比总体上涨

2023-03-16
文化和旅游部启动智慧旅游沉浸式体验新空间培育试点工作

2023-03-16
世界观焦点：3·15晚会曝光破解版APP陷阱工信部：立即严厉查处

2023-03-16
2022年度中国电子学会会士评定结果公示

2023-03-16
逐浪AIGC②丨别只盯着ChatGPT了这波AI浪潮远不止于此

2023-03-16
【全球快播报】商品日报（3月16日）：商品市场大面积下跌原油跌超6%沪金成唯一上涨品种

2023-03-16
全球快资讯：新天绿色能源（00956.HK）3月16日收盘跌2.59%，主力资金净流出159.5万港元

2023-03-16
中国信通院联合发布《人工智能研发运营体系（MLOps）实践指南（2023年）》

2023-03-16
濒危青头潜鸭飞抵北京野鸭湖

2023-03-16
广电总局副局长杨小伟赴互联网电视集成平台调研加强互联网电视传播秩序管理工作

2023-03-16
天天热点！8部门：掌握人群感染发病水平科学预测疫情规模、强度和流行时间

2023-03-16
当前快看：生态环境部通报2月和1—2月全国环境空气质量状况

2023-03-16
天天报道:大港油田去冬今春向京津冀输送天然气超19亿立方米

2023-03-16
贝壳：“一体两翼”品质升级，打造美好新居住

2023-03-16
当前播报:铲除直播带货水军，网络平台应有更多作为

2023-03-16
速读：戴德梁行：2023年写字楼市场将稳步复苏

2023-03-16
天天观热点：GPT-4问世商业落地再近一步游戏文娱行业有望先受益

2023-03-16
天天速看：中国船舶集团华中光电技术研究所原所长陈福胜接受审查调查

2023-03-16
黄河封冻河段全线开河

2023-03-16
世界快看点丨“硼砂泡出黄金鲍”涉事厂家中科海产被关停曾以近似商标“獐子港”傍名牌“獐子岛”

2023-03-16
喜讯丨315消费者权益日，千年舟荣获中国质量检验协会三项大奖项

2023-03-16
今日视点：农业农村部法规司副司长王维友接受纪律审查和监察调查

2023-03-16
WPS发布2022年业绩快报，全年订阅高质量收官

2023-03-16
北冰洋海冰2005-2007年变得更薄更均一

2023-03-16
加快推动各类新型数据中心赋能千行百业工业和信息化部公示国家新型数据中心典型案例名单

2023-03-16
精选！滴滴举行第三届网约车合作伙伴大会开放合作共建司机和车辆生态

2023-03-16
今日要闻!2月汽车召回情况公布 11家生产企业累计宣布召回超15万辆

2023-03-16
歼-16最新高清训练大图来了

2023-03-16
今日热搜：2022年中国风电整机制造商新增吊装容量排名出炉三一重能首登前五金风、远景稳居前二

2023-03-16
环球实时：湖北省科技创新大会举行，科学家寄语年轻一代

2023-03-16
今日热闻!直播嗨购防踩雷，这份避坑指南请收好

2023-03-16
月子中心涉嫌提供代孕？广州市卫健委公布初步调查结果

2023-03-16
担保人需要承担的责任？抵押贷款可以自己去银行办理吗？

2023-03-16
最新：海南给予青年人才“第一桶金”支持，不受国籍限制

2023-03-16
焦点播报:山东威海活水生动物国际市场抢“鲜”机

2023-03-16
东莞重大项目开业：理光在华最大“智造”工厂，产值超30亿

2023-03-16
纯信用贷款需要哪些条件？纯信用贷款进件条件是什么？

2023-03-16
急需5000块钱征信不好怎么办？抵押贷款的进件要求是什么？

2023-03-16
成都印发新能源汽车发展实施意见目标到2025年产业规模突破1500亿元

2023-03-16
福建老区县引来“金凤凰” 保用电助项目建设

2023-03-16
消费贷款需要信用好吗？消费贷款对征信有什么要求？

2023-03-16
信用卡办不下来能不能办车贷？保单保单贷款条件是什么？

2023-03-16
是不是一定要找中介？贷款找中介有什么风险？

2023-03-16
线上小额信用贷款在哪里申请？补缴的社保何时能查到？

2023-03-16
补缴社保可以补多久？社保补缴要给多少钱？

2023-03-16
每日速看!物流保通保畅 | 民航保障航班量环比增长6.2%

2023-03-16
社保补缴记录要怎么查询？社保有什么用？

2023-03-16
针对315曝光问题各地连夜行动

2023-03-16
全球报道:国家网信办：从严惩处涉网暴账号2.2万个

2023-03-16
火爆直播间背后:水军操盘诱导下单

2023-03-16
信用卡逾期两个月停卡了怎么办？信用卡逾期两个月停卡能解冻吗？

2023-03-16
外交部发言人：中方愿在一个中国原则基础上同包括洪都拉斯在内的各国发展友好合作关系

2023-03-16
每日热闻!大众汽车预计今年营业销售回报率超4%，计划推高能效燃油车

2023-03-16
【环球新视野】被央视“3·15”点名，景区回应“安全带不安全”：暂不考虑整改，6年没任何意外，当地通报：下达停业整顿通知

2023-03-16
研究发现三氯蔗糖甜味剂可能抑制小鼠免疫系统

2023-03-16
全球消息！太损了！阿诺德单场被过6次星报：他就像块“肥肉”杵在球场

2023-03-16
每日观点：AI大戏未落幕微软GPU资源却告急内部已采取配额供给制

2023-03-16
【速看料】国家统计局：2月份商品住宅销售价格环比总体上涨

2023-03-16
环球热讯:突破！我国科学家发现两种新矿物

2023-03-16
天天要闻：粤西地区直径最大的顶管完成首段作业

2023-03-16
今日热议：工业富联郭俊宏：数字经济产业将转向深化应用新阶段

2023-03-16
2022年度湖北省科学技术奖出炉！

2023-03-16
度小满借款如何降低利率？微粒贷被拒绝怎么回事？

2023-03-16
没办过贷款会有征信记录吗？人寿保险公司的险种有哪些？

2023-03-16
全球视讯！春耕一线观察丨一粒小麦良种支撑粮食增产大图景

2023-03-16
连夜行动！一大波通报、致歉，希望不止“3·15”

2023-03-16
社保补缴后一直查不到怎么办？社保补缴后算是连续缴费吗？

2023-03-16
冰雪时光全球门店拓展稳中求进，加盟优势明显

2023-03-16
第十六届全国矿床会议将在太原召开

2023-03-16
保险交了五年可以退保吗？保险交五年了退保能退多少钱？

2023-03-16
每日短讯：315曝光景区称“6年未发生意外暂不整改安全带”，南宁通报：下达停业整顿通知

2023-03-16
为什么借了借呗3万买房被拒？那么要怎么办呢？

2023-03-16
社保断了10年能补交吗？社保断了10年续交怎么交？

2023-03-16
第一次贷款怎么选择？社保断了10年还能续交吗？

2023-03-16
银行应根据什么确定贷款期限？银行确定贷款期限的主要依据是什么？

2023-03-16
世界速讯：韩国总统尹锡悦：被强征劳工问题解决方案是顾全大局的决断日本也应采取行动

2023-03-16
只够首付的能不能买房？贷款买房不能有其它贷款吗？

2023-03-16
美国银行接连“爆雷”为哪般

2023-03-16
辞职了社保可以自己交嘛？社保自己交需要多少钱？

2023-03-16
全球速看：第五届全球金融科技创业大赛南京赛区总决赛正式开赛

2023-03-16