五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半-天天快看点

首页 > 聚焦 >

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半-天天快看点

2023-06-08 22:55:52 来源：搜狐科技

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。AI大模型数学功底到底如何？比人类“聪明”吗？搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。

在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

(资料图片)

测试结果显示，这五款大模型在答数学题的能力上差异显著。

最“聪明”的讯飞星火答对了5题，正确率50％。百度文心一言和ChatGPT“紧跟其后”，答对了4题，正确率为40％。

360智脑和通义千问则“全军覆没”，一道题也没答对，交了白卷。

值得一提的是，昨天搜狐科技也用五款大语言模型产品，对高考作文全国卷（甲）进行了测试，并邀请了5位语文名师打分。

打分结果显示，ChatGPT高考作文得分最高，文心一言、讯飞星火得分稍低，但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题，对大模型能力考察的维度并不尽相同。但巧合的是，不擅长写作文的360智脑和通义千问，似乎也不擅长做数学题。

通过这两次高考题测试，也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”，那么360智脑和通义千问则是妥妥的“学渣”。

附测试中使用的高考数学题题目：

1.不等式|x-2|<1的解集为__

2.a=(2,3)，b=(-1,2)，则a·b=__

3.首项为3，公比为2的等比数列的前六项和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域为__

6.复数z=1-i，则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π，则m=__

8.三角形的三边长为a=4，b=5，c=6，则sinA=__

9.某地一年四个季度的GDP(亿元)，第一季度GDP为232，第四季度GDP为241，且四个季度的GDP逐季度增长，中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正数k的最大值为__

责任编辑：

关键词：

OPPO Reno10全新配备超光影长焦镜头随手就能拍大片最后一页

最近更新 MORE

x 广告

原创

联想昭阳笔记本新品发布并定义了商用PC标准

软硬协同，全栈自主：华为云GaussDB二十年磨一剑_全球聚焦

业界

社区列清单，居民、共建单位抢签约|天天新消息

资讯

海南乡宴上的人情味

海南乡宴上的人情味原标题：文旅周刊|海南乡宴上的人情味编者按当一些

全国第三届老年书法作品展海口开展展出271件作品|世界微头条

全国第三届老年书法作品展海口开展展出271件作品新海南客户端、南海网6

x 广告

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半-天天快看点

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。

当Z世代年轻人逐渐成为商业社会的“职场大军”，他们希望拥有一款什么

社区列清单，居民、共建单位抢签约---湖北日报讯（记者汤炜玮、通讯员

上海两男子往车窗塞露骨小卡片被刑事拘留，警方：他们与诈骗分子勾结--

1、大连校区是主校区，在大连高新区，地理位置非常好，交通方便，大连

1、站长不会联系你的只有找代理了我之前在他这里上过82095361一直都很

6月8日，A股三大指数走势依旧分化。截至收盘，上证指数上涨0 49%；深证

人民网北京6月8日电（焦磊）6月8日，以“在变革时代塑造行业未来”为主

据官方信息，在顶配机型上，这颗长焦摄像头拥有6400万像素的高清画质，

例如，在满足金融大机业务的高可用性上，华为云GaussDB和工行联创推出

为护航广大考生冲刺高考，各地机场多措并举倾力守护高考学子逐梦。6月7

1、如果哺乳期不采取避孕措施，可能会怀孕。在哺乳期，由于体内激素水

光库科技（SZ300620，收盘价：54 16元）6月8日发布公告称，2023年7月14

扫黑除恶永远在路上！广东公安扫黑除恶系列微电影《黑雾》之《海晏清》

中国日报6月8日长沙讯6月8日，2023年湖南国际文化旅游节新闻发布会在长

当机器人日益应用于制造业、商贸物流、医疗健康、社区服务等领域，并与

首届文化强国建设高峰论坛6月7日召开本次主论坛主题为推进文化自信自强

近两年来，一些废品回收企业推出“互联网+废品回收”模式，手机预约下

央行官网6月7日更新数据显示，截至5月末，央行黄金储备报6727万盎司，

据中证报6月7日报道，新兴生物技术公司IovanceBiotherapeutics(IOVA US

在外打工受伤没劳动合同申请赔偿的方式是：收集证明存在劳动关系的材料

具体来说，居民人均可支配收入增长了3 8%，实际增长2 0%；而消费支出下

6月8日，两市股指呈现震荡分化走势，沪指午后一度直线上攻，创业板指盘

天能股份近期接受投资者调研时表示，在公司新一轮战略升级规划中，储能

正源股份（SH600321，收盘价：1 7元）6月8日晚间发布公告称，公司2022

九联科技（SH688609，收盘价：10 47元）6月8日晚间发布公告称，公司202

长江电力6月8日大宗交易成交1000万股，成交额2 27亿元，占当日总成交额

爱旭股份6月8日大宗交易成交213 82万股，成交额7253 69万元，占当日总

助力国家食品安全示范城市创建，2023年上半年若羌县市场监管局加大食品

6月8日上午，盐城盐都成功举办楼宇经济招商推介会。此次推介会以“楼聚

海南乡宴上的人情味

海南乡宴上的人情味原标题：文旅周刊|海南乡宴上的人情味编者按当一些

全国第三届老年书法作品展海口开展展出271件作品|世界微头条

全国第三届老年书法作品展海口开展展出271件作品新海南客户端、南海网6

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半-天天快看点

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。

当Z世代年轻人逐渐成为商业社会的“职场大军”，他们希望拥有一款什么

社区列清单，居民、共建单位抢签约---湖北日报讯（记者汤炜玮、通讯员

上海两男子往车窗塞露骨小卡片被刑事拘留，警方：他们与诈骗分子勾结--

1、大连校区是主校区，在大连高新区，地理位置非常好，交通方便，大连

1、站长不会联系你的只有找代理了我之前在他这里上过82095361一直都很

6月8日，A股三大指数走势依旧分化。截至收盘，上证指数上涨0 49%；深证

人民网北京6月8日电（焦磊）6月8日，以“在变革时代塑造行业未来”为主

据官方信息，在顶配机型上，这颗长焦摄像头拥有6400万像素的高清画质，

例如，在满足金融大机业务的高可用性上，华为云GaussDB和工行联创推出

为护航广大考生冲刺高考，各地机场多措并举倾力守护高考学子逐梦。6月7

1、如果哺乳期不采取避孕措施，可能会怀孕。在哺乳期，由于体内激素水

光库科技（SZ300620，收盘价：54 16元）6月8日发布公告称，2023年7月14

扫黑除恶永远在路上！广东公安扫黑除恶系列微电影《黑雾》之《海晏清》

中国日报6月8日长沙讯6月8日，2023年湖南国际文化旅游节新闻发布会在长

当机器人日益应用于制造业、商贸物流、医疗健康、社区服务等领域，并与

首届文化强国建设高峰论坛6月7日召开本次主论坛主题为推进文化自信自强

近两年来，一些废品回收企业推出“互联网+废品回收”模式，手机预约下

央行官网6月7日更新数据显示，截至5月末，央行黄金储备报6727万盎司，

据中证报6月7日报道，新兴生物技术公司IovanceBiotherapeutics(IOVA US

在外打工受伤没劳动合同申请赔偿的方式是：收集证明存在劳动关系的材料

具体来说，居民人均可支配收入增长了3 8%，实际增长2 0%；而消费支出下

6月8日，两市股指呈现震荡分化走势，沪指午后一度直线上攻，创业板指盘

天能股份近期接受投资者调研时表示，在公司新一轮战略升级规划中，储能

正源股份（SH600321，收盘价：1 7元）6月8日晚间发布公告称，公司2022

九联科技（SH688609，收盘价：10 47元）6月8日晚间发布公告称，公司202

长江电力6月8日大宗交易成交1000万股，成交额2 27亿元，占当日总成交额

爱旭股份6月8日大宗交易成交213 82万股，成交额7253 69万元，占当日总

助力国家食品安全示范城市创建，2023年上半年若羌县市场监管局加大食品

6月8日上午，盐城盐都成功举办楼宇经济招商推介会。此次推介会以“楼聚

海南乡宴上的人情味

海南乡宴上的人情味原标题：文旅周刊|海南乡宴上的人情味编者按当一些

全国第三届老年书法作品展海口开展 展出271件作品|世界微头条

全国第三届老年书法作品展海口开展展出271件作品新海南客户端、南海网6

全国第三届老年书法作品展海口开展展出271件作品|世界微头条