五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

搜狐科技 2023-06-08 21:07:08

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。AI大模型数学功底到底如何？比人类“聪明”吗？搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。

在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

(资料图片仅供参考)

测试结果显示，这五款大模型在答数学题的能力上差异显著。

最“聪明”的讯飞星火答对了5题，正确率50％。百度文心一言和ChatGPT“紧跟其后”，答对了4题，正确率为40％。

360智脑和通义千问则“全军覆没”，一道题也没答对，交了白卷。

值得一提的是，昨天搜狐科技也用五款大语言模型产品，对高考作文全国卷（甲）进行了测试，并邀请了5位语文名师打分。

打分结果显示，ChatGPT高考作文得分最高，文心一言、讯飞星火得分稍低，但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题，对大模型能力考察的维度并不尽相同。但巧合的是，不擅长写作文的360智脑和通义千问，似乎也不擅长做数学题。

通过这两次高考题测试，也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”，那么360智脑和通义千问则是妥妥的“学渣”。

附测试中使用的高考数学题题目：

1.不等式|x-2|<1的解集为__

2.a=(2,3)，b=(-1,2)，则a·b=__

3.首项为3，公比为2的等比数列的前六项和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域为__

6.复数z=1-i，则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π，则m=__

8.三角形的三边长为a=4，b=5，c=6，则sinA=__

9.某地一年四个季度的GDP(亿元)，第一季度GDP为232，第四季度GDP为241，且四个季度的GDP逐季度增长，中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正数k的最大值为__

责任编辑：

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

南康区气象台更新雷电黄色预警信号【III级/较重】【2023-06-08】|天天实时

世界热推荐：如何拿第一？一汽奔腾NAT青岛节能挑战赛冠军访谈

武汉新洲：考生到考场发现证件遗忘在车上，新洲警方紧急帮助寻回-世界热资讯

环球快资讯丨【融中|要闻回顾】中原银行股权频流拍 上汽大众被传永久关停第一工厂

苹果iphone16有几款

遂宁市应急管理综合行政执法业务能力培训暨“强安2023”监管执法行动推进会召开 精彩看点

夜场十场比赛均“难看”，法网组委会这次如意算盘算打空了？ 世界速看

女秘书（关于女秘书的基本详情介绍）

日推科幻moc分享---@LBKeetA的五千米级地球发动机

特斯拉股价九连涨：创前年以来纪录，五月市值暴涨 1255亿美元

京媒：栾利程孙晨然大概率离开首钢 曾凡博在美国特训

年产20万吨锂电正极材料项目签约临武县 总投资80亿元

环球热点！岁月留声，“声生不息”——音乐交流唤醒两岸共同文化记忆

中国电建水电十局承建的老挝怀拉涅河水电站机组实现“三天两投”

伟思医疗:公司运动康复机器人产品线符合神经康复智能化、标准化的康复需求 属于国内领先水平

尖山街居家养老中心启用 天津再添一家养老服务综合体-世界热议

华立科技：公司游戏游艺设备产品涉及VR技术主要为模拟体验类产品_环球新要闻

佳力图06月07日主力资金大幅流出

【环球速看料】标普500指数突破4200点大关 接下来呢？

百洋医药：公司目前在青岛有约10家药店，暂无拓展开店的计划|每日精选

新型冠状病毒mRNA疫苗Ⅱ期临床试验启动

热门：中国生物：新型冠状病毒mRNA疫苗Ⅱ期临床试验启动

香港浸会大学研究生入学指南（珠海校区）

焦点精选！北京居住区新能源车充电试点！服务费将不高于0.5元

组图丨爱心送考再出发 圆梦护航守初心 焦点关注

和胜股份：在项目研发前沿领域一直与宁德时代深度合作|今日精选

3辆全新特斯拉超跑竟被遗弃中国码头13年！原车主身份不简单 世界百事通

蔚领属于什么级别的车（蔚领车属于什么车型？）

每日讯息!沙特额外减产无法盖过需求忧虑! 国际油价延续跌势

三德科技：针对无人化智能装备产品推出类似汽车行业“日常运维+专业检修”服务模式 已有项目落地 世界观热点

研学游又"火"了——"全链"发力，打造"游学江苏"品牌-焦点速看

中越国际联运冷链运输正式启动

【环球时快讯】【收评】菜油日内上涨0.10% 机构称油脂反弹乏力

违法销售产自日本核辐射区食品，广东一百货公司被罚1万元 全球今热点

如何把握中特估、TMT两主线 看看富国基金的这只ETF

天天讯息：青岛双星：公司目前主要销售渠道包括车厂配套渠道、经销商替换渠道及电商渠道，未来公司将会持续加大在新能源配套渠道及电商渠道的投入

速看：寻找中国制造·隐形冠军——新声科技，以智慧聆听变革助听器产业

win7怎么改文件后缀名 win7怎么修改文件后缀名

最完美的iOS！iOS 17新功能盘点：让iPhone更人性化了

天天看点：华为联合IEEE Kazakhstan Subsection共同发布HPC无损以太和AI Fabric网络技术白皮书

昌吉市吉祥花园属于哪个街道_吉祥花园房价|环球头条

海联金汇：公司净利率相对较低，主要是公司部分产品的毛利率相对较低导致|每日热讯

微信电脑版视频打不开怎么回事（微信电脑版视频打不开咋办） 时快讯

全球快播：光大银行举办推进粮食安全暨种业振兴会议

焦点快播：江西浮梁一餐饮店突发爆炸致一名女子受伤，数十米外商户屋顶被震坏

全球微速讯：我州各地多举措抗旱保粮守好“粮袋子”

全球今日报丨机构：房企融资规模仍在下降 海外债有新发

客观唯心主义和主观唯心主义的区别是什么意思_客观唯心主义和主观唯心主义的区别是什么

四川南充：街头巷尾一抹抹“交警黄”全力护考-天天新要闻

长安汽车回应供应商申诉其扣除货款10%：内容系不实信息 热文

ST康美（600518）6月7日主力资金净卖出4340.42万元

环球观察：禅游科技(02660.HK)跌超10%，截至发稿，跌10.23%，报3.86港元，成交额1424.41万港元

中文在线等26家单位联合发布业内首份AIGC数据版权倡议书

2023江苏—德国技术创新合作对接交流会暨江苏—德国协同创新服务中心启动仪式成功举办

黟县柯村镇：多举措推进“党建+优化营商环境”深度融合

汉滨区三院：急救知识进企业，医疗服务暖人心

全球实时：23旭越惠诚2优先A票面利率为2.4200%

快报：脸书正试图帮助其社区谈论种族问题

世界最新：上常从容与信言诸将能不文言文翻译通假字_上常从容与信言诸将能不,各有差翻译

如何看qq坦白说是谁发的_怎么看qq坦白说是谁发的

河南省部分地区麦收遭遇“烂场雨” 多家保险公司纷纷开展夏粮理赔工作

海关总署：前5个月一般贸易进出口比重提升 环球关注

安土重迁的意思解释_安土重迁的意思

传苹果新MacBook Air由鸿海、广达组装 瑞仪提供模组

一日7位分析师被罚，什么情况？研报结论缺乏合理依据成共性，这些券商先后被罚 天天报资讯

工作娱乐两不误！宁美酷睿i5主机跌至2049元

半决赛决出2席！德约科维奇3-1逆转，将遇头号种子！5号种子0-3_天天微资讯

环球要闻：创业板指半日跌1.32% CPO等概念表现活跃

前行者演员列表聂远_前行者演员列表

权威发布！2023年上海高考作文题来啦！|环球热文

今日热讯：国科微：公司视频编码系列芯片产品可应用于机器视觉领域

滞困异星黎明EXTRA-TERRESTRIAL种子是什么 环球报资讯

微资讯！斯诺克新星赵心童为涉赌遭禁赛道歉

住建局：全力做好高考供水保障工作 今日热议

减脂期可以吃的速食|天天亮点

大丰实业06月06日获沪股通增持22.29万股

世界头条：绿城管理控股(09979)：翁美仪获委任为联席公司秘书及法律程序文件代理人

海口美安科技新城施工忙 47个在建项目拉动园区投资|快播报

环球快资讯丨【融中|要闻回顾】中原银行股权频流拍上汽大众被传永久关停第一工厂

遂宁市应急管理综合行政执法业务能力培训暨“强安2023”监管执法行动推进会召开精彩看点

夜场十场比赛均“难看”，法网组委会这次如意算盘算打空了？世界速看

京媒：栾利程孙晨然大概率离开首钢曾凡博在美国特训

年产20万吨锂电正极材料项目签约临武县总投资80亿元

伟思医疗:公司运动康复机器人产品线符合神经康复智能化、标准化的康复需求属于国内领先水平

尖山街居家养老中心启用天津再添一家养老服务综合体-世界热议

【环球速看料】标普500指数突破4200点大关接下来呢？

组图丨爱心送考再出发圆梦护航守初心焦点关注

3辆全新特斯拉超跑竟被遗弃中国码头13年！原车主身份不简单世界百事通

三德科技：针对无人化智能装备产品推出类似汽车行业“日常运维+专业检修”服务模式已有项目落地世界观热点

违法销售产自日本核辐射区食品，广东一百货公司被罚1万元全球今热点

如何把握中特估、TMT两主线看看富国基金的这只ETF

微信电脑版视频打不开怎么回事（微信电脑版视频打不开咋办）时快讯

全球今日报丨机构：房企融资规模仍在下降海外债有新发

长安汽车回应供应商申诉其扣除货款10%：内容系不实信息热文

海关总署：前5个月一般贸易进出口比重提升环球关注

传苹果新MacBook Air由鸿海、广达组装瑞仪提供模组

一日7位分析师被罚，什么情况？研报结论缺乏合理依据成共性，这些券商先后被罚天天报资讯

滞困异星黎明EXTRA-TERRESTRIAL种子是什么环球报资讯

住建局：全力做好高考供水保障工作今日热议

上网本是什么意思_上网本是什么世界观察

武汉城市职业学院是公办还是民办_武汉城市职业学院视焦点讯

每日视讯：主题乐园遭遇旅游乱象迪士尼无奈出台禁令

兆龙互连：公司在云计算和数据中心领域客户最终能取得订单的金额世界最资讯