实际使用感受如何？来看看这份《人工智能大模型体验报告》

2023-06-02 01:02:25 来源：经济参考网

近年来，人工智能技术迎来了新一轮大变革，其中由OpenAI开发的ChatGPT在推出短短2个月后便成为了月活破亿的应用。随着海外科技巨头微软、谷歌、Meta等加大投入，国内科技企业如百度、华为、阿里等纷纷布局，人工智能大模型的发展日新月异。

(相关资料图)

为直观感受我国当前主流科技企业所推出的大模型产品的现状、优势和特点，新华社研究院中国企业发展研究中心于今年4月启动了人工智能产业创新活力研究。本次研究设置了用户体验项目，抓取了05月22日—05月26日数据，通过人机互动提问等形式，对国内主流大模型进行使用体验评测，旨在为科技企业调整努力方向提供参考。

在综合指数评价方面，本次评测选取4大维度（基础能力、智商测试、情商测试、工作提效能力）、36个子能力，共300个问题，对目前主流大模型产品进行测试，并邀请相关专家组成评测团队深入分析各个产品的语义理解、知识储备、逻辑能力等，最终得出各厂商的大模型综合指数评价。

在评价规则上，课题组以各个大模型对参与测评的题目回答完成度，进行了综合考量，其中评测规则分为：答案较为完美，内容可在实际场景中直接使用；基本可用，可在实际场景中使用；调整可用，但需人工进行调整后方可使用；大略可用，需要较多人工调整方可使用；不可用，答非所问、语言不通等五个层级。

注：基于评测条件、评测时间等限制，本次评测结果存在一定主观性，未来将进一步优化完善评测模型，提供更精确结果。

通过围绕四个维度的综合测试，课题组发现，由OpenAI开发的Chat-GPT系列模型各项指标表现优异，且Chat-GPT4.0版本各项能力在3.5版本的基础上均有一定程度提升。而由百度开发的人工智能大模型文心一言表现较为抢眼，是目前国内自主研发的大模型中具有优势的产品。其余大模型产品也在基础能力方面表现优良，但面对较复杂的工作内容或情商环境仍有不同程度的进步空间。

针对各维度能力测评，该报告还给出了相应的案例展示和分析。

在基础能力部分，百度文心一言表现最为抢眼，讯飞星火、阿里巴巴通义千问、智谱ChatGLM表现优良；商汤商量、Vicuna-13B表现尚佳。

在智商测试部分，百度文心一言在该环节意外超过ChatGPT3.5，表现突出，阿里巴巴通义千问分数接近GPT3.5，商汤商量、讯飞星火、智谱ChatGLM表现尚佳；Vicuna-13B表现有待改进。

在情商测试部分，百度文心一言表现最佳；阿里巴巴通义千问与讯飞星火表现优良；商汤商量、智谱ChatGLM表现尚可；Vicuna-13B表现一般。

在工作提效部分，百度文心一言与智谱ChatGLM最佳，讯飞星火次之；阿里巴巴通义千问及Vicuna-13B表现尚可；商汤商量表现一般。

研究发现，人工智能与各行业的深度融合是促进产业升级和转型的重要方式之一，“大模型+行业”的发展应用尤为重要。目前大模型在金融、工业、医疗等领域已经取得了显著的成果，如何为行业领域提供更为精准、更为高效的解决方案，成为大模型厂商未来弯道超车的机会。

报告指出，随着人工智能的地位和作用越来越重要，政府、企业和社会需要共同努力，各大厂商应投入更多资源，头部企业可以持续发力自研大模型，而专注于解决方案的行业厂商可以考虑通过深耕行业来彰显特色。

研判该报告的测评结果，浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林建议，国内大模型发展应从两方面着力，一方面是大语言模型，中文并非ChatGPT的强项，OpenAI主业在英语，所以中文大语言模型对于中国市场还是有发展空间的；另一方面则是在细分领域应用，比如编程、专业知识问答、中文PPT制作等，这些细分的功能领域才是未来大模型真正需要关注的领域，也是从单个应用转变为生态应用的关键。

扫码查看

AI大模型体验报告

↓↓↓

关键词：

精选导读

【图片新闻】兰州市城关区酒泉路小学举办第十三届校园文化艺

5月31日下午，兰州市城关区酒泉路小学举办第十三届校园文化艺术节。艺术节以童心逐梦快乐成长为主题，整场

发布时间： 2023-06-01 23:53

要闻 2023-06-01

【短讯】替客户炒股近6年、成交逾七千万，还亏了145万！证监

【短讯】替客户炒股近6年、成交逾七千万，还亏了145万！证监局罚单来了。新闻资讯提供最新、最及时的新闻服

发布时间： 2023-06-01 23:32

要闻 2023-06-01

速看：沉默的15分钟普通话版沉默的15分钟国语版

今天来聊聊关于沉默的15分钟普通话版，沉默的15分钟国语版的文章，现在就为大家来简单介绍下沉默的15分钟普

发布时间： 2023-06-01 22:17

要闻 2023-06-01

塔克拉玛干沙漠腹地首个大型光伏电站并网发电|世界观点

5月31日，从我国第一大沙漠——塔克拉玛干沙漠中心深处传来喜讯，由中国电建所属山东电建一公司参建的新疆

发布时间： 2023-06-01 21:53

要闻 2023-06-01

北京土拍上演“摇号大战” 4宗宅地出让揽金约95亿元|

6月的第一天，北京土拍市场再“开锣”，共有4宗住宅用地出让，收揽土地出让金95 1725亿元。其中，3宗地通过

发布时间： 2023-06-01 20:08

要闻 2023-06-01

热点推荐

实际使用感受如何？来看看这份《人工智能大模型体验报告》

近年来，人工智能技术迎来了新一轮大变革，其中由OpenAI开发的ChatGPT在推出短短2个月后便成为了月活破亿的

发布时间： 2023-06-02 01:02

IT 2023-06-02

全球热推荐：男子耍酒疯称父母是人大代表、政协委员，警方通

情况通报网传聚银时代附近一男子酒后“耍酒疯”，在被公安民警传唤过程中，自称“我爸是人大代表”“我妈是

发布时间： 2023-06-02 00:50

IT 2023-06-02

备注网名大全（好听的备注名称大全）环球速看

注网名大全，好听的备注名称大全很多人还不知道，现在让我们一起来看看吧！1、1 不要毒

发布时间： 2023-06-02 00:49

国内 2023-06-02

每日讯息!少年志｜“六一”国际儿童节，在文学作品里回忆童

“旧游无处不堪寻。无寻处，惟有少年心。”年少时光，总是让人无比留恋。童年，可谓是人生的底色。今天是“

发布时间： 2023-06-02 00:49

国内 2023-06-02

上海华瑞银行：取消发行“23上海华瑞银行CD425”

取消发行“23上海华瑞银行CD425”

发布时间： 2023-06-02 00:34

科技 2023-06-02

【图片新闻】兰州市城关区酒泉路小学举办第十三届校园文化艺

5月31日下午，兰州市城关区酒泉路小学举办第十三届校园文化艺术节。艺术节以童心逐梦快乐成长为主题，整场

发布时间： 2023-06-01 23:53

要闻 2023-06-01

天天快看点丨1日上涨概率较大，东田微缩量上涨，技术面值得

“策略之王”监测到该股股5日、10日均线成多头排列，成交量缩小，上涨趋势有望延续。那么东田微是否可以继

发布时间： 2023-06-01 23:31

IT 2023-06-01

【短讯】替客户炒股近6年、成交逾七千万，还亏了145万！证监

【短讯】替客户炒股近6年、成交逾七千万，还亏了145万！证监局罚单来了。新闻资讯提供最新、最及时的新闻服

发布时间： 2023-06-01 23:32

要闻 2023-06-01

寓言故事大全100集睡前故事_寓言故事大全|天天热门

1、100字寓言故事：聪明的公鸡　　一天，公鸡出来在草地散步，正好被一只狐狸看见了。2、狐狸悄悄的跟在公

发布时间： 2023-06-01 23:29

国内 2023-06-01

实现新突破！我市新增自治区知识产权优势企业培育单位10家

近日，广西市场监管局公布2023年度自治区知识产权优势企业培育单位名单，我市的普瑞斯矿业（中国）有限公司

发布时间： 2023-06-01 23:34

科技 2023-06-01

党员教师年度工作总结党员工作总结教师世界要闻

今天来聊聊关于党员教师年度工作总结，党员工作总结教师的文章，现在就为大家来简单介绍下党员教师年度工作

发布时间： 2023-06-01 23:20

科技 2023-06-01

2022年邯郸磁县线下购车补贴活动时间_每日视讯

邯郸磁县购车补贴活动时间：2022年9月15日至10月31日拓展信息：补贴标准购买汽车裸车价格10万元以下的，给

发布时间： 2023-06-01 22:54

国内 2023-06-01

公司网站_关于公司网站的介绍-热点在线

1、公司网站是公司在互联网上进行网站建设和形像宣传的平台，相当于一个企业的网络名片。2、互联网真正的内

发布时间： 2023-06-01 22:51

IT 2023-06-01

重点聚焦!金花股份5000万于陕西设实业子公司，含房地产经纪

企查查APP显示，近日，陕西域源欣实业有限公司成立，法定代表人为陈柏含，注册资本5000万元人民币，经营范

发布时间： 2023-06-01 22:38

IT 2023-06-01

速看：沉默的15分钟普通话版沉默的15分钟国语版

今天来聊聊关于沉默的15分钟普通话版，沉默的15分钟国语版的文章，现在就为大家来简单介绍下沉默的15分钟普

发布时间： 2023-06-01 22:17

要闻 2023-06-01

江西首个国家电网“电力爱心教室”在兴国授牌-每日观察

5月31日，国网江西省电力有限公司在赣州市兴国县古龙岗中心小学举行省内首个国家电网“电力爱心教室”授牌

发布时间： 2023-06-01 22:00

国内 2023-06-01

塔克拉玛干沙漠腹地首个大型光伏电站并网发电|世界观点

5月31日，从我国第一大沙漠——塔克拉玛干沙漠中心深处传来喜讯，由中国电建所属山东电建一公司参建的新疆

发布时间： 2023-06-01 21:53

要闻 2023-06-01

今日看点：广东竹产业蓬勃发展 “剑指”超千亿元产值

广东清远英德市西牛镇的竹林陈骥旻摄中新网清远6月1日电题：广东竹产业蓬勃发展“剑指”超千亿元产值作者程

发布时间： 2023-06-01 21:32

科技 2023-06-01

每日关注!smart精灵#1正式公布在华5月交付量

[本站资讯]6月1日，smart公布smart精灵 1在华5月交付量，共计交付新车2,624台。据了解，为均衡满足中欧市场

发布时间： 2023-06-01 21:14

汽车 2023-06-01

或15万起/10月量产 iCAR 03内饰官图

[本站新车官图]近日，iCAR03的内饰官图正式曝光。在此前上海车展上iCAR03正式亮相，该车定位于硬派纯电SUV

发布时间： 2023-06-01 21:02

汽车 2023-06-01

实际使用感受如何？来看看这份《人工智能大模型体验报告》

精选 导读

热点 推荐

每日热点

精选导读

热点推荐