Board logo

标题: [电脑] 新华社:百度文心一言综合排名国内第一 智商超过ChatGPT 3.5 [打印本页]

作者: jeffcai    时间: 2023-6-10 17:47     标题: 新华社:百度文心一言综合排名国内第一 智商超过ChatGPT 3.5

近日,新华社研究院中国企业发展研究中心对主流大模型产品进行了体验评测,发布了《人工智能大模型体验报告》。

《报告》显示,百度文心一言总得分位居国内第一,并在基础能力、智商、情商、工作提效等维度均获国内第一。

在智商测试部分,百度文心一言意外超过ChatGPT3.5,表现突出,位居排名第二,仅次于GPT4。

在综合指数评价方面,本次评测选取4大维度(基础能力、智商测试、情商测试、工作提效能力)、36个子能力,共300个问题,对目前主流大模型产品进行测试。

同时,研究院还邀请相关专家组成评测团队深入分析各个产品的语义理解、知识储备、逻辑能力等,最终得出各厂商的大模型综合指数评价。

综合评测结果显示:ChatGPT系列模型各项指标表现优异,Chat-GPT4.0版本各项能力在3.5版本的基础上均有一定程度提升。

由百度开发的人工智能大模型文心一言是目前国内自主研发的大模型中具有优势的产品。其余大模型产品也在基础能力方面表现优良,但面对较复杂的工作内容或情商环境仍有不同程度的进步空间。
作者: 鬼冢英吉    时间: 2023-6-10 17:50

posted by wap, platform: iPhone
应该增加一个讲政治水平的测试
作者: amour123    时间: 2023-6-10 17:55

posted by wap, platform: iPhone
哈哈哈哈哈简中世界就是骗
作者: aso    时间: 2023-6-10 18:06

posted by wap, platform: iPhone
简中除了谎言还剩点什么。。。。
作者: wayne_qwy    时间: 2023-6-10 18:19

posted by wap, platform: MAC OS X
掩耳盗铃?自欺欺人?
作者: playboy23    时间: 2023-6-10 18:23

posted by wap, platform: iPhone
这种内部评测就是个笑话,中国还是世界上最大的民主国家呢
作者: 0:00    时间: 2023-6-10 18:24

posted by wap, platform: Nokia
怎么了水区进不了,这变水区了??
作者: qazqaz    时间: 2023-6-10 18:26

posted by wap, platform: iPhone
国外很多开源的模型现在日新月异,进步非常快,所以什么诛心一言堂有进步了也出奇啦!
作者: 战岚    时间: 2023-6-10 18:44

赢点在出题人
作者: 得过且过    时间: 2023-6-10 18:45

posted by wap, platform: Android
还说自己不是发达国家水平?
作者: LTFYH    时间: 2023-6-10 18:54

posted by wap, platform: VIVO
百度搞这个自己不脸红吗
作者: somesun    时间: 2023-6-10 18:54

posted by wap, platform: Chrome
问题由百度准备
作者: 波斯SAMA    时间: 2023-6-10 19:21

posted by wap, platform: iPhone
傻逼百度就是占着茅坑不拉屎的典范
作者: manvvvv    时间: 2023-6-10 19:31

各种骗各种编故事,前几天还一堆人毫无根据的编老黄要来。
作者: 20150000    时间: 2023-6-10 20:28

对   瘫子在坟地里跑步跑了第一
作者: zhangbin0806    时间: 2023-6-10 20:31

posted by wap, platform: iPhone
支持数码区兼任水区
作者: 奎子    时间: 2023-6-10 21:03

posted by wap, platform: Android
讲政治,这情商就低不了
作者: Alloyo    时间: 2023-6-11 02:56

posted by wap, platform: Chrome
先让猫爱国再说
作者: 骊苏    时间: 2023-6-11 04:00

posted by wap, platform: Android
专家组组长李彦宏
作者: xuziyu2006    时间: 2023-6-11 11:55

posted by wap, platform: Android
党性测试满分通过
作者: zo    时间: 2023-6-11 12:08

posted by wap, platform: iPhone
试了下写高考中文还将就……
作者: ffcactus    时间: 2023-6-11 12:17

posted by wap, platform: iPhone
什么年代了还如此自欺欺人
作者: aso    时间: 2023-6-11 12:29

posted by wap, platform: iPhone
引用:
原帖由 @zo  于 2023-6-11 12:08 发表
试了下写高考中文还将就……
喷了,你这种问题都没准备的话,百度的值守万人团就全是猪喽?
作者: shinraku    时间: 2023-6-12 01:34

posted by wap, platform: iPhone
各厂商记得响应号召推出各种换皮文心一言的产品。
作者: ppigadvance    时间: 2023-6-12 11:49

出来走两步?
作者: 泄娜    时间: 2023-6-12 14:58

总比科大讯飞排名第一那个野鸡评测像真的吧。
作者: 测试一下    时间: 2023-6-12 15:00

测试可以量身定制~
作者: zhao    时间: 2023-6-12 19:19

posted by wap, platform: Samsung
直接抄的,还好意思说排名第一。
作者: 最后生还者    时间: 2023-6-12 19:29

能要点脸吗
作者: 武松    时间: 2023-6-12 19:41

posted by wap, platform: iPhone
引用:
原帖由 @zhao  于 2023-6-12 19:19 发表
直接抄的,还好意思说排名第一。
抄倒不是抄的,和gpt是同一个爹,都是transformer的后代分支,技术路线略有不同,和meta都属于一个技术分支。

语料喂多了,表现在某些方面不比gpt3.5差也正常。

但现在已经证明了,gpt这个分支路线是最好的解决方案,其他无论google还是meta的分支都不如gpt。

最关键的是,gpt 5模型已经训练完成了,微软在等待一个合适的时机发布,meta,google,包括百度落后两个身位了已经
作者: 轻轻聆听    时间: 2023-6-13 04:26

不管你信不信,只要小日本相信就可以了
作者: sonic4747    时间: 2023-6-13 08:16

脸皮对于它们来说是个屁。
作者: 神秘的陌生人    时间: 2023-6-13 16:23

这还收着在呢。还专门说了是3.5,又强调了4.0有长足进步。要我说干脆就不写版本号
反正吃瓜群众也不懂,就知道百度文心超过了GPT
作者: 三十二月    时间: 2023-6-13 17:38

posted by wap, platform: 小米 红米
我始终我觉得这玩意就是用的开源的gpt3,我搜索带“花”字的诗词,蹦出来10首没有一个对的,和gpt3的错误答案都一样




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0