您的当前位置:首页>资讯 > 正文

新华社研究院发布国产大模型报告:讯飞星火“智商”位列榜首

  • 2023-08-13 22:57:22 来源:红网


【资料图】

报告显示,讯飞星火以总分1013分位列本次国产主流大模型测评榜首位。

红网时刻新闻8月13日讯(记者 陈雪骅 通讯员 许可亮)8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一。

《报告》认为,讯飞星火认知大模型具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力),拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;在即将到来的8月15日,会在代码能力上实现重大突破,并在多模态交互能力上升级。

课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。

《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。

标签:

推荐阅读

新华社研究院发布国产大模型报告:讯飞星火“智商”位列榜首

报告显示,讯飞星火以总分1013分位列本次国产主流大模型测评榜首位。红

湖南持续激活“夜经济” 带动暑期消费火热

全面做好“稳增长、促消费”工作,湖南各地持续激活夜经济,人流、场景

最新预警丨受降雨影响 怀化市局地可能发生山洪灾害

红网时刻新闻8月13日讯(记者何青通讯员周鑫)根据湖南省气象台2023年8

打击黄牛、延长服务、无理由退货,湖南暑期旅游推出新举措

今年暑期,为增强游客的体验感,湖南各大景区相继推出了创新举措。8月1

未来三天湖南多阵雨 其中今晚湘中、湘南局地暴雨

湖南省气象台预计今晚(13日)至16日白天,全省大部地区多阵雨或雷阵雨

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。亚洲金融网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。 联系方式:8 86 239 5@qq.com,我们将及时沟通与处理。

资讯