ChatGPT-4在创造力测试中表现不俗

智能AI
TIME
2024-03-04 16:18
科技日报
分享

  科技日报北京3月3日电 美国阿肯色大学科学家开展了一项最新研究,让151名人类参与者与人工智能(AI)工具ChatGPT-4在3项测试中进行对决,以评估二者的发散思维。结果显示,AI的表现优于人类。相关论文发表于最新一期《科学报告》杂志。

  发散思维是创造性思维的衡量指标,其特点是能对没有预期解决方案的问题提出独特的答案。在最新研究中,GPT-4提供了比人类参与者更新颖、更精细的答案。

  最新研究使用的3项测试分别是“替代用途任务”“结果任务”及“发散联想任务”。“替代用途任务”要求参与者针对绳索或叉子等日常物品,提出创造性用途;“结果任务”要求参与者想象假设情况的可能结果,如人类不再需要睡眠会怎么办;“发散联想任务”则要求参与者提供10个语义上尽可能遥远的名词。“狗”和“猫”之间的语义距离不大,而“猫”和“本体论”等词之间的语义距离很大。

  研究团队对人类和AI工具回答问题的数量、长度和单词间的语义差异进行了评估。结果发现,在每一项发散性思维任务上,GPT-4提供的答案都比人类提供的答案更具独创性,且更精确。换言之,在一整套发散性思维任务中,GPT-4都表现出了更高的创造力。

  研究负责人之一、阿肯色大学心理学博士生肯特·休伯特表示,最新研究也有一些需要注意的地方,如研究中使用的指标都是对创造潜力的衡量,但参与创造性活动或获得成就是衡量创造能力的另一个方面。此外,AI依赖人类用户的帮助,除非得到提示,否则AI的创造力一直处于停滞状态。

  尽管如此,研究团队强调,大型语言模型正在迅速发展,并以前所未有的方式超越人类。它们能否取代人类的创造力还有待观察。但不管怎样,让AI作为灵感工具,为人类的创造性活动提供帮助已是指日可待。(记者刘霞)


THE END
免责声明:本文系转载,版权归原作者所有;刊载之目的为传播更多信息,如内容不适请及时通知我们。

相关热点

  作为我国卫星互联网运营商,中国卫通将向市场提供更多的消费级卫星互联网产品,联合航空公司推出航空卫星互联网产品流量套餐。  2月26日,中国航天科技集团有限公司在...
互联网
  3月4日24时,国内成品油新一轮调价窗口将开启。此次油价预计上涨0.10-0.12元/升,普通轿车加一箱油成本将增加5-6元。  3月4日,国内第10个工作日参考原油变化率2.90%,预...
汽车

相关推荐

1
3