財聯(lián)社7月17日訊(編輯 牛占林)據(jù)美國蒙大拿大學的一項最新研究顯示,在創(chuàng)造性思維測試方面,人工智能(AI)聊天機器人ChatGPT可以與排名前1%的人類思想家相匹配。
研究人員對ChatGPT使用了托倫斯創(chuàng)造性思維測試,這是一種最常用的創(chuàng)造力測試方法,并記錄了ChatGPT給出的8份答案。然后還提交了由24名蒙大拿大學學生組成的對照組的答案。
這些分數(shù)與參加托倫斯創(chuàng)造性思維測試的2700名全國大學生進行了比較。所有提交的答案都是由學術測試服務機構評分的,而該機構并不知道人工智能也參與其中。
值得注意的是,托倫斯創(chuàng)造性思維測試是受保護的專有材料,因此ChatGPT也不能通過在互聯(lián)網(wǎng)或公共數(shù)據(jù)庫中訪問有關測試的信息來進行“作弊”。
研究作者、蒙大拿大學商學院臨床助理教授Erik Guzik指出,研究結果令人驚訝,有些回答很新奇。Guzik的研究領域包括企業(yè)家精神和創(chuàng)造力經(jīng)濟方面。
Guzik表示:“對我來說,創(chuàng)造力就是用不同的方式做事。我喜歡企業(yè)家精神的一個定義是,作為一名企業(yè)家,要以不同的方式思考。所以,人工智能可以幫助我們將創(chuàng)造性思維應用到商業(yè)和創(chuàng)新過程中,這讓我著迷?!?/p>
托倫斯思維測試包含兩種不同的評估:一種是文字評估,一種是圖像評估。兩者都測量發(fā)散性思維,或用于產(chǎn)生創(chuàng)造性想法的思維過程。
在文字評估中,會給考生提供圖片或口頭提示,并要求他們以書面形式作答。例如,他們可能會看到一個事件的圖片,并被要求對結果進行假設?;蛘呦蛩麄冋故疽粋€產(chǎn)品,并詢問改進它的方法。
他們的回答被用來評估三個心理特征:流暢性(相關想法的數(shù)量)、獨創(chuàng)性(想法的與眾不同)、靈活性(不同類型想法的多樣性)。
而圖像評估要求考生畫出答案。例如,他們可能會被要求完成一幅畫。除了流暢性和獨創(chuàng)性外,圖形測試還評估細化和標題的抽象性等。
在這項研究中,ChatGPT的回答在流暢性和獨創(chuàng)性方面都處于前1%。但在靈活性、產(chǎn)生不同類型和類別想法的能力方面有所不足。
Guzik表示:“對于ChatGPT和GPT-4,我們首次表明它在創(chuàng)意方面的表現(xiàn)位居前1%?!彼芨吲d地注意到,他的一些蒙大拿大學的學生也進入了前1%。然而,ChatGTP的表現(xiàn)超過了全國絕大多數(shù)大學生。
Guzik補充說:“我們都在對ChatGPT進行探索,我們注意到它做了一些我們沒有想到的有趣的事情。有些回應新穎而令人驚訝。就在那時,我們決定對它進行測試,看看它到底有多有創(chuàng)意?!?/p>