科技日報北京5月17日電 (記者劉霞)加拿大科學(xué)家在16日出版的《放射學(xué)》雜志上刊登新論文稱,最新版本的ChatGPT通過了美國放射學(xué)委員會的考試,突出了大型語言模型的潛力,但它也給出了一些錯誤答案,表明人們?nèi)孕鑼ζ涮峁┑拇鸢高M行核查。
為評估ChatGPT在美國放射學(xué)委員會考試問題上的表現(xiàn)并探索其優(yōu)勢和局限性,多倫多大學(xué)研究人員首先測試了基于GPT-3.5的ChatGPT的表現(xiàn)。研究團隊使用了150道選擇題,這些選擇題與加拿大皇家學(xué)院和美國放射學(xué)委員會考試的風(fēng)格、內(nèi)容和難度相當(dāng)。這些問題不包括圖像,分為低階(知識回憶、基本理解)和高階(應(yīng)用、分析、綜合)思維問題。高階思維問題可進一步細分為影像學(xué)表現(xiàn)描述、臨床管理、計算和分類、疾病關(guān)聯(lián)。
研究人員發(fā)現(xiàn),基于GPT-3.5的ChatGPT的正確率為69%,接近70%的及格線。該模型在低階思維問題上表現(xiàn)相對較好,正確率為84%,但回答高級思維問題時表現(xiàn)不佳,正確率僅為60%。而性能更優(yōu)異的GPT-4的正確率為81%,且在高階思維問題上的正確率為81%,遠好于GPT-3.5。但GPT-4在低階思維問題上的正確率僅為80%,答錯了12道題,而GPT-3.5全部答對了這些題目,這引發(fā)了研究團隊對GPT-4收集信息的可靠性的擔(dān)憂。
這兩項研究都表明,ChatGPT會有提供不正確答案的傾向,如果僅僅依靠它獲取信息,非常危險,因為人們可能意識不到其給出的答案是不準(zhǔn)確的,這是它目前面臨的最大的問題。(來源:科技日報)
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 聯(lián)合國秘書長歡迎黑海港口農(nóng)產(chǎn)品外運協(xié)議再延長兩個月
- 北二環(huán)沿線布局元宇宙產(chǎn)業(yè)聚集區(qū)
- 豐臺王佐鎮(zhèn):黨建引領(lǐng)織細治理網(wǎng)格 助力銀發(fā)居民幸福無憂
- 北京豐臺區(qū)“點靚涼水河”千年古河畔將建起城市活力開放空間
- 專項整治不停歇 西城廣內(nèi)街道持續(xù)推進消防大排查
- 拉美多國緊急應(yīng)對登革熱
- 朝陽區(qū)組團“出?!闭猩?今年前三月新設(shè)外資企業(yè)87家
- 中國—中亞峰會新聞中心啟用
- 首爾中國文化中心“人在草木間——茶和天下·雅集”活動拉開帷幕
- 韓國經(jīng)濟持續(xù)放緩