6月1日消息,ChatGPT 開發(fā)商 OpenAI 5 月 31 日發(fā)布了一份研究論文,闡述了如何解決AI幻覺的新方法。AI幻覺指的是聊天機(jī)器人用編造的信息進(jìn)行回應(yīng)。
據(jù)鳳凰科技報(bào)道,像ChatGPT 和谷歌巴德(Bard)這樣的聊天機(jī)器人會(huì)捏造完全不存在的信息,表現(xiàn)得好像他們?cè)谔咸喜唤^地講事實(shí),這就是 AI 幻覺。
舉個(gè)例子:在谷歌 2 月份為巴德拍攝的宣傳視頻中,這個(gè)聊天機(jī)器人對(duì)詹姆斯?韋伯太空望遠(yuǎn)鏡做出了不真實(shí)的陳述。
最近,ChatGPT 在紐約聯(lián)邦法院的一份文件中引用了“虛假”案例,涉案的紐約律師可能面臨制裁。
OpenAI 研究人員在報(bào)告中稱:“即使是最先進(jìn)的模型也容易生成謊言,它們?cè)诓淮_定的時(shí)刻會(huì)表現(xiàn)出捏造事實(shí)的傾向。這些幻覺在需要多步驟推理的領(lǐng)域尤其是個(gè)問題,因?yàn)橐粋€(gè)邏輯錯(cuò)誤就足以破壞一個(gè)更大的解決方案?!?/p>
為了對(duì)抗 AI 幻覺,OpenAI 找到了一種潛在新策略:訓(xùn)練 AI 模型在推理出答案的每個(gè)正確步驟上給予自我獎(jiǎng)勵(lì),而不僅僅是等到推理出正確的最終結(jié)論時(shí)才給予獎(jiǎng)勵(lì)。研究人員表示,這種方法被稱為“過程監(jiān)督”,與之相反的是“結(jié)果監(jiān)督”,這可能會(huì)訓(xùn)練出更好的可解釋 AI,因?yàn)檫@種策略鼓勵(lì)模型按照更類似人類的“思考”方式進(jìn)行推理。
“檢測(cè)和減輕一個(gè)模型的邏輯錯(cuò)誤或幻覺,是構(gòu)建一致性通用人工智能 (AI) 的關(guān)鍵步驟?!?a href="http://m.sanwutuku.cn/OpenAI_1.html" target="_blank" class="keylink">OpenAI 數(shù)學(xué)論文生成器 (mathgen) 研究員卡爾?科布 (Karl Cobbe) 在接受采訪時(shí)表示。
科布指出,盡管 OpenAI 并非發(fā)明了過程監(jiān)督方法,但該公司正在推動(dòng)其發(fā)展?!斑@項(xiàng)研究的動(dòng)機(jī)是解決幻覺問題,以使模型在解決具有挑戰(zhàn)性的推理問題方面能力更強(qiáng)?!?/p>
科布說,OpenAI 已經(jīng)發(fā)布了一個(gè)附帶的數(shù)據(jù)集,其中包含 80 萬個(gè)人類標(biāo)注,它們用于訓(xùn)練研究論文中提到的模型。
- 并購創(chuàng)造價(jià)值,首屆“并購嘉年華”于上海成功舉辦
- 啟信寶《全國(guó)產(chǎn)業(yè)集群大全》湖州篇:長(zhǎng)三角文旅“頂流”,憑什么是TA?
- 美科技七巨頭遭特朗普關(guān)稅血洗 市值蒸發(fā)14萬億
- 特斯拉市值一夜蒸發(fā)超6400億元,美股科技“七巨頭”陷入調(diào)整區(qū)間
- 阿里巴巴于上海新設(shè)智信普惠科技公司,布局多領(lǐng)域技術(shù)服務(wù)
- 馬化騰短暫登頂中國(guó)富豪榜,騰訊科技與股價(jià)雙輪驅(qū)動(dòng)成關(guān)鍵
- 本地生活賽道:2025年紅海變“血海”,平臺(tái)競(jìng)逐白熱化
- 義烏哪吒小商品熱賣:緊跟《哪吒2》熱潮,一天賣幾百套
- 美恢復(fù)接收中國(guó)包裹,貿(mào)易政策突變引發(fā)物流界震蕩
- DeepSeek或再掀波瀾,可能對(duì)美股市場(chǎng)造成新一輪打擊
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。