女人被狂躁到高潮呻吟小说,蜜桃成人网,女人与公豬交交30分钟视频,久久无码精品一区二区三区,浓毛老太交欧美老妇热爱乱

復(fù)旦新框架破譯甲骨文,大模型SOTA紀(jì)錄被刷新

復(fù)旦大學(xué)研究團(tuán)隊(duì)近期提出一種基于部首與象形分析的可解釋甲骨文破譯框架,在公開基準(zhǔn)數(shù)據(jù)集HUST-OBC與EV-OBC上實(shí)現(xiàn)最先進(jìn)的Top-10識(shí)別準(zhǔn)確率,并展現(xiàn)出卓越的零樣本破譯能力。該方法不僅顯著提升了大模型在古文字識(shí)別任務(wù)中的表現(xiàn),還為未破譯甲骨文提供可解釋的分析路徑,對(duì)推動(dòng)考古學(xué)研究具有重要價(jià)值。

甲骨文作為迄今發(fā)現(xiàn)最古老的成熟文字系統(tǒng),因其字形稀有、結(jié)構(gòu)抽象與象形多樣性,長期以來為破譯工作帶來極大挑戰(zhàn)?,F(xiàn)有基于深度學(xué)習(xí)的識(shí)別方法雖取得一定進(jìn)展,但大多忽略字形與語義之間的復(fù)雜關(guān)聯(lián),導(dǎo)致模型泛化能力有限,尤其在零樣本場(chǎng)景與未識(shí)別的甲骨文字符上表現(xiàn)不佳。

為解決這一問題,研究團(tuán)隊(duì)構(gòu)建了首個(gè)專門用于象形解析的甲骨文數(shù)據(jù)集PD-OBS(Pictographic Decipherment Oracle Bone Script)。該數(shù)據(jù)集涵蓋47,157個(gè)漢字,部分字符附有甲骨文圖像及古代字體圖像,所有字符均具備現(xiàn)代楷書圖像、部首分析與象形分析標(biāo)注。數(shù)據(jù)標(biāo)注過程融合了傳統(tǒng)文字學(xué)資源與大語言模型技術(shù):首先通過《說文解字》檢索部首與字義,再借助GPT-4進(jìn)行內(nèi)容擴(kuò)充與校驗(yàn),最終經(jīng)人工修正確保質(zhì)量。

在模型架構(gòu)方面,團(tuán)隊(duì)以Qwen2.5-VL-7B為基礎(chǔ),引入空間patch合并模塊作為視覺適配器,并設(shè)計(jì)分類器用于部首識(shí)別。模型采用漸進(jìn)式訓(xùn)練策略,分階段完成部首識(shí)別、部首分析、象形分析及部首-象形交互分析,逐步實(shí)現(xiàn)從字形到語義的推理。為進(jìn)一步提升零樣本性能,研究提出“部首-象形雙重匹配機(jī)制”,通過篩選候選字典中的字符,根據(jù)預(yù)測(cè)的部首標(biāo)簽與象形分析之間的語義相似性進(jìn)行排序與匹配,有效緩解了模型在未見樣本上的泛化瓶頸。

實(shí)驗(yàn)結(jié)果表明,該框架在驗(yàn)證集與零樣本測(cè)試集上均達(dá)到最優(yōu)或具有競(jìng)爭力的性能。在HUST-OBC和EV-OBC數(shù)據(jù)集上,其Top-10準(zhǔn)確率顯著優(yōu)于現(xiàn)有基于分類模型(如InceptionV3、ViT、PyGT)與擴(kuò)散模型(如OBSD、BBDM)的方法,也大幅領(lǐng)先于GPT-4.1、Qwen-VL-Max等通用大模型。在可解釋性方面,其生成的部首與象形分析結(jié)果在BERT-Score指標(biāo)上比GPT-4.1平均高出12.95%至21.60%,顯示出更可靠的語義推理能力。

此外,該方法在面對(duì)尚未破譯的甲骨文字符時(shí),仍能輸出合理的語義分析與候選漢字,為考古學(xué)家提供具有參考價(jià)值的破譯線索。例如,模型能夠通過追溯部首源流、解析整體象形結(jié)構(gòu),形成雙重推理路徑,從而增強(qiáng)結(jié)果的可信度與可驗(yàn)證性。

綜上所述,復(fù)旦大學(xué)所提出的這一框架不僅刷新了甲骨文自動(dòng)識(shí)別任務(wù)的SOTA紀(jì)錄,更通過可解釋的分析機(jī)制和高質(zhì)量的標(biāo)注數(shù)據(jù)集,為古文字?jǐn)?shù)字化破譯提供了新的方法論支持。相關(guān)論文與數(shù)據(jù)集已公開,為推動(dòng)該領(lǐng)域后續(xù)研究提供重要基礎(chǔ)。

(注:本文在資料搜集、框架搭建及部分段落初稿撰寫階段使用了 AI 工具,最終內(nèi)容經(jīng)人類編輯核實(shí)事實(shí)、調(diào)整邏輯、優(yōu)化表達(dá)后完成。)

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2025-09-08
復(fù)旦新框架破譯甲骨文,大模型SOTA紀(jì)錄被刷新
復(fù)旦大學(xué)研究團(tuán)隊(duì)近期提出一種基于部首與象形分析的可解釋甲骨文破譯框架,在公開基準(zhǔn)數(shù)據(jù)集HUST-OBC與EV-OBC上實(shí)現(xiàn)最先進(jìn)的Top-10識(shí)別準(zhǔn)確...

長按掃碼 閱讀全文