近日,百度在海外官方賬號介紹了最新輕量級文字識別模型 PP-OCRv5。該模型僅0.07B參數(shù),以千分之一參數(shù)量實現(xiàn)與700億參數(shù)大模型相媲美的OCR精度。在多項 OCR 場景測試中,PP-OCRv5 的表現(xiàn)超越GPT-4o、Qwen2.5-VL-72B等通用視覺大模型。最新信息顯示,飛槳團隊發(fā)布的技術Blog已連續(xù)一周登頂Hugging Face博客熱度榜首,受到開發(fā)者社區(qū)的廣泛關注。
據(jù)了解,2025年5月,飛槳團隊推出PaddleOCR 3.0版本,文字識別方案PP-OCRv5與通用文檔解析方案PP-StructureV3,以及原生支持文心大模型4.5的智能文檔理解方案PP-ChatOCRv4共同構成其三大特色能力。自2020年開源以來,PaddleOCR累計下載量突破900萬,被超過5.9k開源項目直接或間接使用,是GitHub 社區(qū)中唯一一個 Star數(shù)超過50k的中國OCR項目。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )