你只需往電腦上傳一張甲骨圖片,AI(人工智能)即可完成文字識別、釋義查詢、文獻溯源——最懂甲骨文的AI來了!近日,廈門大學與騰訊公司、安陽師范學院聯合研發的全球首個甲骨文智能體“殷契行止”正式上線。
廈門大學人工智能研究院甲骨文研究團隊的負責人金泰松說,這是三方三年潛心研究的一個“合集”——一直以來,甲骨文研究一直面臨“識別難、比對難、共享難”的挑戰,“殷契行止”就是破解這些難題的智能體——AI用定制算法練就了讀懂古文的真功夫。
用大白話說,“殷契行止”使得AI首次具備了“理解古文字”的能力,最終讓每一片甲骨“讀得懂、找得到、用得上”。
目前,甲骨文智能體已面向專家和公眾免費開放,人人都能上手體驗。
不過,金泰松說:“我們不是替代甲骨文研究專家,而是把專家從重復勞動中解放出來,讓他們把精力留給真正的破譯與思考。”
小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本組圖/小程序截圖)
能做什么
看圖識字
上傳圖片就能
精準比對標準字庫
只需上傳一張含有甲骨文字的圖片,AI就能精準比對甲骨文標準字庫,看圖識別出它是哪個甲骨文字,還能進一步檢索系統知識庫中有關該甲骨文字的相關資料,還會給出權威釋義和參考文獻。
識別出某個單字后,AI會自動查找這個字在哪些甲骨和拓片中出現過,快速定位相關資料。
針對某個單字,快速匯聚與之相關的學術研究成果、各家釋讀觀點和演變歷史,省下大量翻找資料的時間。
甲骨文“馬”字
全自動甲骨校重
以圖搜圖
10分鐘完成數年的工作
這個智能體還有拓片重見檢索功能:相當于“甲骨文版以圖搜圖”。上傳一張拓片照片,AI能快速比對海量數據庫,找出同一片甲骨的不同拓片版本或有相似字形的其他甲骨,幫助研究者發現重復收錄的文獻或追蹤甲骨流傳軌跡。
甲骨拓本圖像是研究甲骨文的基礎。所謂“拓本”,核心是把龜甲、獸骨上的文字,用宣紙和墨“印”下來的成品,就是給甲骨上的字拍了張“黑白高清照”。從甲骨文首次發現至今,因為收藏、流轉,大部分甲骨都留下了多個版本的拓本,這些拓本被稱為重片,梳理重片的工作被稱為校重。
可想而知,甲骨的拓本數量遠遠大于甲骨的數量,需要對這些重片進行系統整理,才能理清這筆“糊涂賬”。因此,拓片校重是甲骨學一項重要的基礎性整理工作,耗費了甲骨文研究學者大量時間。
團隊開發的拓片校重和重見檢索系統有效解決了一字多版難題,讓AI學會“找字”,實現了全自動甲骨校重。原本需要專家耗時數年的比對工作,現在僅需10分鐘即可完成。
拓本轉化為摹本
不必借助臨摹
就能看清筆畫細節
此外,運用AI還可以將甲骨拓本(類似碑文拓印的黑白圖片),轉化為甲骨文摹本(白底黑字的臨摹圖),方便研究者看清筆畫細節。
在此之前,甲骨文摹本需要甲骨文研究者用筆一筆筆臨摹,需要研究人員對甲骨文有較深的理解,并且非常費時費力。
甲骨文摹本
甲骨拓本
怎么用
小程序免費開放
可以跟AI直接對話
更酷的是,“殷契行止”使得甲骨文走向大眾——目前,這個甲骨文智能體已面向專家和公眾免費開放,人人都能上手體驗。
簡單來講,無論你是深耕古文字的研究者,還是初識甲骨文的愛好者,都能借助它與3000年前的文字對話。
如果你是甲骨文研究者,可以在PC端登錄“甲骨文AI協同平臺”,使用AI研究工具智能識別、比對與檢索甲骨文,顯著提升研究效率。比如,上傳圖片后,你可以直接提問單字的釋義,還可以問“這個字在哪里出現過?”AI會自動比對,快速找出包含該字的全部拓片和摹本。
如果你是古文字愛好者,只需打開微信小程序“了不起的甲骨文”,就能和智能體對話。
例如,你可以問它:“家”字的甲骨文長什么樣?它不僅會展示字形,還會告訴你,這個字里藏著殷商時代的“居住”特點。
甲骨文“門”字
跟著“甲骨舞者”
學跳甲骨文體操
在“了不起的甲骨文”,人們還可以體驗甲骨識讀樂趣,獲取古文字知識。
這個小程序還能讓甲骨文翩翩起舞,金泰松介紹,安陽師范學院甲骨文信息處理教育部重點實驗室牽頭,聯合音樂學院、體育學院等編創了一套“廣播體操”,手機上輕輕一點,“甲骨舞者”就翩翩起舞,時而展示側身而立的“人”字,時而表演張開雙臂的“舞”字。
金泰松說,這位“甲骨舞者”是真人,這套甲骨文“廣播體操”是為了幫助大家更好地理解和傳播甲骨文。
此外,團隊還打造了一系列甲骨文主題游戲,讓普通人也能在有趣互動中,感受古文字的千年底蘊。
如何研發
三方合作
引入甲骨文針對性算法
金泰松說,隨著DeepSeek(深度求索,一種AI助手)等通用大模型的涌現,我們意識到,AI確實能為甲骨文研究帶來實質性的效率變革。基于這一認識,團隊開始研發面向甲骨文識別的專用智能體。
什么叫智能體?金泰松列舉一個例子,我們問DeepSeek:到北京的機票多少?它會告訴你價格,你還得自己去找App(應用程序)完成訂票等工作;智能體卻可以幫助你做其他的事情——你告訴特定的智能體:我要去北京,它會去查詢相關的網站,調出支付的App等。表現在甲骨文智能體上,你上傳一個甲骨單字,它可以自動去找這個字出現在哪片甲骨上,給出專家研究的文獻等。
金泰松強調說,甲骨文智能體不是突然出現的,三年來,團隊以AI+多模態甲骨文數據集融合為基礎,研發出多項關鍵技術,包括甲骨字形檢測與分類算法、AI摹本生成與字形匹配技術、甲骨校重與結構化比對算法,以及融合圖像、文字與語義的多模態推理能力。
也就是說,現在相當于引入這些針對性的算法,用智能體技術把這些成果整合在“殷契行止”。
金泰松特別介紹三方合作的起源——2022年,在廈門大學紀榮嶸教授牽線下,廈門大學多媒體可信感知與高效計算教育部重點實驗室、安陽師范學院甲骨文信息處理教育重點實驗室與騰訊公司聯合組建了跨機構研究團隊。作為實驗室主任,紀榮嶸在研究方向、技術路線優化、核心技術難題的攻堅突破中發揮關鍵作用。
金泰松是計算機專家,甲骨文智能化的研究與他參與研發的其他類型項目的感受是不一樣的,他說,有時你會覺得,我們是在進行3000年文明的一場接力。
教AI認字
精準檢測143萬個字形
很多人疑惑的是,人工智能是如何認識甲骨文的?難道不是要建立在“投喂”的基礎上?
金泰松解釋,的確,項目的起點是最基礎的字形識別。面對模糊不清的拓片,常規圖像檢測方法幾乎失效。“拓片噪聲干擾嚴重,筆畫斷裂,以‘庚’為例,同一個‘庚’字在不同時期形態各異,有的像鈴鐺,有的像勞動工具,有的因為刻痕太淺幾乎難以辨認。”金泰松說,“這給視覺算法帶來了巨大挑戰。”
AI首先學會了“認字”,從模糊的拓片中提取清晰字形。就像教孩子識字一樣,團隊給AI展示了上千個“庚”字的拓片,告訴它:這些都是“庚”,雖然長得不太一樣,但都是同一個字。經過數百次迭代,AI便學會了從模糊的拓片中精準識別出各種形態的“庚”字。
團隊一步一步從底層圖像處理做起,通過多尺度圖像增強、去噪、去模糊等技術,處理破損的甲骨片,再不厭其煩地“教”AI“認字”,最終實現對143萬個字形的精準檢測,準確率超過90%。
讓流失海外的甲骨
在數字世界回歸
“殷契行止”背后還有“數字甲骨共創計劃”,目前,它已完成1525片甲骨的數字化采集工作,其中以數字化形式“回歸”的流失海外的甲骨達950片。
也就是說,用AI讓幾千歲的甲骨文在數字世界里“團圓”。
這里有個背景,出土的甲骨不僅在中國,還分布在世界16個國家和地區。過去幾年,“數字甲骨共創計劃”的研究者分赴各地,憑借一盞燈和一臺相機工作,現在,這些散落在海外的甲骨片都以數字形式回歸到祖國。
據介紹,通過“數字甲骨共創計劃”,研究團隊已構建起全球規模最大的甲骨文多模態數據集,包含143萬個甲骨文字形數據、1.5萬片甲骨多模態數據、3000篇研究文獻等。
2024年世界人工智能大會上,AI+多模態甲骨文數據集首次發布,供研究人員和公眾免費使用。
責任編輯:陳錦娜
- 甲骨文和Uber宣布展開為期七年的戰略性云合作2023-02-14
- 吸引人才有新招 漳州高新區甲骨文人才驛站揭牌成立2019-05-25
- 甲骨文中國裁員怎么回事?甲骨文員工為何不滿賠償?2019-05-09
- 甲骨文不滿賠償什么情況?甲骨文回應裁員說了什么?2019-05-08
- 甲骨文中國裁員怎么回事?甲骨文為什么要裁員裁多少人2019-05-07
- 甲骨文書法精品今起“登鷺”展出 展覽將持續至12月2日2018-11-22
- “甲骨文學堂”進校園 讓孩子感受中華文化魅力2018-05-09
- 90后女孩用表情包圖說甲骨文:這種方式大眾能了解考古2018-04-02
- 首師大教授和團隊歷時7年潛心編纂《甲骨文大系》2018-03-29
- 認識一個字,獎勵10萬元!安陽甲骨文藏著隱秘歷史2017-07-24
- 最新廈門新聞 頻道推薦
-
廈門湖里:匯聚企業家力量 共繪民營經濟新篇2025-12-12
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻
- 一周熱點新聞

已有0人發表了評論
您需要登錄后才可以評論,登錄| 注冊