返回首页

研究背景

「以經注經」是佛教文獻學的傳統方法,指以佛經來注釋佛經,通過經文之間的相互參照來闡明義理。這種方法強調「佛說即佛證」,認為最權威的注釋來源就是佛陀的其他教導。

然而,傳統的以經注經需要注釋者對多部佛經有深入的理解和記憶,工作量巨大。本系統嘗試利用自然語言處理技術,自動從源經中檢索與目標經文語義相關的段落,輔助完成注釋工作。

核心功能

  • 語義檢索:基於向量嵌入技術,從源經中檢索與目標句語義相近的段落
  • 關鍵詞匹配:結合傳統關鍵詞匹配,提高檢索準確率
  • 置信度評估:為每條注釋提供語義相似度分數,便於人工審核
  • 品章導航:按經文章節組織注釋結果,支持逐章瀏覽
  • 全文檢索:支持經文內容和注釋內容的關鍵詞搜索

技術方法

系統採用多階段檢索策略:

  • 預處理:分句、分詞、去停用詞
  • 關鍵詞匹配:基於 TF-IDF 的初篩
  • 語義檢索:使用預訓練語言模型計算句向量相似度
  • 重排序:結合多種信號對候選注釋重新排序
  • 閾值過濾:低於置信度閾值的結果標記為「無法注釋」
Python Flask NLP 語義檢索 向量嵌入

使用材料

本系統展示的注釋成果:

  • 目標經:《維摩詰所說經》(鳩摩羅什譯)
  • 源經:《妙法蓮華經》(鳩摩羅什譯)
  • 注釋數量:1207 條自動生成的注釋
  • 覆蓋範圍:全經 12 品,逐句注釋

注釋狀態說明

  • 完全匹配(success):語義置信度高,注釋可靠
  • 部分匹配(partial):存在相關段落,但語義關聯度中等
  • 無法注釋(null):未找到足夠相關的源經段落

数字文献学启发

本項目探索了傳統文獻學方法的計算化實現。「以經注經」本是需要深厚學養的人工工作,現在可以由機器輔助完成初步檢索,人類專家負責審核和深化。這種「人機協作」模式可能是數字人文研究的重要方向。

立即体验 查看其他项目 了解更多关于数字文献学