返回演示项目

研究背景

校勘是古籍整理的核心工作,要求研究者逐字逐句比对不同版本,记录异文并判断优劣。这一过程极为耗时,且容易遗漏。

本工具旨在将校勘工作的机械部分——「找出差异」——交由算法完成,让研究者专注于更有价值的「判断取舍」环节。

核心功能

  • 支持 2-4 个版本的同时比对
  • 自适应文本对齐算法,处理段落错位
  • 智能识别异体字、繁简体差异
  • 自动过滤标点符号差异(可配置)
  • 多格式导出:TXT、HTML、DOCX

技术方法

系统采用多层次文本比对策略:

  • 基于 Diff 算法的字符级比对
  • 异体字归一化处理(内置常用异体字表)
  • 繁简体双向转换与识别
  • 可配置的标点过滤规则
Python Streamlit Diff 算法

使用材料

本工具为通用校勘平台,可处理任意古籍文本的多个版本。用户只需上传或粘贴文本内容即可开始比对。

典型应用场景包括:不同版本刻本的比对、手抄本与刻本的校勘、今人整理本与原始文献的核对等。

数字文献学启发

本工具体现了「算法辅助,人工审核」的数字文献学方法论。机器擅长穷尽式比对,人类擅长语义判断——两者结合,既保证了校勘的全面性,又维护了学术判断的权威性。

立即体验 查看其他项目