本系统将《高僧传》全文与 CBETA 大藏经数据库进行对齐,建立跨典籍平行段落检索引擎,揭示《高僧传》与佛教经律论之间的文本承袭、改编与互文关系。

10,843,485 全量句子
4,363 佛典文献
17 藏经系列
73,000+ 已嵌入向量

字词检索

基于 SQLite FTS5 trigram 分词器,对全量 1084 万句构建全文索引。以滑动三元组 OR 查询支持长句检索,2 字以下回退 LIKE 精确匹配。

语义检索

从 T2059、T2060、T2061 抽取约 7.3 万句,使用 DashScope text-embedding-v4(1024 维)生成向量,以 FAISS 建立近似最近邻索引,支持跨文体语义匹配。

自动排除

检索时在数据库层永久排除 T2059(《高僧传》本身),避免自引用噪声。所有 GSZ 句子结果单独显示于左栏,CBETA 他典结果显示于右栏。