本系统将《高僧传》全文与 CBETA 大藏经数据库进行对齐,建立跨典籍平行段落检索引擎,揭示《高僧传》与佛教经律论之间的文本承袭、改编与互文关系。
10,843,485
全量句子
4,363
佛典文献
17
藏经系列
73,000+
已嵌入向量
字词检索
基于 SQLite FTS5 trigram 分词器,对全量 1084 万句构建全文索引。以滑动三元组 OR 查询支持长句检索,2 字以下回退 LIKE 精确匹配。
语义检索
从 T2059、T2060、T2061 抽取约 7.3 万句,使用 DashScope text-embedding-v4(1024 维)生成向量,以 FAISS 建立近似最近邻索引,支持跨文体语义匹配。
自动排除
检索时在数据库层永久排除 T2059(《高僧传》本身),避免自引用噪声。所有 GSZ 句子结果单独显示于左栏,CBETA 他典结果显示于右栏。