要真正落地实现 “GraphRAG + Azure AI Search 神学 AI 系统”,需要把概念架构转成 可执行工程流程。我给你一个 研究级 / 可实施路线(6 个阶段),特别适合你正在做的 倪柝声—李常受神学研究与 AI 系统。
我会从 系统工程角度说明,而不是只讲概念。
一、系统总体架构
整体系统结构如下:
神学文本语料
│
│ (清洗 / 分片)
▼
Embedding
│
▼
Azure AI Search
│
▼
实体抽取 (NER)
│
▼
神学知识图谱
│
▼
GraphRAG
│
▼
LLM
│
▼
神学问答 / 研究分析
核心分为 五个子系统:
文献语料系统
向量检索系统
神学知识图谱
GraphRAG 推理层
神学控制机制
二、Phase 1:神学语料库建设
这是最关键的一步。
数据来源
建议先建立 核心语料库
例如:
倪柝声
- 正常基督徒生活
- 属灵人
- 教会的正常生活
李常受
- 生命读经
- 神新约的经纶
- 神人调和
数据结构
统一转换为:
JSON / Markdown
示例:
{
"book": "生命读经",
"volume": "约翰福音生命读经",
"chapter": 12,
"paragraph": 4,
"text": "神的经纶乃是..."
}
这样可以保证:
- 可追溯
- 可引用
- 可验证
三、Phase 2:文本分片(Chunking)
RAG 成败 80%在 chunking。
推荐策略:
Semantic Chunking
300-500 tokens
overlap = 50
例如:
段落
↓
语义边界
↓
chunk
不要简单按字符切。
四、Phase 3:Embedding + Azure AI Search
使用向量索引。
推荐模型:
text-embedding-3-large
流程:
Chunk
↓
Embedding
↓
Azure AI Search
↓
Vector Index
示例 index:
theology-index
字段:
content
embedding
book
chapter
topic
这样检索会非常精准。
五、Phase 4:神学知识图谱(关键)
这是 GraphRAG 的核心。
需要抽取:
1 实体
例如:
神的经纶
三一神
神人调和
召会
生命
构成
2 关系
例如:
神的经纶 → 包含 → 神的分赐
神的分赐 → 目的 → 神人调和
神人调和 → 结果 → 召会
图结构:
神的经纶
│
├──神的分赐
│
└──神的行政
推荐图数据库
非常推荐:
- Neo4j
- ArangoDB
Graph schema:
Node
Concept
Person
Book
Scripture
Edge
teaches
explains
leads_to
六、Phase 5:GraphRAG 推理
GraphRAG 查询流程:
用户问题
│
▼
实体识别
│
▼
Graph traversal
│
▼
社区 summary
│
▼
RAG 检索
│
▼
LLM 综合回答
示例问题:
“神人调和在李常受神学中的中心地位是什么?”
系统会:
找实体
神人调和
李常受
神的经纶
查询图谱
找相关文献
生成回答
七、Phase 6:神学控制机制(非常重要)
为了避免 AI 神学偏差。
加入 Doctrine Control Layer
例如:
Scripture Verification
回答必须引用:
圣经
倪柝声
李常受
否则拒绝生成。
异端检测
建立规则:
例如:
否认三一
否认基督神性
系统自动警告。
八、推荐技术栈
完整 stack:
| 层 | 技术 |
|---|---|
| 数据处理 | Python |
| Embedding | OpenAI |
| 向量检索 | Azure AI Search |
| 知识图谱 | Neo4j |
| GraphRAG | Microsoft GraphRAG |
| LLM | GPT |
九、最小可运行版本(MVP)
第一版可以只做:
Corpus
│
Chunk
│
Embedding
│
Azure AI Search
│
RAG
第二版再加:
Knowledge Graph
GraphRAG
十、完整系统规模
最终系统大致如下:
50万段文本
10万个实体
50万关系
这就是:
Theological AI Engine
十一、一个非常关键的问题
如果你真的要做这个项目,我建议先设计:
神学知识图谱 schema
例如:
神
基督
三一
生命
经纶
召会
这些如何连接。
这一步决定整个系统质量。
如果你愿意,我可以继续帮你做三件 非常关键的东西:
神学知识图谱 Schema(论文级设计)
GraphRAG 神学推理架构图(博士论文级 Figure)
完整项目 GitHub 结构(可直接开发)
这会把你的 神学 AI 系统从概念直接推进到 真正可实现的工程级方案。