系统文档
系统方案说明、知识库构建方法、数据来源说明与部署指南
系统方案说明
项目概述
"湖山镌永——杭州摩崖石刻知识问答与展示系统"是一个基于**RAG(检索增强生成)**技术构建的专业知识问答平台。系统整合了9个JSONL数据文件共244条经过去重清洗的知识记录,并补充了网络公开资源中关于杭州摩崖石刻的可靠信息,构建了完整的知识库。
作者:杭州外国语学校 倪静天
技术架构
| 层级 | 技术选型 | 说明 |
|---|---|---|
| 前端 | React 19 + TypeScript + Tailwind CSS 4 | 响应式SPA应用 |
| 后端 | Express 4 + tRPC 11 | 类型安全的API层 |
| 数据库 | TiDB (MySQL兼容) + Drizzle ORM | 知识库持久化存储 |
| 检索引擎 | TF-IDF 向量检索 | 文档相似度匹配 |
| 生成模型 | gpt-4.1-mini (OpenAI API) | 基于检索结果生成回答 |
| 部署 | Manus 托管平台 | 自动化部署与运维 |
RAG 工作流程
- 用户提问 → 系统接收自然语言问题
- 文档检索 → TF-IDF向量化后计算余弦相似度,召回Top-6相关文档
- 上下文构建 → 将检索到的文档组装为LLM上下文
- 答案生成 → gpt-4.1-mini基于上下文生成有据可查的回答
- 来源追溯 → 返回引用的知识库原文及证据来源
系统功能模块
- 知识问答:基于RAG的智能问答,支持来源追溯
- 分类浏览:按地点/朝代/文字类型三维度筛选
- 数据统计:知识库分布可视化
- 评估报告:5个指定测试问题的RAG问答评估
- 系统文档:完整的技术方案与数据说明