本地 PDF 文档迁移到线上的流程

本地 PDF 文档迁移到线上的流程如下：

PDF 内容拆解与提取

文本与结构提取：使用工具上传 PDF 文档，系统自动解析并拆解目录、章节等层级结构，生成包含标题、内容的结构化数据
图片提取：通过 WPS 等工具一键抽取 PDF 中的所有图片，单独保存为本地资源

数据导入知识库

生成 Excel 文件：将拆解后的文本内容导出为 Excel，包含 ID、parentid 等层级关系标识，确保目录结构清晰
批量导入：通过知识库的导入工具上传 Excel 文件，系统根据层级关系自动构建结构化知识库

资源补充与排版优化

图片上传：将提取的图片上传至资源库，在编辑器中手动调整图片位置及布局
富文本编辑：利用在线编辑器添加视频、交互问答等富媒体内容，支持版本管理和历史记录回溯

前端应用生成

选择模板：在应用库中选择电子书、Chat 问答等展示模板，关联已创建的知识库
配置与发布：自定义封面、主题颜色、访问权限等，同步知识库内容后发布为独立 URL 或二维码

辅助信息：

工具支持：迁移过程中需使用 Baklib 提供的 PDF 解析工具（需 Gemini API Key 调用），以及 WPS 等第三方工具提取图片
人工校验：文本识别准确率较高，但图片、复杂布局需人工二次校验和调整
扩展性：迁移后的内容可灵活生成电子书、打印版 PDF、交互式问答等多场景应用，支持 API 对接实现自动化更新

提交反馈

如何在Baklib上挂载自己的网站模板