2026年Python+AI 项目实战：从 0 到 1 打造个人专属智能问答机器人

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

 
 在本项目中，我们选用了以下技术栈： 
  
    
     
      为什么不直接调用 OpenAI、文心一言等云端 API？原因有三：首先，本地部署确保数据完全私密，适合处理敏感信息；其次，一次投入即可无限使用，没有按 Token 计费的成本压力；最后，离线环境下的可用性对于某些行业（如军工、金融、医疗）至关重要。当然，本地模型的性能在复杂推理任务上可能略逊于 GPT-4 等顶级模型，但对于知识库问答这类相对封闭的场景，已经能够取得令人满意的效果。 
    
整个系统的数据流动可以概括为以下流程：
 
  
    
     
      这个架构设计充分考虑了系统的可扩展性。例如，可以轻松替换不同的嵌入模型或生成模型以适应特定需求；FAISS 索引支持增量更新，新增知识时无需重建整个索引；通过调整 top-k 值可以平衡召回率和精确度。在实际部署中，还可以添加查询改写、结果重排序、缓存机制等模块进一步提升性能。 
    
 现在让我们开始编写代码。整个项目将被组织为清晰的模块，包括知识库构建、向量检索、LLM 推理和主循环控制。所有代码均在 Python 3.10+ 环境中测试通过。
 首先，我们需要安装必要的 Python 库。创建一个 requirements.txt 文件：
transformers>=4.35.0

sentence-transformers>=2.2.2 faiss-cpu>=1.7.4 langchain>=0.1.0 langchain-community>=0.0.10 torch>=2.0.0 accelerate>=0.25.0 pypdf>=3.17.0 python-dotenv>=1.0.0

然后执行安装命令：

pip install -r requirements.txt

如果你的机器有 NVIDIA GPU，建议安装 faiss-gpu 替代 faiss-cpu 以获得更快的检索速度。

假设我们有一份 Markdown 格式的产品手册作为知识库。以下代码展示了如何加载文档并进行切分：

# knowledge_base.py

import os from typing import List, Dict import re

class KnowledgeBase: """本地知识库管理类"""

def init(self, chunk_size: int = 500, chunk_overlap: int = 50): """ 初始化知识库

Args: chunk_size: 文本块的最大字符数 chunk_overlap: 相邻文本块之间的重叠字符数 """ self.chunk_size = chunk_size self.chunk_overlap = chunk_overlap self.documents = [] # 存储所有文本块

def load_markdown_file(self, file_path: str) -> str: """ 加载 Markdown 文件内容

Args: file_path: 文件路径

Returns: 文件文本内容 """ with open(file_path, ‘r’, encoding=‘utf-8’) as f: return f.read()

def split_text_into_chunks(self, text: str, source: str = "") -> List[Dict]: """ 将长文本切分为小块

Args: text: 待切分的文本 source: 文本来源标识（如文件名）

Returns: 文本块列表，每个块包含内容和元数据 """ chunks = [] start = 0 text_length = len(text)

while start < text_length: end = start + self.chunk_size

# 如果不是最后一块，尝试在句号、问号或换行处切分 if end < text_length: # 寻找最近的句子结束符 for delimiter in [‘。’, ‘！’, ‘？’, ‘

’, ‘. ’, ‘! ’, ‘? ’]: pos = text.rfind(delimiter, start, end) if pos != -1: end = pos + len(delimiter) break

chunk_text = text[start:end].strip() if chunk_text: # 跳过空块 chunks.append({ ‘content’: chunk_text, ‘metadata’: { ‘source’: source, ‘start’: start, ‘end’: end } })

# 移动到下一块，考虑重叠区域 start = end - self.chunk_overlap

return chunks

def load_directory(self, directory: str, extension: str = ‘.md’) -> None: """ 加载目录下所有指定扩展名的文件

Args: directory: 目录路径 extension: 文件扩展名 """ for filename in os.listdir(directory): if filename.endswith(extension): file_path = os.path.join(directory, filename) print(f"正在加载文件: {{C}filename}")

content = self.load_markdown_file(file_path) chunks = self.split_text_into_chunks(content, source=filename) self.documents.extend(chunks)

print(f"知识库构建完成，共 {{C}len(self.documents)} 个文本块")

def get_documents(self) -> List[Dict]: """获取所有文档块""" return self.documents

接下来，我们使用 Sentence-BERT 将文本块转换为向量，并构建 FAISS 索引：

# vector_store.py

import numpy as np import faiss from sentence_transformers import SentenceTransformer from typing import List, Dict, Tuple

class VectorStore: """向量存储和检索类"""

def init(self, model_name: str = ‘sentence-transformers/all-MiniLM-L6-v2’): """ 初始化向量存储

Args: model_name: 嵌入模型名称 """ print(f"正在加载嵌入模型: {{C}model_name}") self.embedding_model = SentenceTransformer(model_name) self.dimension = self.embedding_model.get_sentence_embedding_dimension() self.index = None self.documents = [] # 存储原始文档块

def build_index(self, documents: List[Dict]) -> None: """ 为文档构建 FAISS 索引

Args: documents: 文档块列表 """ self.documents = documents print(f"正在为 {{C}len(documents)} 个文档块生成嵌入向量…")

# 批量生成嵌入向量 texts = [doc[‘content’] for doc in documents] embeddings = self.embedding_model.encode( texts, show_progress_bar=True, convert_to_numpy=True )

# 构建 FAISS 索引（使用 L2 距离） self.index = faiss.IndexFlatL2(self.dimension) self.index.add(embeddings.astype(‘float32’))

print(f"索引构建完成，向量维度: {{C}self.dimension}, 索引大小: {{C}self.index.ntotal}")

def save_index(self, index_path: str, docs_path: str) -> None: """ 保存索引和文档到磁盘

Args: index_path: FAISS 索引保存路径 docs_path: 文档保存路径 """ if self.index is None: raise ValueError("索引尚未构建")

faiss.write_index(self.index, index_path) np.save(docs_path, self.documents) print(f"索引已保存到 {{C}index_path}") print(f"文档已保存到 {{C}docs_path}")

def load_index(self, index_path: str, docs_path: str) -> None: """ 从磁盘加载索引和文档

Args: index_path: FAISS 索引路径 docs_path: 文档路径 """ self.index = faiss.read_index(index_path) self.documents = np.load(docs_path, allow_pickle=True).tolist() print(f"索引已加载，包含 {{C}self.index.ntotal} 个向量")

def search(self, query: str, top_k: int = 3) -> List[Dict]: """ 搜索与查询最相似的文档

Args: query: 查询文本 top_k: 返回最相似的前 k 个结果

Returns: 包含文档内容和相似度分数的列表 """ if self.index is None: raise ValueError("索引尚未构建或加载")

# 将查询转换为向量 query_vector = self.embedding_model.encode( [query], convert_to_numpy=True ).astype(‘float32’)

# 搜索最相似的向量 distances, indices = self.index.search(query_vector, top_k)

# 构建结果列表 results = [] for i, (distance, idx) in enumerate(zip(distances[0], indices[0])): if idx < len(self.documents): # 确保索引有效 result = self.documents[idx].copy() # 将 L2 距离转换为相似度分数（0-1 之间） result[‘score’] = 1 / (1 + distance) result[‘rank’] = i + 1 results.append(result)

return results

现在我们使用 Transformers 库加载 Phi-3 模型进行答案生成：

# llm_generator.py

import torch from transformers import AutoTokenizer, AutoModelForCausalLM from typing import List, Dict

class LLMGenerator: """LLM 答案生成器"""

def init( self, model_name: str = ‘microsoft/Phi-3-mini-4k-instruct’, device: str = ‘auto’ ): """ 初始化 LLM 生成器

Args: model_name: 模型名称或本地路径 device: 运行设备 (‘cuda’, ‘cpu’, ‘auto’) """ if device == ‘auto’: self.device = ‘cuda’ if torch.cuda.is_available() else ‘cpu’ else: self.device = device

print(f"正在加载模型: {{C}model_name}") print(f"使用设备: {{C}self.device}")

self.tokenizer = AutoTokenizer.from_pretrained( model_name, trust_remote_code=True ) self.model = AutoModelForCausalLM.from_pretrained( model_name, torch_dtype=torch.float16 if self.device == ‘cuda’ else torch.float32, device_map=‘auto’ if self.device == ‘cuda’ else None, trust_remote_code=True )

if self.device == ‘cpu’: self.model = self.model.to(self.device)

print("模型加载完成")

def generate_answer( self, query: str, context_docs: List[Dict], max_new_tokens: int = 256, temperature: float = 0.7 ) -> str: """ 基于上下文生成答案

Args: query: 用户问题 context_docs: 检索到的相关文档 max_new_tokens: 最大生成 token 数 temperature: 采样温度（越低越确定）

Returns: 生成的答案 """ # 构建上下文 context_text = "

".join([ f"[参考信息 {{C}i+1}] {{C}doc[‘content’]}" for i, doc in enumerate(context_docs) ])

# 构建提示词（Prompt Engineering） prompt = f"""你是一个专业的智能客服助手。请根据以下参考信息回答用户的问题。

参考信息： {context_text}

用户问题：{query}

请基于参考信息给出准确、简洁、友好的回答。如果参考信息中没有相关内容，请礼貌告知用户你无法从现有资料中找到答案。

回答："""

# 编码输入 inputs = self.tokenizer( prompt, return_tensors=‘pt’, truncation=True, max_length=2048 # 控制输入长度 ).to(self.device)

# 生成答案 with torch.no_grad(): outputs = self.model.generate( inputs, max_new_tokens=max_new_tokens, temperature=temperature, do_sample=True if temperature > 0 else False, top_p=0.9, repetition_penalty=1.1, pad_token_id=self.tokenizer.eos_token_id )

# 解码输出（只返回新生成的部分） answer = self.tokenizer.decode( outputs[0][inputs[‘input_ids’].shape[1]:], skip_special_tokens=True )

return answer.strip()

最后，我们将所有组件组合起来，构建完整的问答系统：

# main.py

import os from dotenv import load_dotenv from knowledge_base import KnowledgeBase from vector_store import VectorStore from llm_generator import LLMGenerator

class QASystem: """智能问答系统主类"""

def init( self, knowledge_dir: str = ‘./knowledge’, index_path: str = ‘./faiss_index.bin’, docs_path: str = ‘./documents.npy’, rebuild_index: bool = False ): """ 初始化问答系统

Args: knowledge_dir: 知识库目录 index_path: FAISS 索引路径 docs_path: 文档存储路径 rebuild_index: 是否重建索引 """ # 初始化组件 self.kb = KnowledgeBase(chunk_size=500, chunk_overlap=50) self.vector_store = VectorStore() self.llm = LLMGenerator()

# 加载或构建索引 if rebuild_index or not os.path.exists(index_path): print("正在构建新索引…") self.kb.load_directory(knowledge_dir) documents = self.kb.get_documents() self.vector_store.build_index(documents) self.vector_store.save_index(index_path, docs_path) else: print("正在加载已有索引…") self.vector_store.load_index(index_path, docs_path)

print("=" 50) print("智能问答系统初始化完成！") print("=" 50)

def ask(self, query: str, top_k: int = 3) -> Dict: """ 处理用户问题

Args: query: 用户问题 top_k: 检索的文档数量

Returns: 包含答案和参考信息的字典 """ print(f" 用户问题: {{C}query}") print("正在检索相关知识…")

# 向量检索 retrieved_docs = self.vector_store.search(query, top_k=top_k)

print(f"检索到 {{C}len(retrieved_docs)} 个相关文档片段")

# 生成答案 print("正在生成答案…") answer = self.llm.generate_answer(query, retrieved_docs)

return { ‘query’: query, ‘answer’: answer, ‘sources’: [ { ‘content’: doc[‘content’][:100] + ‘…’, ‘score’: doc[‘score’], ‘source’: doc[‘metadata’][‘source’] } for doc in retrieved_docs ] }

def run_interactive(self): """运行交互式问答循环""" print(" " + "=" 50) print("智能问答系统已就绪！") print("输入您的问题，输入 ‘quit’ 或 ‘exit’ 退出") print("=" 50 + " ")

while True: try: query = input("您的问题: ").strip()

if not query: continue

if query.lower() in [‘quit’, ‘exit’, ‘退出’]: print("感谢使用，再见！") break

# 处理问题 result = self.ask(query)

# 显示结果 print(f" {{C}‘=’*50}") print(f"答案: {{C}result[‘answer’]}") print(f"{{C}‘=’*50}") print(f"参考信息 (共 {{C}len(result[‘sources’])} 条):") for i, source in enumerate(result[‘sources’], 1): print(f" {{C}i}. 来源: {{C}source[‘source’]}") print(f" 相似度: {{C}source[‘score’]:.3f}") print(f" 内容: {{C}source[‘content’]}")

except KeyboardInterrupt: print("

检测到中断，正在退出…") break except Exception as e: print(f" 发生错误: {{C}str(e)}") print("请尝试重新提问 ")

if name == ‘main’: # 创建示例知识库目录和文件 os.makedirs(‘./knowledge’, exist_ok=True)

# 创建示例知识库文件（如果不存在） sample_md = """# 公司员工手册

密码重置流程

如果员工忘记了系统登录密码，可以按照以下步骤进行重置：

1. 访问公司内部系统登录页面 2. 点击"忘记密码"链接 3. 输入员工邮箱地址 4. 查收邮箱中的重置链接 5. 点击链接进入密码重置页面 6. 设置新密码（需包含大小写字母、数字和特殊字符） 7. 使用新密码登录系统

如遇到问题，请联系 IT 部门热线：400-123-4567

年假申请流程

员工申请年假需要遵循以下流程：

1. 提前至少 3 个工作日提交申请 2. 登录 HR 系统，进入"假期管理"模块 3. 选择年假类型，填写起止日期 4. 填写假期期间的工作交接安排 5. 提交申请等待审批 6. 直属上级审批通过后生效

注意事项： - 年假最小单位为 0.5 天 - 法定节假日前后 3 天内不得申请年假 - 年假需在当年 12 月 31 日前使用完毕

报销流程

员工日常费用报销流程如下：

1. 收集并整理所有原始发票 2. 登录财务系统，进入"费用报销"模块 3. 填写报销单，包括： - 费用类型（交通、餐饮、办公用品等） - 金额和发票张数 - 费用事由 4. 上传发票扫描件或照片 5. 提交申请 6. 等待财务部门审核（一般 3-5 个工作日） 7. 审核通过后，费用将转入员工工资卡

报销标准： - 市内交通：单次不超过 50 元 - 餐饮费用：人均不超过 80 元/餐 - 住宿费用：一线城市不超过 500 元/晚

联系方式

各部门联系方式： - IT 部门： | 内线 8888 - HR 部门： | 内线 6666 - 财务部门： | 内线 9999 """

sample_path = ‘./knowledge/员工手册.md’ if not os.path.exists(sample_path): with open(sample_path, ‘w’, encoding=‘utf-8’) as f: f.write(sample_md) print(f"已创建示例知识库文件: {{C}sample_path}")

# 初始化并运行问答系统 qa_system = QASystem(rebuild_index=True) qa_system.run_interactive()

完成上述代码后，运行 python main.py 即可启动问答系统。以下是几个实际问答示例：

示例 1：密码重置

您的问题: 我忘记密码了怎么办？

答案: 您可以通过访问公司内部系统登录页面，点击"忘记密码"链接来重置密码。输入您的员工邮箱地址，查收邮箱中的重置链接，点击链接后设置新密码即可。新密码需包含大小写字母、数字和特殊字符。如遇到问题，请联系 IT 部门热线：400-123-4567。

示例 2：年假申请

您的问题: 年假怎么申请？

答案: 员工申请年假需提前至少 3 个工作日提交申请。请登录 HR 系统的"假期管理"模块，选择年假类型并填写起止日期和工作交接安排，提交后等待直属上级审批。注意年假最小单位为 0.5 天，需在当年 12 月 31 日前使用完毕，且法定节假日前后 3 天内不得申请。

示例 3：超出知识库范围

您的问题: 公司有股票期权计划吗？

答案: 抱歉，我无法从现有资料中找到关于公司股票期权计划的信息。建议您咨询 HR 部门或查阅公司内部的相关政策文档。您可以通过内线 6666 或发送邮件至联系 HR 部门。

从示例中可以看出，系统不仅能够准确检索到相关信息，还能生成自然流畅的回答。当问题超出知识库范围时，系统也能优雅地处理，不会胡编乱造。

1. 模型幻觉

虽然 RAG 架构大大降低了幻觉风险，但在某些情况下仍可能出现。解决方法包括：

2. 上下文截断

当检索到的文档总长度超过模型上下文窗口时，需要截断内容。优化策略：

3. 检索精度不足

某些复杂问题可能无法准确检索到相关文档。改进方案：

缓存机制

对于重复问题，可以缓存答案以加快响应速度。使用 LRU 缓存策略，存储问题-答案对，当相同问题再次出现时直接返回缓存结果。

前端集成

将系统封装为 Web API，使用 Flask 或 FastAPI 提供 RESTful 接口，然后构建简洁的前端界面。这样可以让更多用户同时使用，也便于集成到现有系统中。

多模态支持

扩展系统以支持图片、表格等多模态内容。例如，可以使用 OCR 技术提取 PDF 中的图片文字，或使用表格解析器处理结构化数据。

持续学习

实现反馈机制，允许用户标记答案的正确性。收集这些反馈数据，可以用于知识库的更新和模型的微调，形成持续改进的闭环。

下一步行动建议：

2026年Python+AI 项目实战：从 0 到 1 打造个人专属智能问答机器人

相关推荐