Spaces:

ahaahaaha
/

adaptive_rag

Paused

App Files Files Community

lanny xu commited on Nov 9

Commit

82227df

1 Parent(s): 1057c00

modifies bug

Browse files

Files changed (3) hide show

.env +2 -30
.gitignore +1 -0
config.py +16 -11

.env CHANGED Viewed

@@ -1,31 +1,3 @@
 TAVILY_API_KEY="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"
-# NOMIC_API_KEY="nk-kt4Tu3UdwFpIlDdxLcd9AK3a7cfdAKhoXvPbJ78oVlE"
-# 混合检索配置
-ENABLE_HYBRID_SEARCH=true
-BM25_K1=1.5
-BM25_B=0.75
-ENSEMBLE_WEIGHTS=[0.5, 0.5]
-# 查询扩展配置
-ENABLE_QUERY_EXPANSION=true
-QUERY_EXPANSION_MODEL="all-MiniLM-L6-v2"
-QUERY_EXPANSION_TOP_K=5
-# 多模态配置
-ENABLE_MULTIMODAL=true
-MULTIMODAL_MODEL="openai/clip-vit-base-patch32"
-MULTIMODAL_IMAGE_MODEL="openai/clip-vit-base-patch32"
-# GraphRAG配置
-ENABLE_GRAPH_RAG=true
-GRAPH_ENTITY_EXTRACTION_MODEL="llama2"
-GRAPH_RELATION_EXTRACTION_MODEL="llama2"
-GRAPH_COMMUNITY_DETECTION=true
-GRAPH_COMMUNITY_ALGORITHM="louvain"
-GRAPH_VISUALIZATION=true
-GRAPH_LAYOUT="spring"

+# API密钥配置
 TAVILY_API_KEY="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"
+# NOMIC_API_KEY="nk-kt4Tu3UdwFpIlDdxLcd9AK3a7cfdAKhoXvPbJ78oVlE"

.gitignore CHANGED Viewed

@@ -31,6 +31,7 @@ wheels/
 MANIFEST
 # 虚拟环境
 .venv
 env/
 venv/

 MANIFEST
 # 虚拟环境
+.env
 .venv
 env/
 venv/

config.py CHANGED Viewed

@@ -64,35 +64,40 @@ EMBEDDING_MODEL = "sentence-transformers/all-MiniLM-L6-v2"  # HuggingFace嵌入
 WEB_SEARCH_RESULTS_COUNT = 3
 # GraphRAG配置
-ENABLE_GRAPHRAG = True  # 是否启用GraphRAG功能
 GRAPHRAG_INDEX_PATH = "./data/knowledge_graph.json"  # 图谱索引保存路径
 # 确保数据目录存在
 import os
 os.makedirs("./data", exist_ok=True)
-GRAPHRAG_COMMUNITY_ALGORITHM = "louvain"  # 社区检测算法: louvain, greedy, label_propagation
 GRAPHRAG_MAX_HOPS = 2  # 本地查询最大跳数
 GRAPHRAG_TOP_K_COMMUNITIES = 5  # 全局查询使用的社区数量
 GRAPHRAG_BATCH_SIZE = 10  # 实体提取批处理大小
 # 混合检索策略配置
-ENABLE_HYBRID_SEARCH = True  # 是否启用混合检索策略
-HYBRID_SEARCH_WEIGHTS = {"vector": 0.7, "keyword": 0.3}  # 向量检索和关键词检索的权重
 KEYWORD_SEARCH_K = 5  # 关键词检索返回的文档数量
-BM25_K1 = 1.2  # BM25算法的k1参数
-BM25_B = 0.75  # BM25算法的b参数
 # 查询扩展优化配置
-ENABLE_QUERY_EXPANSION = True  # 是否启用查询扩展
-QUERY_EXPANSION_MODEL = "mistral"  # 用于查询扩展的模型
 QUERY_EXPANSION_PROMPT = """请为以下查询生成3-5个相关的扩展查询，这些查询应该从不同角度探索原始查询的主题。
 原始查询: {query}
 扩展查询: """  # 查询扩展提示模板
-MAX_EXPANDED_QUERIES = 3  # 最多使用的扩展查询数量
 # 多模态支持配置
-ENABLE_MULTIMODAL = True  # 是否启用多模态支持
-MULTIMODAL_IMAGE_MODEL = "openai/clip-vit-base-patch32"  # 图像嵌入模型
 SUPPORTED_IMAGE_FORMATS = ["jpg", "jpeg", "png", "gif", "bmp"]  # 支持的图像格式
 IMAGE_EMBEDDING_DIM = 512  # 图像嵌入维度
 MULTIMODAL_WEIGHTS = {"text": 0.7, "image": 0.3}  # 文本和图像检索的权重

 WEB_SEARCH_RESULTS_COUNT = 3
 # GraphRAG配置
+ENABLE_GRAPHRAG = os.environ.get("ENABLE_GRAPH_RAG", "true").lower() == "true"  # 是否启用GraphRAG功能
 GRAPHRAG_INDEX_PATH = "./data/knowledge_graph.json"  # 图谱索引保存路径
 # 确保数据目录存在
 import os
 os.makedirs("./data", exist_ok=True)
+GRAPHRAG_COMMUNITY_ALGORITHM = os.environ.get("GRAPH_COMMUNITY_ALGORITHM", "louvain")  # 社区检测算法: louvain, greedy, label_propagation
 GRAPHRAG_MAX_HOPS = 2  # 本地查询最大跳数
 GRAPHRAG_TOP_K_COMMUNITIES = 5  # 全局查询使用的社区数量
 GRAPHRAG_BATCH_SIZE = 10  # 实体提取批处理大小
+GRAPH_ENTITY_EXTRACTION_MODEL = os.environ.get("GRAPH_ENTITY_EXTRACTION_MODEL", "llama2")
+GRAPH_RELATION_EXTRACTION_MODEL = os.environ.get("GRAPH_RELATION_EXTRACTION_MODEL", "llama2")
+GRAPH_COMMUNITY_DETECTION = os.environ.get("GRAPH_COMMUNITY_DETECTION", "true").lower() == "true"
+GRAPH_VISUALIZATION = os.environ.get("GRAPH_VISUALIZATION", "true").lower() == "true"
+GRAPH_LAYOUT = os.environ.get("GRAPH_LAYOUT", "spring")
 # 混合检索策略配置
+ENABLE_HYBRID_SEARCH = os.environ.get("ENABLE_HYBRID_SEARCH", "true").lower() == "true"  # 是否启用混合检索策略
+HYBRID_SEARCH_WEIGHTS = {"vector": 0.5, "keyword": 0.5}  # 向量检索和关键词检索的权重
 KEYWORD_SEARCH_K = 5  # 关键词检索返回的文档数量
+BM25_K1 = float(os.environ.get("BM25_K1", "1.5"))  # BM25算法的k1参数
+BM25_B = float(os.environ.get("BM25_B", "0.75"))  # BM25算法的b参数
 # 查询扩展优化配置
+ENABLE_QUERY_EXPANSION = os.environ.get("ENABLE_QUERY_EXPANSION", "true").lower() == "true"  # 是否启用查询扩展
+QUERY_EXPANSION_MODEL = os.environ.get("QUERY_EXPANSION_MODEL", "mistral")  # 用于查询扩展的模型
 QUERY_EXPANSION_PROMPT = """请为以下查询生成3-5个相关的扩展查询，这些查询应该从不同角度探索原始查询的主题。
 原始查询: {query}
 扩展查询: """  # 查询扩展提示模板
+MAX_EXPANDED_QUERIES = int(os.environ.get("QUERY_EXPANSION_TOP_K", "5"))  # 最多使用的扩展查询数量
 # 多模态支持配置
+ENABLE_MULTIMODAL = os.environ.get("ENABLE_MULTIMODAL", "true").lower() == "true"  # 是否启用多模态支持
+MULTIMODAL_IMAGE_MODEL = os.environ.get("MULTIMODAL_IMAGE_MODEL", "openai/clip-vit-base-patch32")  # 图像嵌入模型
 SUPPORTED_IMAGE_FORMATS = ["jpg", "jpeg", "png", "gif", "bmp"]  # 支持的图像格式
 IMAGE_EMBEDDING_DIM = 512  # 图像嵌入维度
 MULTIMODAL_WEIGHTS = {"text": 0.7, "image": 0.3}  # 文本和图像检索的权重