🔍 维度成员检索
在 XpertAI 平台中,维度成员检索 是 ChatBI 智能体编排体系中的一个关键能力模块。 它通过对语义模型中的维度成员信息进行动态同步和向量化处理,为智能体提供更加精确的上下文感知和意图识别支持,极大提升了对话式数据分析的准确性和用户体验。
简而言之,维度成员检索能让智能体“知道有哪些可能的维度取值”,并“理解这些维度成员在不同业务语境下的语义含义”。
一、维度成员信息的同步与向量化
要启用维度成员检索功能,需要先完成语义模型中维度数据的同步与向量化。整个流程如下:
1. 维度成员同步(Sync)
在语义模型创建或更新后,手动触发维度成员的同步任务,流程包括:
- 刷新维度的成员清单。
- 上传并嵌入维度成员便于后续处理和检索。
2. 向量化处理(Embedding)
同步完成后,平台会对维度成员进行语义向量化处理,步骤包括:
- 利用内置或用户自定义的向量模型(如 OpenAI Embedding、通义 embedding 等)
- 将每个维度成员(及其别名、业务标签)转化为语义向量
- 将向量化结果存入平台内嵌的向量数据库(支持(开发中) FAISS / Qdrant / Milvus 等)
二、在 ChatBI 工具集中如何使用
完成向量化后,这些维度成员信息将通过 Dimension Member Retriever 工具 接入 ChatBI 智能体的工具链中,具体作用如下:
智能体调用流程:
- 意图识别阶段:智能体判断用户的查询是否包含模糊维度描述(如“华东”、“xx 客户”、“节假日”)
- 检索调用阶段:通过 Dimension Member Retriever 进行语义向量比对,从维度成员库中找出最接近的匹配项
- 结果反查阶段:将匹配到的维度值作为过滤条件,参与查询构造和图表生成
应用示例:
用户问:“本月华东地区销售额如何?”
- 智能体通过 Retriever 匹配“华东” →
region = '华东'
- 智能体通过 Retriever 匹配“华东” →
用户问:“节假日期间哪类产品卖得好?”
- 匹配“节假日”维度成员 → 自动带入节假日对应时间段进行分析
🧠 ChatBI 会根据维度的业务标签、拼音、英文别名等进行模糊识别和上下文推理。
三、业务价值与优势
功能 | 业务优势 |
---|---|
动态同步维度成员 | 保证维度成员信息实时更新,减少漏查 |
向量化识别 | 提升自然语言识别精度,支持模糊匹配 |
多语言理解 | 覆盖国际化场景,多语种维度名均可识别 |
业务语义感知 | 智能理解业务别名、缩写与分类标签 |
无需规则维护 | 相比传统关键词匹配方案,无需手动维护映射表 |
四、使用注意事项
- 数据源访问权限:确保维度成员来源的数据表具备完整读取权限;
- 数据量与性能:对于百万级维度成员数据,建议按需配置向量抽取频率与索引分区;
- 语言一致性:如存在中英文混用场景,请在语义模型中设置成员多语言标签或别名字段;
- 定期更新机制:业务维度(如客户、产品)建议设定定期同步计划(如每日或每小时);
- 隐私合规:如维度中包含客户、用户等敏感信息,需做好脱敏与权限隔离控制;
五、后续计划
我们计划在未来版本中:
- 支持用户自定义维度成员语义标签
- 引入维度成员权重与热度指标,用于增强匹配精度
- 提供维度成员管理后台,支持手动编辑与审阅