应用介绍
GCA 将每个 chunk 的检索相关分通过 softmax 得到一个概率分布,将其作为权重对第一步所有 chunk 的表征进行加权求和,融合所有 chunk 信息用于下一个 token 预测。在反向传播过程中,更有助于预测下文的 chunk 将被分配更大的权重,从而实现检索模块的端到端学习。
GCA 将每个 chunk 的检索相关分通过 softmax 得到一个概率分布,将其作为权重对第一步所有 chunk 的表征进行加权求和,融合所有 chunk 信息用于下一个 token 预测。在反向传播过程中,更有助于预测下文的 chunk 将被分配更大的权重,从而实现检索模块的端到端学习。