正确答案是:C: DSP 技术使用一个小型的优化策略语言模型来生成提示,以引导一个冻结的黑盒 LLM。
专业分析:
Directional Stimulus Prompting(DSP)技术的核心在于利用一个优化过的小型策略语言模型来生成提示,这些提示用于引导一个冻结的、不可更改的大型语言模型(LLM)生成所需的输出。在这种方法中,小型策略语言模型经过训练,可以生成有效的提示,从而使得冻结的黑盒 LLM 能够更准确地生成所需的摘要。
选项 A 和 D 提到的“可调节的策略语言模型”和“固定的策略语言模型”并不完全准确,因为 DSP 强调的是优化策略模型和冻结的 LLM 的组合。选项 B 提到的“强化学习”虽然是一种优化策略,但并没有具体指出使用小型模型生成提示这一关键点。因此,选项 C 最准确地描述了 DSP 技术的核心机制。