用 ptuning 做微调,希望输出长文本,并且输出的长文本能在多轮对话中依据上下文分段输出。
譬如这样的 prompt 训练样本: { "q" : "怎样做一个煎蛋,请分段输出每一个步骤", "a":“做煎蛋一共有三步。\n1. 开火,锅内加油至6成温度. \n2. 鸡蛋放入锅里,小火慢煎并翻面. \n3.起锅放入盘中,加少量生抽 ” }
微调后,希望得到下面的效果:
问: 怎样做一个煎蛋,请分段输出每一个步骤 答: 做煎蛋一共有三步。 问: 请输出第三步 答:3.起锅放入盘中,加少量生抽 问:请输出第二步 答:2. 鸡蛋放入锅里,小火慢煎并翻面.