PyTorch实现更新部分网络,其他不更新

torch.Tensor.detach()的使用

detach()的官方说明如下：

Returns a new Tensor, detached from the current graph.
The result will never require gradient.

假设有模型A和模型B，我们需要将A的输出作为B的输入，但训练时我们只训练模型B. 那么可以这样做：

input_B = output_A.detach()

它可以使两个计算图的梯度传递断开，从而实现我们所需的功能。

以上这篇PyTorch实现更新部分网络,其他不更新就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。