[深度学习] pytorch学习笔记(1)(数据类型、基础使用、自动求导、矩阵操作、维度变换、广播、拼接拆分、基本运算、范数、argmax、矩阵比较、where、gather)

[深度学习] pytorch学习笔记(1)(数据类型、基础使用、自动求导、矩阵操作、维度变换、广播、拼接拆分、基本运算、范数、argmax、矩阵比较、where、gather)

一、Pytorch安装

安装cuda和cudnn,例如cuda10,cudnn7.5

官网下载torch:https://pytorch.org/ 选择下载相应版本的torch 和torchvision的whl文件

使用pip install whl_dir安装torch,并且同时安装torchvision

二、初步使用pytorch

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch
import time
# 查看torch版本
print(torch.__version__)
# 定义矩阵a和b,随机值填充
a = torch.randn(10000, 1000)
b = torch.randn(1000, 2000)
# 记录开始时间
t0 = time.time()
# 计算矩阵乘法
c = torch.matmul(a, b)
# 记录结束时间
t1 = time.time()
# 打印结果和运行时间
print(a.device, t1 - t0, c.norm(2))   # 这里的c.norm(2)是计算c的L2范数

# 使用GPU设备
device = torch.device('cuda')
# 将ab搬到GPU
a = a.to(device)
b = b.to(device)
# 运行,并记录运行时间
t0 = time.time()
c = torch.matmul(a, b)
t1 = time.time()
# 打印在GPU上运行所需时间
print(a.device, t1 - t0, c.norm(2))

# 再次运行,确认运行时间
t0 = time.time()
c = torch.matmul(a, b)
t1 = time.time()
print(a.device, t1 - t0, c.norm(2))

运行结果如下:

1.1.0
cpu 0.14660906791687012 tensor(141129.3906)
cuda:0 0.19049072265625 tensor(141533.1250, device='cuda:0')
cuda:0 0.006981372833251953 tensor(141533.1250, device='cuda:0')

我们发现,两次在GPU上运行的时间不同,第一次时间甚至超过CPU运行时间,这是因为第一次运行有初始化GPU运行环境的时间开销。

三、自动求导

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

# 定义a b c x的值,abc指定为需要求导requires_grad=True
x = torch.tensor(2.)
a = torch.tensor(1., requires_grad=True)
b = torch.tensor(2., requires_grad=True)
c = torch.tensor(3., requires_grad=True)
# 定义y函数
y = a * x ** 2 + b * x + c;
# 使用autograd.grad自定求导
grads = torch.autograd.grad(y, [a, b, c])
# 打印abc分别的导数值(带入x的值)
print('after', grads[0],grads[1],grads[2])

四、pytorch数据类型

[深度学习] pytorch学习笔记(1)(数据类型、基础使用、自动求导、矩阵操作、维度变换、广播、拼接拆分、基本运算、范数、argmax、矩阵比较、where、gather)

查看数据的类型:

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

a = torch.randn(2, 3)

print(a.type())  # 打印torch.FloatTensor
print(type(a))  # 打印<class 'torch.Tensor'>
print(isinstance(a, torch.FloatTensor))  # 打印True

print(isinstance(a, torch.cuda.FloatTensor))  # 打印False
# 将a放到GPU中
a = a.to(torch.device('cuda'))
# 或这样也可以
a = a.cuda()
print(isinstance(a, torch.cuda.FloatTensor))  # 打印True

查看数据的维度等信息:

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

a = torch.randn(2, 3)

# b是一个dim为0的标量(就是一个数)
b = torch.tensor(2.2)

# 查看shape
print(a.shape)  # 返回torch.Size([2,3])
print(b.shape)  # 返回torch.Size([])
print(len(a.shape))  # 返回2
print(len(b.shape))  # 返回0,表示dim为0
# size()和shape是一样的,size是成员函数,shape是成员属性
print(a.size())  # 返回torch.Size([2,3])
print(a.size(0)) # 返回2
print(a.size(1)) # 返回3
print(b.size())  # 返回torch.Size([])
# 返回a的维度,返回2,表示2D矩阵
print(a.dim())

五、pytorch基本使用

定义数据:

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch
import numpy as np

# 建议使用torch.tensor()来直接赋值
a = torch.tensor([1., 2., 3.])  # 直接赋值(建议)
# 不建议用FloatTensor来直接赋值,避免混淆
a_2 = torch.FloatTensor([1.,2.,3.]) # 也可以用FloatTensor赋值

# 建议使用FloatTensor传入shape来定义数据结构
b = torch.FloatTensor(1)  # 参数表示shape,这里是2个元素的向量,值未初始化,可能很大或很小
c = torch.FloatTensor(3, 2)  # 这里表示维度为[3,2]的矩阵,值未初始化,可能很大或很小

d = torch.ones(3, 3)  # 定义维度为[3,3]的全1矩阵

# 同numpy来转换数据
e_np = np.ones((3, 3))  # 定义numpy的全1 ndarray
e = torch.from_numpy(e_np)  # 使用numpy转换到tensor

print('a: ', a)
print('b: ', b)
print('c: ', c)
print('d: ', d)
print('e: ', e)

打印结果:

a:  tensor([1., 2., 3.])
b:  tensor([1.1729e-42])
c:  tensor([[4.0006e-28, 8.5339e-43],
        [2.3196e-07, 4.5909e-41],
        [0.0000e+00, 0.0000e+00]])
d:  tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]])
e:  tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)

随机数据与不同dim的数据:

# 正太分布随机数
randn_mat = torch.randn(2,3)
print(randn_mat)
# 均匀分布随机数,范围[0,1]
rand_mat = torch.rand(2,3)
print(rand_mat)
# Int随机,返回[0,10),注意是前闭后开区间
randint_mat = torch.randint(0,10,[3,3])
print(randint_mat)

# 二维tensor,可以表示4张mnist图片(图片已fla)
tensor_2d = torch.rand(4,784)
# 三维tensor,可以表示20句话,每句话10个单词,每个单词用onehot来表示[1,100]
tensor_3d = torch.rand(20,10,100)
# 四维tensor,可以表示4张mnist图片,h w都是28,channel为1
tensor_4d = torch.rand(4,1,28,28)

# 使用和tensor_4d相同的随机方式和维度定义tensor_4d_2
tensor_4d_2 = torch.rand_like(tensor_4d)

# 看tensor_4d有多少元素
print(torch.numel(tensor_4d))

设置默认Tensor类型:(在某个场景需要使用高精度double)

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

torch.set_default_tensor_type(torch.DoubleTensor)

a = torch.Tensor([1.1,2.2])
print(a.type()) # 输出torch.DoubleTensor

生成同元素的矩阵:

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

# 生成一个元素全是7.0的2*3矩阵
a = torch.full([2,3],7.)
print(a)
# 生成一个元素全是7.0的2维向量
b = torch.full([2],7.)
print(b)
# 生成值为7.0的标量
c = torch.full([],7.)
print(c)

arange、linspace和logspace:

# linspace将[0,10]等分,steps表示数量(非步长)
aa = torch.linspace(0,10,steps=4)
print(aa) # 打印tensor([0.0000, 3.3333, 6.6667, 10.0000])
bb = torch.linspace(0,10,steps=10)
print(bb)
# 将[0,1]分成10个数n,算base的n次方
cc = torch.logspace(0,1,steps=10,base=2)
print(cc) # 输出tensor([1.0000, 1.0801, ... ,2.0000])
dd = torch.logspace(0,-1,steps=10)
print(dd)

# [0,10)之间等差数列,step为步长
ee = torch.arange(0,10,step=2)
print(ee) # 输出tensor([0,2,4,6,8])

生成全一矩阵,零矩阵,单位矩阵:

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

# 3*3全一矩阵
a = torch.ones(3,3)
# 生成一个shape和a一样的全一矩阵
a_2 = torch.ones_like(a)
# 3*3零矩阵
b = torch.zeros(3,3)
# 生成一个shape和a一样的零矩阵
b_2 = torch.zeros_like(a)
# 3*3单位矩阵
c = torch.eye(3,3)  # 或torch.eye(3)
# 如果不是方阵,会自动填充0,不会报错
d = torch.eye(3,4)
d_2 = torch.eye(4,3)

使用随机种子来完成shuffle:

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

a = torch.rand(10, 3)
b = torch.rand(10, 2)
print('a:', a)
print('b:', b)

# 产生一个随机顺序的index向量,根据需要shuffle的实际数据的维度
idx = torch.randperm(10)
print('idx:', idx)  # 这里输出的是[0,10)的一维向量,顺序是乱的

# 用同一个随机种子做shuffle,如果需要shuffle顺序不同,则需要产生不同的idx
a = a[idx]  # 相当于做了shuffle
b = b[idx]  # 相当于做了shuffle
print('a after shuffle:', a)
print('b after shuffle:', b)

索引和切片:

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch
import numpy as np

a = torch.rand(4, 3, 32, 32)
# 基本索引(和numpy类似)
print(a[2][1][15][15])
print(a[2, 1, 15, 15])

# 切片索引(和numpy类似)
print(a[:2, :-1, 3:6, 7:9].size())
print(a[:1, :, :, :].size())

# 带步长的切片索引(和numpy类似)
print(a[:, :2, :18:2, ::3].shape)

# 指定某一个维度截取,例如取0,1和第3张图片
print(a.index_select(0, torch.tensor([0, 1, 3])).size())
# 取所有图片,但只取0和2个channel
print(a.index_select(1, torch.tensor([0, 2])).size())
# 取图片的上半部分
print(a.index_select(2, torch.arange(0, 14)).size())
# 取图片的右半部分
print(a.index_select(3, torch.arange(14, 28)).size())

# 使用...来方便取值
print(a[0, ...].size())
print(a[:, :2, ...].size())
print(a[..., :13, :].size())

# 使用mask来取值
b = torch.randn(5, 5)
# 大于0.5的位置为1,小于0.5的位置为0
mask = b.ge(0.5)
print(mask.type())  # type为ByteTensor
# 得到的b_seleted是一个向量,和b的维度没有关系
b_seleted = torch.masked_select(b, mask)
print(b_seleted.size())  # 输出torch.Size(7),根据b中数据大于0.5的元素个数

# 对flatten以后的数据按index取值(不常用)
token = torch.take(b, torch.tensor([2, 6, 13, 22, 24]))
print(token.size())  # 输出torch.Size(5)

六、维度变换

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

a = torch.rand(4, 1, 28, 28)

a_1 = a.view(4, 784)
print(a_1.size())
a_2 = a.view(4, 1, 28, 28)
print(a_2.size())
a_3 = a.view(4 * 1 * 28, 28)
print(a_3.size())
# 尽量不要这样转,因为乱转维度可能破坏数据的几何特性
a_4 = a.view(4, 28, 28, 1)
print(a_4.size())

七、squeeze和unsqueeze

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

## 添加维度
src1 = torch.rand(4,1,28,28)

# 在size的index=0的位置插入一个维度,比如理解为batch,每个batch有4张图片
b = src1.unsqueeze(0)
print(b.size())  # 输出torch.Size([1, 4, 1, 28, 28])
# 在size的最后一个位置插入一个维度
c = src1.unsqueeze(-1)
print(c.size())  # 输出torch.Size([4, 1, 28, 28, 1])

##======================================##
## 删除维度
src2 = torch.rand(1,32,3,1)

# 删除所有可以删除的维度
d = src2.squeeze()
print(d.size())
# 删除第一个维度
e = src2.squeeze(0)
print(e.size())
# 删除最后一个维度
f = src2.squeeze(-1)
print(f.size())

八、expand和repeat

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

src = torch.rand(4, 32, 14, 14)
b = torch.rand(1, 32, 1, 1)

### 使用expand来扩展维度
### 注意,被扩展的维度只能是1-->n,而不能是m-->n。数据会自动复制
# 将c扩展为torch.Size([4,32,14,14])
c = b.expand(4, 32, 14, 14)
# 将c扩展为和src一样的维度
d = b.expand_as(src)
print(c.size())
print(c)
print(d.size())
print(d)

# 只指定需要扩展的维度,其他维度不动可以填-1
e = b.expand(4, -1, -1, -1)
print(e.size())  # 输出torch.Size([4,32,1,1])

##====================================##
## 使用repeat来扩展维度
# repeat的参数不是代表扩展后的维度,而是分别需要复制多少次
f = b.repeat(4, 1, 14, 14)
print(f.size())  # 扩展后的维度为torch.Size([4,32,14,14])

九、转置和transpose

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

a = torch.rand(3, 4)

# a的转置
a_t = a.t()
print(a_t.size())

### 使用transpose交换维度
# 假设b代表4张mnist图片,维度分别代表B,C,H,W
b = torch.rand(4, 1, 28, 28)
# 将b的C和W维度交换,得到的维度为B,W,H,C
b_trans = b.transpose(1, 3)
print(b_trans.size())  # 输出torch.Size([4,28,28,1])

# 在交换维度后,需要随时用contiguous()来将数据重新归为连续状态
c = torch.rand(4, 3, 32, 32)
# 交换维度,然后使之连续,然后调整维度,然后再交换回来,看c和d是否一致
d = c.transpose(1, 3).contiguous().view(4, 32, 32, 3).transpose(1, 3)
# 如果输出为1,则表示c和d数据相同
print(torch.all(torch.eq(c, d)))

### 使用permute()直接调整所有维度的顺序
# 将维度变为H,W,C,B
e = c.permute(2,3,1,0)
print(e.size())

十、broadcasting广播

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

# 假设得到一个feature map,维度为4,64,20,20(B,C,H,W)
fm = torch.zeros(4, 64, 20, 20)
print(fm.type())

# 要为每一个channel加上一个bias(每个channel对应一个卷积核的结果)
bias = torch.arange(64)
# 将LongTensor转换为FloatTensor
bias = bias.type(torch.FloatTensor)
print(bias.size())
# 我们要给每个channel对应的4张20*20的feature map的所有元素加上bias
# 首先我们要从最小(最小范围)的维度开始扩展
bias = bias.unsqueeze(-1).unsqueeze(-1)
print(bias.size())
# 在fm的channel后面有H和W两个维度,所以我们在bias后面添加两个维度
# 然后使用broadcasting
res = fm+bias
print(res.size())
print(res)

十一、矩阵拼接

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

### 使用concat拼接矩阵
a = torch.rand(3, 4)
b = torch.rand(5, 4)
# 对行拼接,即3行+5行=8行。类似于excel中条目累加
ab_cat = torch.cat([a, b, ], dim=0)
print(ab_cat.size())  # 输出torch.Size([8,4])

c = torch.rand(4, 5)
d = torch.rand(4, 6)
# 对列拼接,即5列+6列=11列。类似于excel中不同字段拼接
cd_cat = torch.cat([c, d], dim=1)
print(cd_cat.size())  # 输出torch.Size([4,11])

# 在googLenet中对于Inception的拼接,是按channel进行拼接的
res_conv3 = torch.rand(4, 64, 28, 28)
res_conv1 = torch.rand(4, 128, 28, 28)
res = torch.cat([res_conv3, res_conv1], 1)
print(res.size())  # 输出torch.Size([4,192,28,28])

### 使用stack组合两个矩阵
aa = torch.rand(32, 8)
bb = torch.rand(32, 8)
# 将两个矩阵组合起来,并且在指定位置创建新维度
# 可以理解为两张图片组成一个batch,而不是两张图片拼在一起
ac_stack = torch.stack([aa, bb], dim=0)
print(ac_stack.size())  # 输出torch.Size([2,32,8])

十二、矩阵拆分

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

### 使用split拆分矩阵
a = torch.rand(2, 32, 8)
# 平均拆分
a1, a2 = a.split(1, dim=0)
print(a1.size())  # torch.Size([1,32,8])

b = torch.rand(7, 32, 8)
# 按个数拆分
b1, b2, b3 = b.split([3, 3, 1], dim=0)
print(b1.size())  # torch.Size([3,32,8])

### 使用chunk拆分矩阵
c = torch.rand(8, 32, 8)
# 将c拆分在dim=0上拆分为两半
c1, c2 = c.chunk(2, dim=0)
print(c1.size())
# 拆分为4份
c3, c4, c5, c6 = c.chunk(4, dim=0)
print(c3.size())
# 拆分为3份,3+3+2
c7, c8, c9 = c.chunk(3, dim=0)
print(c7.size(), c8.size(), c9.size())

十三、基本运算

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

a = torch.rand(3, 4)
b = torch.rand(4)

### 基本运算
# a+b broadcasting
ab_sum1 = a + b
ab_sum2 = torch.add(a, b)
print(torch.all(ab_sum1.eq(ab_sum2)))
# a-b broadcasting
ab_sub1 = a - b
ab_sub2 = torch.sub(a, b)
print(torch.all(ab_sub1.eq(ab_sub2)))
# a*b broadcasting
ab_mul1 = a * b
ab_mul2 = torch.mul(a, b)
print(torch.all(ab_mul1.eq(ab_mul2)))
# a/b broadcasting
ab_div1 = a / b  # 整除用//
ab_div2 = torch.div(a, b)
print(torch.all(ab_div1.eq(ab_div2)))

### 矩阵乘法
c = torch.rand(2, 3)
d = torch.rand(3, 4)
# 矩阵乘法的三种方式,推荐第二种,即matmul()和第三种@
cd_mm1 = torch.mm(c, d)
cd_mm2 = torch.matmul(c, d)
cd_mm3 = c @ d
print(torch.all(cd_mm1.eq(cd_mm2)))
print(torch.all(cd_mm2.eq(cd_mm3)))

### 超过二维的矩阵乘法
e = torch.rand(4, 3, 28, 64)
f = torch.rand(4, 3, 64, 32)
# 只针对最后两维做乘法,前面的两维至少要满足能够broadcasting
ef_mm = e @ f
print(ef_mm.size())  # 输出torch.Size([4,3,28,32])

g = torch.rand(4, 1, 64, 32)
# 这里的第二个维度使用了broadcasting
eg_mm = e @ g
print(eg_mm.size())  # 输出torch.Size([4,3,28,32])

### 错误示范
# h = torch.rand(4, 64, 32)
# # 由于无法执行broadcast,报错
# eh_mm = e @ h
# print(eh_mm.size())


aa = torch.full([3, 3], 10)
### N次方
# 使用以下两种方式计算N次方
print(aa.pow(2))
print(aa ** 3)

### 平方根
print(aa.sqrt())
# 平方根的倒数
print(aa.rsqrt())
# 开三次方
print(aa ** (1 / 3))

### exp
bb = torch.exp(aa)
print(bb)

### log
a_log10 = torch.log10(aa)
a_log2 = torch.log2(aa)
b_log = torch.log(bb)  # 以e为底
print(a_log10)
print(a_log2)
print(b_log)

### 向上向下取整
aaa = torch.randn(2, 3)
a_floor = aaa.floor()  # 向下取整
a_ceil = aaa.ceil()  # 向上取整
print(a_floor)
print(a_ceil)

### 截取整数和小数
a_trunc = aaa.trunc()  # 截取整数部分
a_frac = aaa.frac()  # 截取小数部分
print(a_trunc)
print(a_frac)

### 四舍五入
a_round = aaa.round()
print(a_round)

### 最大值最小值,中值,平均
grad = torch.randn(2, 3) * 15
print(grad)
print(grad.max())  # 最大值
print(grad.min())  # 最小值
print(grad.mean())  # 平均值
print(grad.median())  # 中间值
print(grad.prod()) # 所有元素累乘
print(grad.sum()) #所有元素求和
# 将小于10的数全部置为5,大于5的数不变
print(grad.clamp(5))
# 将数值全部限定在0-10范围,大于10的取10,小于0的取0.
print(grad.clamp(0, 10))

十四、范数

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

### 范数norm
a = torch.ones(8)
b = torch.ones(2, 4)
c = torch.ones(2, 2, 2)

print(a.norm(1), b.norm(1), c.norm(1))  # 8,8,8
print(a.norm(2), b.norm(2), c.norm(2))  # 2.8284,2.8284,2.8284

# 指定在哪一维上做norm
# 在b的dim=1上做L1范数
print(b.norm(1, dim=1))  # [4,4]
print(b.norm(2, dim=1))  # [2,2]

print(c.norm(1, dim=0))  # [[2,2],[2,2]]
print(c.norm(2, dim=0))  # [[1.4142,1.4142],[1.4142,1.4142]]

十五、argmax和argmin

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

a = torch.arange(12)
idx = torch.randperm(12)
a = a[idx]
a = a.view(3, 4).type(torch.float32)
print(a)

# 不带参数的argmax和argmin会把矩阵压平来返回index
print(a.argmax())
print(a.argmin())

# 如果想要在某个维度上使用argmax和argmin
# 返回每一列上最大值的index组成的向量,维度等于行的维度
print(a.argmax(dim=0))
# 获取每一列的最大值组成的向量,以及对应index组成的向量
print(a.max(dim=0))
# 返回每一行上最小值的index组成的向量,维度等于列的维度
print(a.argmin(dim=1))
# 获取每一行的最小值组成的向量,以及对应index组成的向量
print(a.min(dim=1))

### keepdim
# 返回的不是一个向量,返回保持是矩阵[3,4]--->[3,1],而不是[3]
print(a.max(dim=1, keepdim=True).values.size())  # torch.Size([3,1])

### 获取topk
# 获取最大top2,[3,4]--->[3,2]
print(a.topk(2, dim=1))
# 获取最小top3,[3,4]--->[3,3]
print(a.topk(3, dim=1, largest=False))

### 获取第n小
# 获取每行第3小的数及index
print(a.kthvalue(3, dim=1))
# 获取每列第2小的数及index
print(a.kthvalue(2, dim=0))

十六、矩阵比较

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

a = torch.randn(3, 4)
print(a)
# 大于,满足的位置为1,不满足的位置为0
print(a > 0)
print(torch.gt(a, 0))
# 大于等于,同上
print(a >= 0)
print(torch.ge(a, 0))
# 小于,同上
print(a < 0)
print(torch.lt(a, 0))
# 小于等于,同上
print(a <= 0)
print(torch.le(a, 0))
# 不等于,同上
print(a != 0)
# 等于,同上
print(a == 0)
print(torch.eq(a, a))

# 判断是否一样,和上面的不一样
print(torch.equal(a, a))  # 输出True(和前面不一样)

十七、高级操作where gather

# -*- coding:utf-8 -*-
__author__ = 'Leo.Z'

import torch

### 高级操作where,可以实现高度并行的赋值
a = torch.tensor([[1, 2], [3, 4]])
b = torch.tensor([[5, 6], [7, 8]])

# 我们使用一个condition矩阵来决定取a和b中的哪些值来组成c
cond = torch.ByteTensor([[0, 1], [1, 0]])
# 通过cond来选择每一个元素从a还是b中获得,1表示a,0表示b
c = torch.where(cond, a, b)
print(c)

# 还可以这样用
cond2 = torch.rand(2, 2)
c2 = torch.where(cond2 > 0.5, a, b)
print(c2)

### 高级操作gather,实现查表
# 假设33是dog,44是cat,55是fish
table = torch.tensor([33, 44, 55])
# 假设我有一个向量,所有元素都是0,1,2。对应table中dim=0的3个index
find_list = torch.tensor([2, 1, 2, 0, 0, 1, 2])
found_in_table = torch.gather(table, dim=0, index=find_list)
print(found_in_table)  # 输出tensor([55,44,55,33,33,44,55])

# 也可以是多维的
table2 = torch.rand(4, 10)
find_list2 = torch.randint(0, 10, [4, 5])
# 在每一行中获取5个index对应的值
found_in_table2 = torch.gather(table2, dim=1, index=find_list2)
print(found_in_table2)  # 输出一个4*5的矩阵,其中的值都来自于table2