前言
本文只讨论二维三维中的permute用法
最近的Attention学习中的一个permute函数让我不理解
这个光说太抽象
我就结合代码与图片解释一下
首先创建一个三维数组小实例
import torchx = torch.linspace(1, 30, steps=30).view(3,2,5) # 设置一个三维数组print(x)print(x.size()) # 查看数组的维数
这里为了防止出现维数数值相同的巧合局面(例如三维数组(3,3,3)或者(2,4,4)等)
输出结果如下图
一般的把(3,2,5)解释为3维2行5列这里很容易让人迷迷糊糊
那么我们按照块,行,列理解起来会更容易一些
比如(3,2,5),表示3块 2*5的数组
以下我简单用3块3*3图偷懒举例 然后堆起来就是我们熟知的三维矩阵
接下来先简单介绍下permute()函数
permute(dims) 参数dims用矩阵的维数代入,一般默认从0开始。即第0维,第1维等等 也可以理解为,第0块,第1块等等。当然矩阵最少是两维才能使用permute 如是两维,dims分别为是0和1 可以写成permute(0,1)这里不做任何变化,维数与之前相同 如果写成permute(1,0)得到的就是矩阵的转置 如果三维是permute(0,1,2) 0代表共有几块维度:本例中0对应着3块矩阵 1代表每一块中有多少行:本例中1对应着每块有2行 2代表每一块中有多少列:本例中2对应着每块有5列 所以是3块2行5列的三维矩阵 这些0,1,2并没有任何实际的意义,也不是数值,只是用来标识区别。有点类似于x,y,z来区分三个坐标维度,是人为规定好的 三维情况直接用下面的代码来给大家讲解
三维情况
变化一:不改变任何参数
b = x.permute(0,1,2) # 不改变维度print(b)print(b.size())
发现此时矩阵没有变化,依然是按照之前的方式排列
变化二:1与2交换
b = x.permute(0,2,1) # 每一块的行与列进行交换,即每一块做转置行为print(b)print(b.size())
两张图片可以比较
在不改变每一块(即)的前提下,对每一块的行列进行对调(即二维矩阵的转置)
变化三:0与1交换
b = x.permute(1,0,2) # 交换块和行print(b)print(b.size())
两者比较可以看出块数和每块的行数发生了变化
即参数0对应的数值3块变成2块
参数1对应的2行变成3行
这个变化刚好是0与1 的位置交换,导致参数进行对调
此时变成了2块 3行 5列(初始为3块 2行 5列)
变化四:0与2交换
b = x.permute(2,1,0) # 交换块和列print(b)print(b.size())
此时参数0对应的3块经过permute已经变成了5块 参数2对应的5列已经变成了3列
变化五:0与1交换,1与2交换
b = x.permute(2,0,1) # 交换块和行和列print(b)print(b.size())
此时参数0对应的3块变成了5块 参数1对应的2行变成了3行 参数2对应的5列变成了2列
变化六:0与1交换,0与2交换
b = x.permute(1,2,0) # 交换块和行和列print(b)print(b.size())
此时参数0对应的3块变成了2块 参数1对应的2行变成了5行 参数2对应的5列变成了3列
总结
根据以上举得二维和三维例子可以知道permute()函数其实是对矩阵的块行列进行交换
里面的参数并不是具体数值
而是块行列的代指
写在最后
没想随手写的一篇居然这么多读者关注
我又在此篇文章的基础上,详细的解释了维度变化过程
能够更好的帮助大家理解permute函数的用法
进阶文章请戳我
原文:https://juejin.cn/post/7095308887263281189