首先,了解一点numpy数组基本属性。
属性含义narray.ndim秩,维数,一维数组的秩为1,二维数组的秩为2narray.shape维度表示,行数、列数等narray.size元素总个数, 等于shape属性中元组元素的乘积narray.dtype元素类型一二维数组没有什么好说,三维数组的transpose找对应关系稍微复杂,不过相比于寻找具体的对应关系,我觉得更好理解的是:
第0个维度:对应有多少个二维数组第1个维度:对应每个二维数组的行数第2个维度:对应每个二维数组的列数举个简单例子:
img = Image.open(r"G:\tmp\wbc.jpg") img_arr = np.array(img).astype(np.uint8) print(img_arr.shape) print(img_arr) img_arr = img_arr.transpose(2, 0, 1) print(img_arr.shape) print(img_arr)一个540 * 720的图片,通过numpy转为数组的shape是(720,540,3),相当于720个540行3列的数组,参数对应关系:
第0个维度:720第1个维度:540第2个维度:3我们可以通过transpose(2, 0, 1),把数组变为第二个参数变为第0个参数,第0个参数变为第一个,第一个参数变为第二个,于是:
第0个维度:3第1个维度:720第2个维度:540这样数组的shape就变为(3,720,540),相当于3个720行,540列的二维数组,这样我们就成功的将RGB分离出来,方便进一步计算。
白平衡中的灰度世界算法:
import numpy as np from PIL import Image def gray_world(src_img_path, dest_img_path): """ 灰度世界算法 """ src_img = Image.open(src_img_path) # 图形转numpy数组 image_arr = np.array(src_img).astype(np.uint32) # 分离RGB image_arr = image_arr.transpose(2, 0, 1) avg_red = np.average(image_arr[0]) avg_green = np.average(image_arr[1]) avg_blue = np.average(image_arr[2]) gray = (avg_red + avg_green + avg_blue) / 3 kred = gray / avg_red kgreen = gray / avg_green kblue = gray / avg_blue image_arr[0] = np.minimum(image_arr[0] * kred, 255) image_arr[1] = np.minimum(image_arr[1] * kgreen, 255) image_arr[2] = np.minimum(image_arr[2] * kblue, 255) # 重新合并RGB image_arr = image_arr.transpose(1, 2, 0) # numpy数组转图像 img = Image.fromarray(image_arr.astype('uint8')).convert('RGB') img.save(dest_img_path) if __name__ == '__main__': img_path = r"G:\tmp\2d.jpg"; gray_world(img_path, r"G:\tmp\gray_world.jpg")