首页 > python教程

浅谈tensorflow 中的图片读取和裁剪方式

时间:2020-09-03 python教程 查看: 843

一 方式1: skimage

from skimage import data, io, transform, color 
import matplotlib.pyplot as plt 

# io.imread 读出的图片格式是uint8,value是numpy array 类型。
image = data.coffee()
image = io.imread(dir)

plt.imshow(image)
plt.show()

io.save('1.jpg',image) #保存图像

image_gray = color.rgb2gray(image) #转换为灰度图像
io.save('2.jpg',image_gray)

# 通过transform.resize()裁剪后的图片是以 float64的格式存储的,数值的取值范围是(0~1)
image_ = transform.resize(image,(200,200))
img = image_ * 255 #将图片的取值范围改成(0~255)
img = img.astype(np.uint8) 
img = image_ * 255 #将图片的取值范围改成(0~255)
img = img.astype(np.uint8) 

二、方式2:cv2

import cv2
import matplotlib.pyplot as plt 

# cv2.imread读出的图片格式是uint8,value也是numpy array 类型。
# 图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。
image=cv2.imread(dir) 
b,g,r = cv2.split(image)  #将图像通道分离开 
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 
#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式 
plt.imshow(rgb_image) 

# 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255)
image_cv2 = cv2.resize(rgb_image)

image=cv2.imread(dir) 
b,g,r = cv2.split(image)  #将图像通道分离开 
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 
#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式 
plt.imshow(rgb_image) 

# 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255)
image_cv2 = cv2.resize(rgb_image)

补充知识:tensorflow中两种读图及裁剪图片的区别(io.imread和cv2.imread)以及(transform.resize和cv2.resize)

Tensorflow中,在训练图片数据之前,需要先对图片进行预处理,读图和裁剪是最基本的两步。常见的的读图何裁剪分别有两种方式,这里小编将和大家分享下这几种方式的实现以及他们之间的区别。

一、常见的两种读图方式 io.imread() 和 cv2.imread()

1.io.imread 读出的图片格式是uint8,value是numpy array 类型。对于RGB 图片,图像数据是以RGB 的格式进行存储的。

2.cv2.imread读出的图片格式是uint8 ,value也是numpy array 类型。唯一的区别是,图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。特别是制作tfrecord 时,需要将图片通道改成RGB,具体代码如下。

import cv2
import matplotlib.pyplot as plt
from skimage import transform 
import numpy as np
import skimage.io as io 

train_dir = 'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg'

'''以cv2方式读取图片'''
image=cv2.imread(train_dir)
b,g,r = cv2.split(image)  #将图像通道分离开
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合

#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式
plt.imshow(rgb_image)

'''以io.imread方式读取图片'''
#image = io.imread(train_dir) #读图并显示 
#plt.imshow(image)

二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()

1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的, 数值的取值范围是(0~255)

2.通过transform.resize()裁剪后的图片是以 float64的格式存储的,数值的取值范围是(0~1)。通常在制作tfrecord 数据集的过程中,我们需要将其转换成numpy array的形式,具体代码如下

'''以io.imread方式读取图片并使用transform形式裁剪图片'''
image = io.imread(train_dir) #读图并显示 
plt.imshow(image)
image =transform.resize(image, (208, 208))
img = image * 255 #将图片的取值范围改成(0~255)
img = img.astype(np.uint8) 

plt.imshow(img) 

读图和裁剪图片在制作tfrecord数据集时,是很基础的步骤,在接下来,我还将进一步更新如何制作自己的tfrecord数据集,以及tfrecord的读取。如有谬误,还请大家斧正。

以上这篇浅谈tensorflow 中的图片读取和裁剪方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持python博客。

展开全文
上一篇:tensorflow下的图片标准化函数per_image_standardization用法
下一篇:python与pycharm有何区别
输入字:
相关知识
Python 实现图片色彩转换案例

我们在看动漫、影视作品中,当人物在回忆过程中,体现出来的画面一般都是黑白或者褐色的。本文将提供将图片色彩转为黑白或者褐色风格的案例详解,感兴趣的小伙伴可以了解一下。

python初学定义函数

这篇文章主要为大家介绍了python的定义函数,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助,希望能够给你带来帮助

图文详解Python如何导入自己编写的py文件

有时候自己写了一个py文件,想要把它导入到另一个py文件里面,所以下面这篇文章主要给大家介绍了关于Python如何导入自己编写的py文件的相关资料,需要的朋友可以参考下

python二分法查找实例代码

二分算法是一种效率比较高的查找算法,其输入的是一个有序的元素列表,如果查找元素包含在列表中,二分查找返回其位置,否则返回NONE,下面这篇文章主要给大家介绍了关于python二分法查找的相关资料,需要的朋友可以参考下