pytorch-dataset
ETL
Extract, 提取数据集
Transform, 转换为张量
Load, 数据放在易于访问的对象中
torchvision
提供对流行的数据集、模型架构和计算机视觉的图像转换的访问的包
torchvision.utils
torchvision.utils.make_gird()
把很多图像的张量拼在一起
1 | # 参数: |
源码: https://pytorch.org/vision/stable/_modules/torchvision/utils.html#make_grid
如果传入图像是单通道灰度图,会转化为三通道的,源码部分:
1 | if tensor.dim() == 4 and tensor.size(1) == 1: # single-channel images |
torchvision.transforms
图像处理的通用转换接口
类:Dataset, DataLoader
class | description |
---|---|
torch.utils.data.Dataset | 一个表示数据集的抽象类 |
torch.utils.data.DataLoader | 封装数据集,提供对底层数据的访问 |
两个类都是可迭代的,但 DataLoader 可以提供封装 batch 的功能
1 | import numpy as np |
输出:
1 | dataset |