paddle.vision
paddle.vision 目录是飞桨在视觉领域的高层 API。具体如下:
内置数据集相关 API
| API 名称 | API 功能 | 
|---|---|
|  | 通用数据加载方式 DatasetFolder | 
|  | 通用数据加载方式 ImageFolder | 
|  | Cifar10 数据集 | 
|  | Cifar100 数据集 | 
|  | FashionMNIST 数据集 | 
|  | Flowers 数据集 | 
|  | MNIST 数据集 | 
|  | VOC2012 数据集 | 
内置模型相关 API
| API 名称 | API 功能 | 
|---|---|
|  | LeNet 模型 | 
|  | AlexNet 模型 | 
|  | AlexNet 模型 | 
|  | MobileNetV1 模型 | 
|  | MobileNetV1 模型 | 
|  | MobileNetV2 模型 | 
|  | MobileNetV2 模型 | 
|  | MobileNetV3Small 模型 | 
|  | MobileNetV3Large 模型 | 
|  | MobileNetV3Small 模型 | 
|  | MobileNetV3Large 模型 | 
|  | ResNet 模型 | 
|  | 18 层的 ResNet 模型 | 
|  | 34 层的 ResNet 模型 | 
|  | 50 层的 ResNet 模型 | 
|  | 101 层的 ResNet 模型 | 
|  | 152 层的 ResNet 模型 | 
|  | 50 层的 WideResNet 模型 | 
|  | 101 层的 WideResNet 模型 | 
|  | ResNeXt-50 32x4d 模型 | 
|  | ResNeXt-50 64x4d 模型 | 
|  | ResNeXt-101 32x4d 模型 | 
|  | ResNeXt-101 64x4d 模型 | 
|  | ResNeXt-152 32x4d 模型 | 
|  | ResNeXt-152 64x4d 模型 | 
|  | VGG 模型 | 
|  | 11 层的 VGG 模型 | 
|  | 13 层的 VGG 模型 | 
|  | 16 层的 VGG 模型 | 
|  | 19 层的 VGG 模型 | 
|  | DenseNet 模型 | 
|  | 121 层的 DenseNet 模型 | 
|  | 161 层的 DenseNet 模型 | 
|  | 169 层的 DenseNet 模型 | 
|  | 201 层的 DenseNet 模型 | 
|  | 264 层的 DenseNet 模型 | 
|  | InceptionV3 模型 | 
|  | InceptionV3 模型 | 
|  | GoogLeNet 模型 | 
|  | GoogLeNet 模型 | 
|  | SqueezeNet 模型 | 
|  | squeezenet1_0 模型 | 
|  | squeezenet1_1 模型 | 
|  | ShuffleNetV2 模型 | 
|  | 输出通道缩放比例为 0.25 的 ShuffleNetV2 模型 | 
|  | 输出通道缩放比例为 0.33 的 ShuffleNetV2 模型 | 
|  | 输出通道缩放比例为 0.5 的 ShuffleNetV2 模型 | 
|  | 输出通道缩放比例为 1.0 的 ShuffleNetV2 模型 | 
|  | 输出通道缩放比例为 1.5 的 ShuffleNetV2 模型 | 
|  | 输出通道缩放比例为 2.0 的 ShuffleNetV2 模型 | 
|  | 使用 swish 进行激活的 ShuffleNetV2 模型 | 
视觉操作相关 API
| API 名称 | API 功能 | 
|---|---|
|  | 读取并输出文件的字节内容(1-D Tensor) | 
|  | 将 JPEG 图像解码为三维 RGB Tensor 或者 一维灰度 Tensor | 
|  | 兴趣区域的最大池化 | 
|  | 兴趣区域的最大池化 | 
|  | 位置敏感的兴趣区域池化 | 
|  | 位置敏感的兴趣区域池化 | 
|  | 基于双线性插值的兴趣区域对齐 | 
|  | 基于双线性插值的兴趣区域对齐 | 
|  | 计算 2-D 可变形卷积 | 
|  | 计算 2-D 可变形卷积 | 
|  | 生成 YOLO 检测框 | 
|  | 计算 YOLO 损失 | 
|  | 为 SSD 系列目标检测算法生成候选框 | 
|  | 生成候选检测框 | 
|  | 将候选检测框分配到不同的 FPN 层级 | 
|  | 编码/解码带有先验框信息的目标边界框 | 
|  | 计算非极大抑制 | 
数据处理相关 API
| API 名称 | API 功能 | 
|---|---|
|  | 调整图像亮度 | 
|  | 调整图像对比度 | 
|  | 调整图像色调 | 
|  | 图像处理的基类,用于自定义图像处理 | 
|  | 调整图像亮度 | 
|  | 对图像进行中心裁剪 | 
|  | 对图像进行中心裁剪 | 
|  | 随机调整图像的亮度,对比度,饱和度和色调 | 
|  | 以列表的方式将数据集预处理的接口进行组合 | 
|  | 调整图像对比度 | 
|  | 对图像进行裁剪 | 
|  | 对图像进行灰度化 | 
|  | 水平翻转图像 | 
|  | 调整图像色调 | 
|  | 对图像进行归一化 | 
|  | 对图像进行归一化 | 
|  | 对图像进行填充 | 
|  | 对图像进行填充 | 
|  | 对图像随机裁剪 | 
|  | 基于概率水平翻转图像 | 
|  | 基于概率随机按照大小和长宽比对图像进行裁剪 | 
|  | 对图像随机旋转 | 
|  | 基于概率垂直翻转图像 | 
|  | 对图像调整大小 | 
|  | 对图像调整大小 | 
|  | 对图像随机旋转 | 
|  | 对图像进行透视变换 | 
|  | 基于概率对图像进行透视变换 | 
|  | 对图像进行仿射变换 | 
|  | 基于随机产生的变换矩阵参数,对图像进行仿射变换 | 
|  | 使用给定的值擦除输入图像选定区域中的像素 | 
|  | 擦除图像中随机选择的矩形区域内的像素 | 
|  | 调整图像饱和度 | 
|  | 对图像进行灰度化 | 
|  | 将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor` | 
|  | 将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor` | 
|  | 将输入的图像数据更改为目标格式 | 
|  | 垂直翻转图像 | 
其他 API
| API 名称 | API 功能 | 
|---|---|
|  | 获取用于加载图像的模块名称 | 
|  | 读取一个图像 | 
|  | 指定用于加载图像的后端 |