zdaiot

Prototype Propagation Networks (PPN) for Weakly-supervised Few-shot Learning on Category Graph

发表于 2020-04-06 分类于 DeepLearningApplications ， Few-shot Learning
本文字数： 5.5k 阅读时长 ≈ 5 分钟

基本信息

标题：Prototype Propagation Networks (PPN) for Weakly-supervised Few-shot Learning on Category Graph
年份：2019
期刊：Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI-19)
标签：Few-shot Learning，prototype
数据：WS-ImageNet-Pure和WS-ImageNet-mix

创新点

引入了弱监督信息，去做Few-shot Learning。

创新点来源

阅读全文 »

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

发表于 2020-04-05 分类于 DeepLearningApplications ， Few-shot Learning
本文字数： 5.7k 阅读时长 ≈ 5 分钟

基本信息

标题：Rethinking Knowledge Graph Propagation for Zero-Shot Learning
年份：2019
期刊：Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition
标签：知识图谱、分类
数据：AwA2、ImageNet（图结构已知）

创新点

显式的利用知识图的层次结构通过提出的密集连通结构有效地传播知识，防止信息平滑掉。具体体现为使用层次化的父类邻接矩阵和层次化的子类邻接矩阵代替原始的邻接矩阵；并且根据父类和子类不同层次的，设置不同的权重，类似于attention机制。
两阶段的训练方法，第二阶段让CNN提取特征模块适配GNN学习到的分类器权重。

创新点来源

阅读全文 »

Learning to propagate labels：Transductive propagation network for few-shot learning

发表于 2020-04-05 分类于 DeepLearningApplications ， Few-shot Learning
本文字数： 4.4k 阅读时长 ≈ 4 分钟

基本信息

标题：Learning to propagate labels：Transductive propagation network for few-shot learning
年份：2019
期刊：ICLR
标签：transductive inference, few-shot learning
数据：miniImageNet，tieredImageNet

创新点

第一个提出用于Few-shot Learning的转导推理（transductive inference）
转导推理中，我们建议通过情景元学习（episodic meta-learning）来学习在不可见类的数据实例之间传播标签，这比基于启发式的标签传播算法表现要好得多
对于Few-shot Learning，我们的方法在miniImageNet，tieredImageNet数据集上均达到了最优性能。并且，对于Semi-supervised learning，我们的方法也超过了其它的Semi-supervised Few-shot Learning baselines

创新点来源

阅读全文 »

Multi-label Zero-Shot Learning with Structured Knowledge Graphs

发表于 2020-04-05 分类于 DeepLearningApplications ， Few-shot Learning
本文字数： 4.9k 阅读时长 ≈ 4 分钟

基本信息

标题：Multi-label Zero-Shot Learning with Structured Knowledge Graphs
年份：2018
期刊：Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition
标签：多标签，零样本，知识图谱
数据：NUS-WIDE，COCO

创新点

第一个提出用于ML-ZSL的结构信息与知识图谱
提出了在语义空间的类别传播算法，使得学到的模型能够泛化到没有见过的类别
在标准的multi-label分类任务上，实现了最优性能

创新点来源

阅读全文 »

YOLACT详解

发表于 2020-04-04 分类于 DeepLearningApplications ，实例分割
本文字数： 3k 阅读时长 ≈ 3 分钟

主要贡献

在COCO数据集上的第一个实时实例分割模型
提出了比NMS算法更快的Fast NMS

网络结构

YOLACT 的框架图如下：

阅读全文 »

SSD详解

发表于 2020-04-02 分类于 DeepLearningApplications ，目标检测
本文字数： 7.5k 阅读时长 ≈ 7 分钟

本文主要参考了SSD原理与实现。

前言

目标检测近年来已经取得了很重要的进展，主流的算法主要分为两个类型（参考RefineDet）：

（1）two-stage方法，如R-CNN系算法，其主要思路是先通过启发式方法（selective search）或者CNN网络（RPN)产生一系列稀疏的候选框，然后对这些候选框进行分类与回归，two-stage方法的优势是准确度高；

（2）one-stage方法，如Yolo和SSD，其主要思路是均匀地在图片的不同位置进行密集抽样，抽样时可以采用不同尺度和长宽比，然后利用CNN提取特征后直接进行分类与回归，整个过程只需要一步，所以其优势是速度快，但是均匀的密集采样的一个重要缺点是训练比较困难，这主要是因为正样本与负样本（背景）极其不均衡（参见Focal Loss），导致模型准确度稍低。

阅读全文 »

实时目标检测：YOLO、YOLOv2以及YOLOv3

发表于 2020-04-01 分类于 DeepLearningApplications ，目标检测
本文字数： 14k 阅读时长 ≈ 13 分钟

本文主要参考了实时目标检测：YOLO、YOLOv2以及YOLOv3以及Real-time Object Detection with YOLO, YOLOv2 and now YOLOv3。

You only look once（YOLO）是一系列用于解决实时目标检测问题的算法。在本文中，将依次介绍YOLO、YOLOv2以及YOLOv3。在YOLO的官方网站上，作者提供了一些目标检测算法的性能和速度的对比，如下图所示。

在本文中，将以下述图片为例进行算法的讲解。

阅读全文 »

R-CNNs详解

发表于 2020-03-30 分类于 DeepLearningApplications ，目标检测
本文字数： 19k 阅读时长 ≈ 17 分钟

本文主要参考了Faster R-CNN具体实现详解和Object Detection and Classification using R-CNNs。

在这篇文章中，将详细描述最近引入的基于深度学习的对象检测和分类方法，R-CNN（Regions with CNN features）是如何工作的。事实证明，R-CNN在检测和分类自然图像中的物体方面非常有效，其mAP远高于之前的方法。R-CNN方法在Ross Girshick等人的以下系列论文中描述。