《通用视觉 & NAS》 专栏一览 一文看尽8篇目标检测最新论文(EfficientDet/EdgeNet/ASFF/RoIMix等) 几篇较新的计算机视觉Self-Attention RefineDet(4)_思考_CVPR2018 CVPR2019 | 15篇论文速递(涵盖目标检测、语义分割和姿态估计等方向)
如果本文对你有帮助,麻烦点个赞呗~
更多内容请关注 微信公众号【晓飞的算法工程笔记】
通用视觉
Detection
- one-stage
- 【目标检测】RetinaNet:Focal Loss for Dense Object Detection
- 新文预览 | 基于IoU分支的IoU-aware Single-stage Object Detector
- two-stage
- Light-Head R-CNN : 旷世提出用于加速two-stage detector的通用结构,速度达102fps
- 目标检测 | 经典算法 Cascade R-CNN 解读
- ECCV 2018 目标检测 | IoU-Net:将IoU的作用发挥到极致
- ThunderNet : 旷视再出超轻量级two-stage检测网络,高达267fps,ARM端也能实时 | ICCV 2019
- NeurIPS 2019 Spotlight | Cascade RPN,结构的艺术带来极致的提升
- 论文速递 | 实例分割算法BlendMask,实时又state-of-the-art
- anchor-free
- weakly supervised
- few-shot
- tricky
Instance Segmentation
Semantic segmentation
Classification
- network
- NASNet : Google Brain经典作,改造搜索空间,性能全面超越人工网络,继续领跑NAS领域 | CVPR 2018
- GhostNet: 使用简单的线性变换生成特征图,超越MobileNetV3的轻量级网络 | CVPR 2020
- tricky
- fine-grained
Attention in CV
- 实战级Stand-Alone Self-Attention in CV,快加入到你的trick包吧 | NeurIPS 2019
- ICLR 2020 | 抛开卷积,multi-head self-attention能够表达任何卷积操作
- ACNet: 特别的想法,腾讯提出结合注意力卷积的二叉神经树进行细粒度分类 | CVPR 2020
Weakly Supervised
Few-shot
Neural Architecture Search
Single object
- 告别炼丹,Google Brain提出强化学习助力Neural Architecture Search | ICLR2017
- MetaQNN : 与Google同场竞技,MIT经典作,基于Q-Learning的神经网络搜索 | ICLR 2017
- Evolution of Image Classifiers,进化算法在神经网络结构搜索的首次尝试 | ICML 2017
- NASNet : Google Brain经典作,改造搜索空间,性能全面超越人工网络,继续领跑NAS领域 | CVPR 2018
- CARS: 华为提出基于进化算法和权值共享的神经网络结构搜索,CIFAR-10上仅需单卡半天 | CVPR 2020
置顶文章
-
专栏一览
VincentLee3 个月前如果本文对你有帮助,麻烦点个赞呗~ 更多内容请关注 微信公众号【晓飞的算法工程笔记】通用视觉Detectionone-stage【目标检测】RetinaNet:Focal Loss for Dense O… 阅读全文
分享
最新文章
-
Circle Loss:从统一的相似性对的优化角度进行深度特征学习 | CVPR 2020 Oral
VincentLee6 天前论文提出了Circle loss,不仅能够对类内优化和类间优化进行单独地处理,还能根据不同的相似度值调整对应的梯度。总体而言,Circle loss更灵活,而且优化目标更明确,在多个实验上都有较好的表现,个人认为是一个很好的工作 来源:晓飞的算法… 阅读全文
分享 -
DRConv:旷视提出区域感知动态卷积,多任务性能提升 | CVPR 2020
VincentLee10 天前论文提出DRConv,很好地结合了局部共享的思想并且保持平移不变性,包含两个关键结构,从实验结果来看,DRConv符合设计的预期,在多个任务上都有不错的性能提升 来源:晓飞的算法工程笔记 公众号 论文: Dynamic Region-Aware Convolution论文… 阅读全文
分享 -
SEPC:商汤提出使用3D卷积从FPN中提取尺度不变特征,涨点神器 | CVPR 2020
VincentLee18 天前论文提出PConv为对特征金字塔进行3D卷积,配合特定的iBN进行正则化,能够有效地融合尺度间的内在关系,另外,论文提出SEPC,使用可变形卷积来适应实际特征间对应的不规律性,保持尺度均衡。PConv和SEPC对SOTA的检测算法有显著地提升 ,并且… 阅读全文
分享 -
FreeAnchor:抛弃单一的IoU匹配,更自由的anchor匹配方法 | NIPS 2019
VincentLee20 天前论文抛弃以往根据IoU硬性指定anchor和GT匹配关系的方法,提出FreeAnchor方法来进行更自由的匹配,该方法将目标检测的训练定义为最大似然估计(MLE)过程,端到端地同时学习目标分类、目标检测以及匹配关系,从实验来看,效果十分显著 来源:晓… 阅读全文
分享 -
BlockQNN:NASNet同期,商汤提出block版的MetaQNN | CVPR 2018
VincentLee22 天前作为NASNet的同期论文,BlockQNN同样地将目光从整体网络转换到了block-wise,整体思路大概是MetaQNN的block版,增加了一些细节地小修改。配合Early Stop Strategy,计算资源十分少,但性能较同期的NASNet差点 来源:晓飞的算法工程笔记 公众… 阅读全文
分享 -
实用,小物体检测的有监督特征级超分辨方法 | ICCV 2019
VincentLee23 天前论文提出新的特征级超分辨方法用于提升检测网络的小物体检测性能,该方法适用于带ROI池化的目标检测算法。在VOC和COCO上的小物体检测最大有5~6%mAP提升,在Tsinghua-Tencent 100K上的小物体检测则最大有约9点F1提升 来源:晓飞的算法工程笔… 阅读全文
分享 -
YOLACT++ : 实时实例分割,从29.8mAP/33.5fps到34.1mAP/33.5fps
VincentLee24 天前YOLACT是首个实时实例分割算法,但是准确率较SOTA差得有点多,YOLACT++从主干网络、分支和anchor的3个角度出发对YOLACT进行优化,在保持实时性的前提下提升了5map,论文改进的角度值得参考 来源:晓飞的算法工程笔记 公众号论文: YOLACT++ B… 阅读全文
分享 -
YOLACT : 首个实时实例分割模型,29.8mAP/33.5fps | ICCV 2019
VincentLee24 天前论文巧妙地基于one-stage目标检测算法提出实时实例分割算法YOLACT,整体的架构设计十分轻量,在速度和效果上面达到很好的trade-off。 来源:【晓飞的算法工程笔记】 公众号论文: YOLACT: Real-time Instance Segmentation论文地址:https://… 阅读全文
分享 -
SMASH:经典One-Shot神经网络搜索,仅需单卡 | ICLR 2018
VincentLee1 个月前SMASH方法使用辅助网络生成次优权重来支持网络的快速测试,从结果来看,生成的权重与正常训练的权重在准确率上存在关联性,整体搜索速度很快,仅需要单卡进行搜索,提供了一个很好的新思路。 来源:晓飞的算法工程笔记 公众号论文: SMASH: O… 阅读全文
分享 -
YOLOv4: 虽迟但到,大型调优现场,43mAP/83FPS | 论文速递
VincentLee1 个月前YOLOv4在速度和准确率上都十分优异,作者使用了大量的trick,论文也写得很扎实,在工程还是学术上都有十分重要的意义,既可以学习如何调参,也可以了解目标检测的trick。 来源:晓飞的算法工程笔记 公众号 论文: YOLOv4: Optimal Speed and … 阅读全文
分享 -
可变形卷积系列(三) 创意满满的可变形卷积核 | ICLR 2020
VincentLee1 个月前论文提出可变形卷积核(DK)来自适应有效感受域,每次进行卷积操作时都从原卷积中采样出新卷积,是一种新颖的可变形卷积的形式,从实验来看,是之前方法的一种有力的补充。 来源:晓飞的算法工程笔记 公众号论文: Deformable Kernels: Adaptin… 阅读全文
分享 -
可变形卷积系列(二) MSRA提出升级版DCNv2,变形能力更强 | CVPR 2019
VincentLee1 个月前论文提出DCNv2,不仅对DCNv1的结构进行了改进,还使用了有效的蒸馏学习策略,使得性能有很大的提升,各个方面都值得借鉴 来源:晓飞的算法工程笔记 公众号 论文: Deformable ConvNets v2: More Deformable, Better Results论文地址:https:/… 阅读全文
分享 -
可变形卷积系列(一) 打破常规,MSRA提出DCNv1 | ICCV 2017 Oral
VincentLee1 个月前论文提出可变形卷积帮助模型高效地学习几何变换能力,能够简单地应用到分类模型和检测模型中,思想新颖,效果显著,十分值得学习 来源:晓飞的算法工程笔记 公众号 论文: Deformable Convolutional Networks论文地址:http://arxiv.org/abs/… 阅读全文
分享 -
Genetic CNN: 经典NAS算法,遗传算法的标准套用 | ICCV 2017
VincentLee1 个月前论文将标准的遗传算法应用到神经网络结构搜索中,首先对网络进行编码表示,然后进行遗传操作,整体方法十分简洁,搜索空间设计的十分简单,基本相当于只搜索节点间的连接方式,但是效果还是挺不错的,十分值得学习 来源:晓飞的算法工程笔记… 阅读全文
分享 -
商汤提出解偶检测中分类和定位分支的新方法TSD,COCO 51.2mAP | CVPR 2020
VincentLee1 个月前目前很多研究表明目标检测中的分类分支和定位分支存在较大的偏差,论文从sibling head改造入手,跳出常规的优化方向,提出TSD方法解决混合任务带来的内在冲突,从主干的proposal中学习不同的task-aware proposal,同时结合PC来保证TSD的性能… 阅读全文
分享 -
RANet : 分辨率自适应网络,效果和性能的best trade-off | CVPR 2020
VincentLee2 个月前基于对自适应网络的研究,论文提出了自适应网络RANet(Resolution Adaptive Network)来进行效果与性能上的取舍,该网络包含多个不同输入分辨率和深度的子网,难易样本的推理会自动使用不同的计算量,并且子网间的特征会进行融合,从实验结果… 阅读全文
分享 -
Deep Snake: 基于轮廓调整的SOTA实例分割方法,速度32.3fps| CVPR 2020
VincentLee2 个月前论文提出基于轮廓的实例分割方法Deep snake,轮廓调整是个很不错的方向,引入循环卷积,不仅提升了性能还减少了计算量,保持了实时性,但是Deep snake的大体结构不够优雅,应该还有一些工作可以补,推荐大家阅读 来源:晓飞的算法工程笔记 … 阅读全文
分享 -
CVPR2020论文解读汇总,持续更新(13篇)
VincentLee2 个月前写了一些CVPR 2020的论文笔记,主要是图像识别和AutoML相关的论文:GhostNet: More Features from Cheap OperationsCARS: Continuous Evolution for Efficient Neural Architecture SearchRethinking the Route Towards Weakly Supervised Ob… 阅读全文
分享 -
ATSS : 目标检测的自适应正负anchor选择,很扎实的trick | CVPR 2020
VincentLee2 个月前论文指出one-stage anchor-based和center-based anchor-free检测算法间的差异主要来自于正负样本的选择,基于此提出ATSS(Adaptive Training Sample Selection)方法,该方法能够自动根据GT的相关统计特征选择合适的anchor box作为正样本,在… 阅读全文
分享 -
增量学习不只有finetune,三星AI提出增量式少样本目标检测算法ONCE | CVPR 2020
VincentLee2 个月前论文提出增量式少样本目标检测算法ONCE,与主流的少样本目标检测算法不太一样,目前很多性能高的方法大都基于比对的方式进行有目标的检测,并且需要大量的数据进行模型训练再应用到新类中,要检测所有的类别则需要全部进行比对,十分耗时。… 阅读全文
分享 -
Spiking-YOLO : 前沿性研究,脉冲神经网络在目标检测的首次尝试 | AAAI 2020
VincentLee2 个月前论文提出Spiking-YOLO,是脉冲神经网络在目标检测领域的首次成功尝试,实现了与卷积神经网络相当的性能,而能源消耗极低。论文内容新颖,比较前沿,推荐给大家阅读 来源:晓飞的算法工程笔记 公众号 论文: Spiking-YOLO: Spiking Neural Net… 阅读全文
分享 -
Gaussian YOLOv3 : 对bbox预测值进行高斯建模输出不确定性 | ICCV 2019
VincentLee2 个月前在自动驾驶中,检测模型的速度和准确率都很重要,出于这个原因,论文提出Gaussian YOLOv3。该算法在保持实时性的情况下,通过高斯建模、损失函数重建来学习bbox预测值的不确定性,从而提高准确率和TP,能够显著地降低FP,在KITTI和BDD数据集… 阅读全文
分享 -
YOLOv1/v2/v3简述 | 目标检测
VincentLee2 个月前YOLO系列是目标检测领域里十分经典的结构,虽然目前已经出了很多更高质量更复杂的网络,但YOLO的结构依然可以给算法工程师们带来很多的启发。这3篇论文看下来,感觉像是一本调参说明书,教你如何使用各种trick提高手上的目标检测网络的准确… 阅读全文
分享 -
Google Brain - 进化算法在神经网络结构搜索的首次尝试 | ICML 2017
VincentLee2 个月前论文提出使用进化算法来进行神经网络结构搜索,整体搜索逻辑十分简单,结合权重继承,搜索速度很快,从实验结果来看,搜索的网络准确率挺不错的。由于论文是个比较早期的想法,所以可以有很大的改进空间,后面的很大算法也是基于这种想法进… 阅读全文
分享 -
ACNet: 特别的想法,腾讯提出结合注意力卷积的二叉神经树进行细粒度分类 | CVPR 2020
VincentLee2 个月前论文提出了结合注意力卷积的二叉神经树进行弱监督的细粒度分类,在树结构的边上结合了注意力卷积操作,在每个节点使用路由函数来定义从根节点到叶子节点的计算路径,结合所有叶子节点的预测值进行最终的预测,论文的创意和效果来看都十分不… 阅读全文
分享 -
腾讯推出超强少样本目标检测算法,公开千类少样本检测训练集FSOD | CVPR 2020
VincentLee2 个月前论文提出了新的少样本目标检测算法,创新点包括Attention-RPN、多关系检测器以及对比训练策略,另外还构建了包含1000类的少样本检测数据集FSOD,在FSOD上训练得到的论文模型能够直接迁移到新类别的检测中,不需要fine-tune 来源:晓飞的算法… 阅读全文
分享 -
实战级Stand-Alone Self-Attention in CV | NeurIPS 2019
VincentLee3 个月前论文提出stand-alone self-attention layer,并且构建了full attention model,验证了content-based的相互关系能够作为视觉模型特征提取的主要基底。在图像分类和目标检测实验中,相对于传统的卷积模型,在准确率差不多的情况下,能够大幅减… 阅读全文
分享 -
化繁为简,弱监督目标定位领域的新SOTA - 伪监督目标定位方法(PSOL) | CVPR 2020
VincentLee3 个月前论文提出伪监督目标定位方法(PSOL)来解决目前弱监督目标定位方法的问题,该方法将定位与分类分开成两个独立的网络,然后在训练集上使用Deep descriptor transformation(DDT)生成伪GT进行训练,整体效果达到SOTA,论文化繁为简,值得学习 来… 阅读全文
分享 -
CARS: 华为提出基于进化算法和权值共享的神经网络结构搜索,仅需单卡半天 | CVPR 2020
VincentLee3 个月前为了优化进化算法在神经网络结构搜索时候选网络训练过长的问题,参考ENAS和NSGA-III,论文提出连续进化结构搜索方法(continuous evolution architecture search, CARS),最大化利用学习到的知识,如上一轮进化的结构和参数。首先构造用于参… 阅读全文
分享 -
GhostNet: 使用简单的线性变换生成特征图,超越MobileNetV3 | CVPR 2020
VincentLee3 个月前为了减少神经网络的计算消耗,论文提出Ghost模块来构建高效的网络结果。该模块将原始的卷积层分成两部分,先使用更少的卷积核来生成少量内在特征图,然后通过简单的线性变化操作来进一步高效地生成ghost特征图。从实验来看,对比其它模型,G… 阅读全文
分享 -
MetaQNN: 与谷歌同场竞技,MIT提出基于Q-Learning的NAS | ICLR 2017
VincentLee3 个月前论文提出MetaQNN,基于Q-Learning的神经网络架构搜索,将优化视觉缩小到单层上,相对于Google Brain的NAS方法着眼与整个网络进行优化,虽然准确率差了2~3%,但搜索过程要简单地多,所以才能仅用100GPU days就可以完成搜索,加速240倍。论文… 阅读全文
分享 -
FCOS: 找到诀窍了,anchor-free的one-stage也可以很准 | ICCV 2019
VincentLee3 个月前论文提出anchor-free和proposal-free的one-stage的目标检测算法FCOS,不再需要anchor相关的的超参数,在目前流行的逐像素(per-pixel)预测方法上进行目标检测,根据实验结果来看,FCOS能够与主流的检测算法相比较,达到SOTA,为后面的大热的a… 阅读全文
分享 -
专栏一览
VincentLee3 个月前如果本文对你有帮助,麻烦点个赞呗~ 更多内容请关注 微信公众号【晓飞的算法工程笔记】通用视觉Detectionone-stage【目标检测】RetinaNet:Focal Loss for Dense Object Detection新文预览 | 基于IoU分支的IoU-aware Single-stage Object D… 阅读全文
分享 -
NASNet : Google Brain经典作,改造搜索空间,超越人工网络 | CVPR 2018
VincentLee3 个月前论文将搜索空间从整体网络转化为卷积单元(cell),再按照设定堆叠成新的网络家族NASNet。不仅降低了搜索的复杂度,从原来的28天缩小到4天,而且搜索出来的结构具有扩展性,在小模型和大模型场景下都能使用更少的参数量和计算量来超越人类设计… 阅读全文
分享 -
ThunderNet :像闪电一样,旷视再出超轻量级检测器,高达267fps | ICCV 2019
VincentLee3 个月前论文提出了实时的超轻量级two-stage detector ThunderNet,靠着精心设计的主干网络以及提高特征表达能力的CEM和SAM模块,使用很少的计算量就能超越目前的one-stage detectors,在ARM平台也达到了实时性,GPU的速度更是达到267fps 来源:【晓… 阅读全文
分享 -
Light-Head R-CNN : 旷世提出轻量级two-stage通用检测结构,速度102fps
VincentLee3 个月前论文提出Light-Head R-CNN,一个精简的two-stage目标检测器设计准则,在表达能力很强的精简特征图上使用轻量级的R-CNN子网,不仅大量减少推理耗时,还提高了准确率,结合Xception-like的主干网络能够达到30.7mAP和102FPS 来源:【晓飞的算法… 阅读全文
分享 -
告别炼丹,Google Brain提出强化学习助力神经网络架构搜索NAS | ICLR2017
VincentLee3 个月前论文为Google Brain在16年推出的使用强化学习的Neural Architecture Search方法,该方法能够针对数据集搜索构建特定的网络,但需要800卡训练一个月时间。虽然论文的思路有很多改进的地方,但该论文为AutoML的经典之作,为后面很多的研究提供… 阅读全文
分享 -
ICLR 2020|抛开卷积,multi-head self-attention能够表达任何卷积操作
VincentLee4 个月前近年来很多研究将nlp中的attention机制融入到视觉的研究中,得到很不错的结果,于是,论文侧重于从理论和实验去验证self-attention可以代替卷积网络独立进行类似卷积的操作,给self-attention在图像领域的应用奠定基础 论文: On the Relatio… 阅读全文
分享 -
AAAI 2020 | 反向R?削弱显著特征为细粒度分类带来提升
VincentLee4 个月前论文提出了类似于dropout作用的diversification block,通过抑制特征图的高响应区域来反向提高模型的特征提取能力,在损失函数方面,提出专注于top-k类别的gradient-boosting loss来优化训练过程,模型在ResNet-50上提升3.2%,算法思路巧妙… 阅读全文
分享 -
AAAI 2020 | DIoU和CIoU:IoU在目标检测中的正确打开方式
VincentLee4 个月前论文提出了IoU-based的DIoU loss和CIoU loss,以及建议使用DIoU-NMS替换经典的NMS方法,充分地利用IoU的特性进行优化。并且方法能够简单地迁移到现有的算法中带来性能的提升,实验在YOLOv3上提升了5.91mAP,值得学习论文:Distance-IoU Loss:… 阅读全文
分享 -
ECCV 2018 目标检测 | IoU-Net:将IoU的作用发挥到极致
VincentLee4 个月前常见的目标检测算法缺少了定位效果的学习,IoU-Net提出IoU predictor、IoU-guided NMS和Optimization-based bounding box refinement,将IoU作为一个新分支融入到模型的学习和推理中,带来了新的性能优化方法,值得学习和参考论文: Acquisit… 阅读全文
分享 -
论文速递 | 实例分割算法BlendMask,实时又state-of-the-art
VincentLee4 个月前BlendMask通过更合理的blender模块融合top-level和low-level的语义信息来提取更准确的实例分割特征,该模型效果达到state-of-the-art,但结构十分精简,推理速度也不慢,精度最高能到41.3AP,实时版本BlendMask-RT性能和速度分别为34.2mAP和… 阅读全文
分享 -
NeurIPS 2019 |基于Co-Attention和Co-Excitation的少样本目标检测
VincentLee4 个月前论文提出CoAE少样本目标检测算法,该算法使用non-local block来提取目标图片与查询图片间的对应特征,使得RPN网络能够准确的获取对应类别对象的位置,另外使用类似SE block的squeeze and co-excitation模块来根据查询图片加强对应的特征纬度… 阅读全文
分享 -
目标检测 | 经典算法 Cascade R-CNN
VincentLee5 个月前作者从detector的overfitting at training/quality mismatch at inference问题入手,提出了基于multi-stage的Cascade R-CNN,该网络结构清晰,效果显著,并且能简单移植到其它detector中,带来2-4%的性能提升论文: Cascade R-CNN: Delving i… 阅读全文
分享 -
NeurIPS 2019 Spotlight | Cascade RPN,结构的艺术带来极致的提升
VincentLee5 个月前论文提出Cascade RPN算法来提升RPN模块的性能,该算法重点解决了RPN在迭代时anchor和feature不对齐的问题,论文创新点足,效果也很惊艳,相对于原始的RPN提升13.4%AR 论文:Cascade RPN: Delving into High-Quality Region Proposal Network … 阅读全文
分享 -
论文速递|带IoU分支的IoU-aware Single-stage Object Detector
VincentLee5 个月前论文基于RetinaNet提出了IoU-aware sinage-stage目标检测算法,该算法在regression branch接入IoU predictor head并通过加权分类置信度和IoU预测值得到anchor的最终分数,从实验结果看来,算法能有效提升定位的准确率论文:IoU-aware Single-… 阅读全文
分享 -
目标检测 | RetinaNet & Focal Loss论文深读
VincentLee5 个月前论文分析了one-stage网络训练存在的类别不平衡问题,提出能根据loss大小自动调节权重的focal loss,使得模型的训练更专注于困难样本。同时,基于FPN设计了RetinaNet,在精度和速度上都有不俗的表现论文:Focal Loss for Dense Object Detecti… 阅读全文
分享
还没有评论