行业资讯

AI news by Smartone AI

一文了解Siamese network

前言:本文介绍了Siamese (连体)网络的主要特点、训练和测试Siamese网络的步骤、Siamese网络的应用场合、Siamese网络的优缺点、为什么Siamese被称为One-shot分类,以及Siamese的损失函数

行人重识别中的第一个anchor-free模型

前言:本文针对anchor-free模型用于行人搜索中会出现三个不对齐问题:Scale misalignment,Region misalignment,Task misalignment提出了相应的解决方案,进一步提出了一个更简单更有效的anchor-free模型--AlignPS

一文了解文字识别OCR开源框架的对比

前言:OCR文字识别在目前有着比较好的应用,也出现了很多的文字识别软件,但软件是面向用户的。对于我们技术人员来说,有时难免需要在计算机视觉任务中加入文字识别,如车牌号识别,票据识别等,因此软件对我们是没用的,我们需要自己实现文字识别

注意力机制技术总结:如何应用在计算机视觉上

前言:注意力机制在视觉上是非常重要的部分,这方面的综述、总结有很多。为了本文总结的全面性,我基本都看了一遍。然而这些综述要么面面俱到,对所有内容都非常详细地阐述,包括一些非常不常用的,过时的论文或结构;要么没分清重点,有些内容跟论文有关,但跟注意力无关,这些文章也把这些内容总结到里面

一个高效的金字塔切分注意力模块PSA

前言:前面分享了一篇《继SE,CBAM后的一种新的注意力机制Coordinate Attention》,其出发点在于SE只引入了通道注意力,CBAM的空间注意力只考虑了局部区域的信息,从而提出考虑全局空间信息的注意力机制

AI公司格灵深瞳科创板IPO,拟募资10亿元

6月23日报道(文/盛佳莹)6月22日,格灵深瞳申请科创板上市已获受理,拟募资10亿元。根据招股书显示,2018-2020 年,格灵深瞳分别实现营业收入 5,196.35 万元、7,121.07 万元和24,271.56 万元

一文了解计算机视觉未来的走向

前言:    目前,计算机视觉面临几大问题:    1.需要大算力,需要大数据用于训练,因此导致成本太高。    2.应用场景单一,目前仅用于无人驾驶,安防监控等少数领域

一文详解损失函数技术

前言:一直想写损失函数的技术总结,但网上已经有诸多关于损失函数综述的文章或博客,考虑到这点就一直拖着没写,直到有一天,我将一个二分类项目修改为多分类,简简单单地修改了损失函数,结果一直有问题,后来才发现是不同函数的标签的设置方式并不相同

计算机视觉专业术语/名词总结

在计算机视觉中存在很多的专业术语,如先验知识,语义信息,embedding,head,neck等。这些术语的解释无法直接在网上搜到,也没有在哪一篇论文中定义它们的概念和意义,因此,对于第一次听到这些术语的读者来说会非常的困惑

针对BN的归一化方法总结

前言:归一化相关技术已经经过了几年的发展,目前针对不同的应用场合有相应的方法,在本文将这些方法做了一个总结,介绍了它们的思路,方法,应用场景。主要涉及到:LRN,BN,LN, IN, GN, FRN, WN, BRN, CBN, CmBN等