行业资讯

AI news by Smartone AI

生成式AI来了,我们还能相信自己的眼睛吗?

有句老话叫做“眼见为实”,然而AI技术的迅猛发展正在改变这一切,我们可能很快就不再知道如何判断什么是真的,什么是假的。 先来考考大家的眼力。你觉得下图中这位金发碧眼、面带笑容的女士是真实存在的吗?答案是No,这是由人工智能合成的

边缘AI对可扩展加速器的需求

来源︱The Linley Group文︱Mike Demler人工智能(AI)正在迅速从数据中心转移到边缘计算。开发人员通常使用通用CPU和GPU内核来开发和训练神经网络模型,但这些内核的效率远低于用于推理任务的专用加速器

一文了解padding在深度学习模型中重要吗?

本文来自公众号CV技术指南的技术总结系列欢迎关注CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。前言本文介绍了两个实验,展示了padding在深度学习模型中的影响。实验一卷积是平移等变的:将输入图像平移 1 个像素,输出图像也平移 1 个像素(见图 1)

一文教你使用卷积神经网络和Python进行图像分类

介绍本文将讨论有关图像分类的所有内容。在过去的几年里,深度学习已经被证明是一个非常强大的工具,因为它能够处理大量的数据。隐藏层的使用超越了传统技术,尤其是在模式识别方面。最受欢迎的深度神经网络之一是卷积神经网络 (CNN)

三个模型对CNN结构演变进行总结

导言:  自2012年AlexNet在ImageNet比赛上获得冠军,卷积神经网络逐渐取代传统算法成为了处理计算机视觉任务的核心。  在这几年,研究人员从提升特征提取能力,改进回传梯度更新效果

一文了解计算机视觉中的特征金字塔技术总结

前言:特征金字塔是目前用于目标检测、语义分割、行为识别等方面比较重要的一个部分,对于提高模型性能具有非常好的表现。不同大小的目标都经过了相同的降采样比例后会出现较大的语义代沟,最常见的表现就是小目标检测精度比较低

一文详解损失函数技术

前言:一直想写损失函数的技术总结,但网上已经有诸多关于损失函数综述的文章或博客,考虑到这点就一直拖着没写,直到有一天,我将一个二分类项目修改为多分类,简简单单地修改了损失函数,结果一直有问题,后来才发现是不同函数的标签的设置方式并不相同

计算机视觉的自动编码器有无限可能

介绍大家好,在过去的几个月中,我致力于计算机视觉自动编码器 的开发,坦白地说,我对使用它们可以构建的大量应用程序印象深刻。本文的目的是解释自动编码器,可以使用自动编码器构建的一些应用程序,未连接的编码器-解码器层的缺点以及诸如U-Net之类的体系结构如何帮助提高自动编码器的质量

深度神经网络,为何备受关注?

深度神经网络是机器学习(ML, Machine Learning)领域中一种技术。

语音识别技术分享

一语音的识别过程1语音识别基本流程  语音信号的特征提取:在开始语音识别之前,有时需要把首尾端的静音切除。接着对音频进行分帧。在语音识别中,常用25ms作为帧长。为了捕捉语音信号的连续变幻,避免帧之间的特征突变,每隔10ms取一帧,即帧移为10ms