2022最新计算机视觉学习路线（入门篇）

资讯 2年前

1.94K

如果你有兴趣或计划做与图像或视频相关的事情，你绝对应该考虑使用计算机视觉。计算机视觉（CV）是人工智能（AI）的一个分支，它使计算机能够从图像、视频和其他视觉输入中提取有意义的信息，并采取必要的行动

如果你有兴趣或计划做与图像或视频相关的事情，你绝对应该考虑使用计算机视觉。计算机视觉（CV）是人工智能（AI）的一个分支，它使计算机能够从图像、视频和其他视觉输入中提取有意义的信息，并采取必要的行动。例如自动驾驶汽车、自动交通管理、监控、基于图像的质量检查等等。

什么是 OpenCV？

OpenCV 是一个主要针对计算机视觉的库。它拥有你在使用计算机视觉（CV）时所需的所有工具。“Open”代表开源，“CV”代表计算机视觉。

我会学到什么？

本文包含使用 OpenCV 库开始使用计算机视觉所需的全部内容。你会在计算机视觉方面感到更加自信和高效。

读取和显示图像

首先让我们了解如何读取图像并显示它，这是CV的基础知识。读取图像

import numpy as np

import cv2 as cv

import matplotlib．pyplot as plt

img＝cv2．imread（＇．．／input／images－for－computer－vision／tiger1．jpg＇）

＇img＇包含 numpy 数组形式的图像。让我们打印它的类型和形状

print（type（img））

print（img．shape）

numpy 数组的形状为（667， 1200， 3），其中，

667 – 图像高度，1200 – 图像宽度，3 – 通道数，

在这种情况下，有 RGB 通道，所以我们有 3 个通道。原始图像是 RGB 的形式，但 OpenCV 默认将图像读取为 BGR，因此我们必须在显示之前将其转换回RGB。

显示图像：

＃ Converting image from BGR to RGB for displaying

img＿convert＝cv．cvtColor（img， cv．COLOR＿BGR2RGB）
plt．imshow（img＿convert）

在图像上绘图

我们可以绘制线条、形状和文本图像。

＃ Rectangle

color＝（240，150，240）＃ Color of the rectangle

cv．rectangle（img，（100，100），（300，300），color，thickness＝10， lineType＝8）＃＃ For filled rectangle， use thickness ＝－1

＃＃（100，100） are （x，y） coordinates for the top left point of the rectangle and （300， 300） are （x，y） coordinates for the bottom right point

＃ Circle

color＝（150，260，50）

cv．circle（img，（650，350），100， color，thickness＝10）＃＃ For filled circle， use thickness ＝－1

＃＃（250， 250） are （x，y） coordinates for the center of the circle and 100 is the radius

＃ Text

color＝（50，200，100）

font＝cv．FONT＿HERSHEY＿SCRIPT＿COMPLEX

cv．putText（img，＇Save Tigers＇，（200，150）， font， 5， color，thickness＝5， lineType＝20）

＃ Converting BGR to RGB

img＿convert＝cv．cvtColor（img， cv．COLOR＿BGR2RGB）

plt．imshow（img＿convert）

混合图像

我们还可以使用 OpenCV 混合两个或多个图像。图像只不过是数字，你可以对数字进行加、减、乘、除运算，从而得到图像。需要注意的一件事是图像的大小应该相同。

＃ For plotting multiple images at once

def myplot（images，titles）：

fig， axs＝plt．subplots（1，len（images），sharey＝True）

fig．set＿figwidth（15）

for img，ax，title in zip（images，axs，titles）：

if img．shape［－1］＝＝3：

img＝cv．cvtColor（img， cv．COLOR＿BGR2RGB）＃ OpenCV reads images as BGR， so converting back them to RGB

else：
img＝cv．cvtColor（img， cv．COLOR＿GRAY2BGR）

ax．imshow（img）

ax．set＿title（title）

img1 ＝ cv．imread（＇．．／input／images－for－computer－vision／tiger1．jpg＇）

img2 ＝ cv．imread（＇．．／input／images－for－computer－vision／horse．jpg＇）

＃ Resizing the img1

img1＿resize ＝ cv．resize（img1，（img2．shape［1］， img2．shape［0］））

＃ Adding， Subtracting， Multiplying and Dividing Images

img＿add ＝ cv．add（img1＿resize， img2）

img＿subtract ＝ cv．subtract（img1＿resize， img2）

img＿multiply ＝ cv．multiply（img1＿resize， img2）

img＿divide ＝ cv．divide（img1＿resize， img2）

＃ Blending Images

img＿blend ＝ cv．addWeighted（img1＿resize， 0．3， img2， 0．7， 0）＃＃ 30％ tiger and 70％ horse

myplot（［img1＿resize， img2］，［＇Tiger＇，＇Horse＇］）

myplot（［img＿add， img＿subtract， img＿multiply， img＿divide， img＿blend］，［＇Addition＇，＇Subtraction＇，＇Multiplication＇，＇Division＇，＇Blending＇］）

乘法图像几乎为白色，分割图像为黑色，这是因为白色表示255，黑色表示0。当我们将图像的两个像素值相乘时，我们得到的数字更大，因此其颜色变为白色或接近白色，与分割图像相反。

# 视频 # 计算机视觉 # 图像

文章版权归作者所有，未经允许请勿转载。

美光科技：AI浪潮掀起，拐点已至？

973

2022年中国机器人市场达5560亿

1590

美国滑雪队积极尝试VR训练方案

1242

主网上线在即，分布式存储IPFS不仅是矿机与Filecoin！

1650

看，这台忙碌的AI移动零售商用车，集赞多多！

2111

百度AI进击2021：全面赋能的大时代

971

2022最新计算机视觉学习路线（入门篇）

2022全球领先VR触觉技术创新：柔性电子皮肤

小米手机被曝强行关闭锤子便签？

相关文章

热门网址

时间线

热门标签

热门工具