1.边缘检测
2.图像去噪
3.图像增强
4.形态学操作
5.特征提取
6.python code
利用高斯分布,靠近卷积核中心的数值最大,使得像素值分布变得均匀来模糊图像去除显眼的噪音点
例如:以下是5*5的一个卷积核
$$ G=\frac{1}{275} * \left[ \matrix{ 1 & 4 & 7 & 4 & 1\ 4 &16&26&16&4\ 7&26&41&26&7\ 4&16&26&16&4\ 1&4&7&4&1 }
\right ] $$ 以下是效果展示:
利用soble算子得到最初始的边缘信息 $$ \theta=arctan(Gy/Gx) \ \ slope $$
$$
Sx=\left[
\matrix{
-1 & 0 &1\
-2 & 0& 2\
-1 & 0& 1
}
\right]
\ \ \ Sy=\left[
\matrix{
1 & 2 &1\
0 & 0& 0\
-1& -2& -1
}
\right]
$$
在进行sobel算子后边缘任然不是很确定,我们要对他们进行再一轮检测,对边缘内外梯度不是极大值的点进行消除
data:image/s3,"s3://crabby-images/f2e08/f2e0862f3e2c8626fe8bfb6c0f1ac43f558b40ce" alt="屏幕截图 2024-05-26 210601"
**线性插值法:设g1的梯度幅度M(g1),g2的梯度幅度M(g2),则dtmp1可以得到:M(dtmp1)=w * M(g2)+(1- w) * M(g1) ** 其中w=dist(dtmp1,g2)/dist(g1,g2) dist指的是两者的距离 对于每个像素点,进行非极大值抑制,对于非边缘像素我们要将其过滤掉,将模糊的边界变得清晰
对于在边缘领域内是极大值的我们保留,否则消去抑制
如果图像中像素点大于阈值上界则被认为是应该保留的(称为强边界),小于阈值下界的必然不是边界,两者之间被认为是候选项(称为弱边界),需要进一步处理
data:image/s3,"s3://crabby-images/ee7eb/ee7eb452a4e7d227a3e68e1b44e9dcff5dfab52a" alt="屏幕截图 2024-05-26 211508"
data:image/s3,"s3://crabby-images/4473a/4473a613fa98c187956d46f74d786db5f41120ca" alt="屏幕截图 2024-05-26 211519"
上面是低阈值图像
下面是高阈值图像
阈值太低会带有虚假的边界信息,阈值太高会失去一些真实的边界信息,需要适当选择阈值
data:image/s3,"s3://crabby-images/00bf2/00bf20ca81bd3ae40f7e064a22cce4af3c94d1f6" alt="Canny_test001"
利用滞后技术来跟踪边界。若某一像素位置和强边界相连的弱边界认为是边界,其他的弱边界则被删除(canny算子)
以下为原图:
data:image/s3,"s3://crabby-images/0d466/0d466d592af9e03056b76ff29150ea6aa1ee107d" alt="001"
简单平均卷积操作,就是使用对区域进行平均卷积操作来模糊图像,达到去除噪音点的效果,有归一化操作
data:image/s3,"s3://crabby-images/ee61f/ee61f2357ca456d5fe7b222884dbdc0aa2da2b4d" alt="boxFilter"
基本和均值滤波一样,但是可以选择归一化也可以不选择,不选择归一化但是可能会出现溢出
data:image/s3,"s3://crabby-images/ee61f/ee61f2357ca456d5fe7b222884dbdc0aa2da2b4d" alt="boxFilter"
溢出后:
data:image/s3,"s3://crabby-images/c7771/c77716c8170249b1f968d6c43b6c84ff7fed511e" alt="boxFilter001"
符合高斯(正态)分布的滤波器,使用高斯卷积核来进行高斯模糊
data:image/s3,"s3://crabby-images/9be27/9be272f41983209640cc88fa4f33b4a49948cae7" alt="GaussianBlur"
在某个范围内选择中间数值作为该区域的数值
data:image/s3,"s3://crabby-images/7698a/7698a84c498c4a0026d5166727f75a62e4ba2016" alt="medianBlur"
1.一阶导数的边缘检测算子,通过模板作为核与图像的每个像素点做卷积和运算,然后选取合适的阈值来提取图像的边缘,例如soble算子 2.依据于二阶导数过零点,常见的有Laplacian 算子,此类算子对噪声敏感。
分为水平Sobel算子和垂直Sobel算子
最后分别进行卷积运算,取绝对值, $$ G=\sqrt{Gx^2+Gy^2} $$
$$
Sx=\left[
\matrix{
-1 & 0 &1\
-2 & 0& 2\
-1 & 0& 1
}
\right]
\ \ \ Sy=\left[
\matrix{
1 & 2 &1\
0 & 0& 0\
-1& -2& -1
}
\right]
$$
和soble算子不一样的比例
$$
Sx=\left[
\matrix{
-3 & 0 &3\
-10 & 0& 10\
-3 & 0& 3
}
\right]
\ \ \ Sy=\left[
\matrix{
3 & 10 &3\
0 & 0& 0\
-3& -10& -3
}
\right]
$$
利用二阶微分进行锐化效果
$$
G=\left[
\matrix{
0 & 1 &0\
1 & -4& 1\
0 & 1& 0
}
\right]
$$
从做到右边是sobel,scharr,Laplacian算子实验图
data:image/s3,"s3://crabby-images/e1e01/e1e01d32894532749746b2733cad1b14d1e1f879" alt="Arithmetic001"
以下是原图
data:image/s3,"s3://crabby-images/cd260/cd260e386c54e54fd449d75285845aa67c90a460" alt="test0"
利用直方图均衡化,使得高像素值的像素点降低,低像素值的点增大
利用累计函数(前缀和)实现 $$ F=\frac{n}{N} \其中n为该领域内某个像素的像素点数量\N是该领域内所有像素点数量 $$ data:image/s3,"s3://crabby-images/8ae59/8ae595039db7dc057ee4d165aa46ab1dcef71297" alt="test1"
在图像中,微分是锐化效果,积分是模糊效果
利用二阶导数的拉普拉斯算子实现图像锐化
data:image/s3,"s3://crabby-images/4166c/4166c88a60e83d4e504beb766c4d156c4112ff67" alt="test2"
Log函数可以实现低像素值像素点增强,高像素值像素点减弱
指数函数相反,高像素值像素点增强,低像素值像素点减弱
log2图像:
data:image/s3,"s3://crabby-images/a9d18/a9d1864e9718845e9e49fab7ee851907c631b626" alt="test2"
log10图像:
data:image/s3,"s3://crabby-images/4c141/4c141bd6eaa8b9d20d79b2b8c4172853628810b3" alt="test10"
利用幂函数的特性,以x的一次方为界限分为,低像素值像素点增强和高像素值像素点增强
data:image/s3,"s3://crabby-images/1eaec/1eaece2ab5571a17929ed9b7296858766bbb80f7" alt="屏幕截图 2024-05-27 120504"
0.3:
data:image/s3,"s3://crabby-images/41803/41803eabc24c26130716c726856a280aaa1166b7" alt="test0.3"
0.5:
data:image/s3,"s3://crabby-images/7b68f/7b68fa305836f67b7ccbcaef9ce63584f28a5c51" alt="test0.5"
0.8:
data:image/s3,"s3://crabby-images/58baa/58baa72d6c79929c0ede3318ad746b1290e7cd2a" alt="test0.8"
2:
data:image/s3,"s3://crabby-images/d4ec1/d4ec104ac834af04d9d316c380b79312c66ade94" alt="test2"
3:
data:image/s3,"s3://crabby-images/0f46e/0f46e0dda2c62f016072df6ac3a955ae163b72d6" alt="test3"
4:
data:image/s3,"s3://crabby-images/6acef/6acef8e1166db3e503f4f0804b35443adfc108ac" alt="test4"
膨胀:填充连接作用
腐蚀:去除毛刺
data:image/s3,"s3://crabby-images/4ec4a/4ec4a72a750e8d52a9c39a0c1c1b92db7ed29377" alt="Image corrosion"
data:image/s3,"s3://crabby-images/7b732/7b732bf0c1ecf3e6ae41768cf0e558f86d831569" alt="Image corrosion001_test3"
$$ 开运算:先腐蚀后膨胀,将噪音点去除后再对图像加强\
闭运算:先膨胀后腐蚀,先实现加强保留部分噪音点,再去除加强后的噪音点 $$
data:image/s3,"s3://crabby-images/d0a4d/d0a4d29750fd00e1eafaac6885c173230cc5658f" alt="result001"
data:image/s3,"s3://crabby-images/9e06f/9e06f446b497da8731ec2cf1ccdb28998545a1e2" alt="result002"
$$ 顶帽=原始输入-开运算结果 \ (白顶帽变换) \
黑帽=闭运算-原始输入 \ (黑底帽变换) $$
data:image/s3,"s3://crabby-images/05901/059010d2512dd925c889257fca6427c5f842a403" alt="origial"
data:image/s3,"s3://crabby-images/d018c/d018c905f38da534ab2aa6e66515350235f95699" alt="tophat"
data:image/s3,"s3://crabby-images/3332f/3332fd3ab3b79637b2f8a40050ef314e81db7086" alt="black"
特征提取过程分为:特征提取,特征描述和特征匹配
角点:向x与y方向移动变化很大的图像块 边界:沿着某一个方向变化小,另一方向移动变化大 $$ 角点响应R值: R=x1*x2-k(x1+x2)^2 \ R>0 角点 \ R约等于0 平坦区域 \ R<0 边界 $$ data:image/s3,"s3://crabby-images/4a247/4a24769c65c336eaf0e54c552991f53b1ba85d7d" alt="test000"
data:image/s3,"s3://crabby-images/e8b5a/e8b5a55fa08391fb79bfca877f745ef7f6a8871d" alt="test3"
尺度空间的获取通常使用高斯模糊来实现 尺度不变特征变换匹配算法 *L(x,y,z)=G(x,y,z)I(x,y) G是高斯函数 SIFT特征对于旋转和尺度均具有不变性,并且对于噪声、视角变化和光照变化具有良好的鲁棒性 SIFT所查找到的关键点是一些十分突出,不会因光照、仿射变换和噪音等因素而变化的点,如角点、边缘点、暗区的亮点及亮区的暗点等。
不同的是角点检测会受到角度旋转的影响,而SIFT算法不会受到影响
图像的尺度空间是指图像的模糊程度,而非图像的大小。 近距离看一个物体和远距离看一个物体,模糊程度是不一样的;从近到远,图像越来越模糊的过程,也是图像的尺度越来越大的过程。
检测空间极值分为几个步骤:1.建立高斯金字塔 2.建立DOG高斯差分金字塔 3.DOG局部极值检测
以上方法检测到的极值点是离散空间的极值点, 以下通过拟合三维二次函数来精确确定关键点的位置和尺度, 同时去除低对比度的关键点和不稳定的边缘响应点(因为DOG算子会产生较强的边缘响应),以增强匹配稳定性、提高抗噪声能力。
分为:1.关键点的精确定位 (使用子像素插值法) 2.去除边缘效应
data:image/s3,"s3://crabby-images/9613d/9613d4906743014eb1c119150d4bf936a9200bac" alt="test003"
特征描述就类似于 我从这张图像上得到了一些数据,例如像素,我该怎么表示它的强度呢?我们就必须说 像素高或低形容,但是我们要可视化我们的口头描述,因此必须通过一些图像之类的方式进行统计,让我们一目了然我们想要表示的意思
特征描述常见的就是使用直方图来统计特征数据
直接用图像与我们的模板一对一匹配
缺点:显而易见的慢
data:image/s3,"s3://crabby-images/44b5c/44b5c128e2ade41d27a0be71ffc936b77dfe320b" alt="test_Brute-Force1"
就是利用最小二乘法进行多次操作,来确保准确性和算法时间复杂度
K对最佳匹配
从匹配器分出分支我们可以选择暴力多次匹配,但是我们可以选择拥有基于树壮的数据结构的Flannd模型,但是Flannd模型需要构造单应性矩阵
data:image/s3,"s3://crabby-images/369f1/369f12ca6806c5aad01dfbc74e106ba8ba1ec332" alt="test_RANSAC1"