一种超像素上Parzen窗密度估计的遥感图像分割方法

图1 图的最小生成树上Parzen窗密度估计的聚类示意图

Fig.1 Cluster based on Parzen windows density estimation on minimum spanning tree

以下先概述SLIC算法,然后给出超像素块的特征提取以及度量方法,再给出基于Parzen窗的密度估计方法,最后详细讨论提出的算法,并给出算法流程图。

1.1 SLIC算法

SLIC超像素分割算法的步骤为^[12]:

1)初始化种子点。根据输入图像的像素点个数 $L$ ,均匀地在图像中设置 $k$ 个种子点,则超像素大小为 $L / k$ 。

2)种子点处理。在种子点的 $3 \times 3$ 邻域内对所有像素进行搜索,将种子点移动到该邻域内梯度最小的位置,以避免种子点落在边缘位置,从而确定更好的聚类效果。

3)距离测量。将图像转化到Lab颜色空间,分别计算每一个像素点 $i$ 与该种子点 $j$ 的颜色距离和空间距离,公式分别为:

(1)

d_{c} = \sqrt[]{(l_{i} - l_{j})^{2} + (a_{i} - a_{j})^{2} + (b_{i} - b_{j})^{2}}

(2)

d_{s} = \sqrt[]{(x_{i} - x_{j})^{2} + (y_{i} - y_{j})^{2}}

式中: $d_{c}$ 和 $d_{s}$ 分别为颜色距离和空间距离; $l, a, b$ 为对应的颜色坐标; $x, y$ 为直角坐标。取参数 $S = \sqrt[]{L / k}$ ,表示类内最大空间距离, $T$ 为常数,且 $1 \leq T \leq 40$ ,表示最大的颜色距离的简化处理,用这2个参数平衡颜色距离和空间距离,从而将上述2个距离合成为单个距离测度D,即

(3)

D = \sqrt[]{{(\frac{d_{c}}{T})}^{2} + {(\frac{d_{s}}{S})}^{2}}

。

4)迭代聚合与连通性处理。重复上述步骤,直到聚类结果稳定,一般迭代十余次即可终止。但可能会存在一些孤立像素或是多连通像素,使用分量连通方法以产生紧致连通的超像素块。

1.2 区域特征的提取与度量

与传统傅里叶方法不同的是,Gabor滤波器可以同时在频率域和空间域都有较好的分辨力,可以方便地在方向和尺度2个参数上进行调整,以符合人类的视觉特性。Gabor滤波器的小波特性使其可以详尽地描述图像纹理特征^[19]。

设 $m, n$ 分别为尺度参数和方向参数的Gabor滤波器组表示为 $g_{mn} (x, y)$ , 给定图像 $I (x, y)$ ,将该图像与Gabor滤波器组的卷积得到该图像的Gabor变换W_mn(x,y),即

(4)

W_{mn} (x, y) = I (x, y) \otimes g_{mn} (x, y)

。

对于滤波后的图像Wmn,可得其均值 $μ_{mn}$ 和标准差 $σ_{mn}$ ,则图像 $I (x, y)$ 的纹理特征向量为 $[μ_{11}, σ_{11}, μ_{12}, σ_{12}, \dots, μ_{mn}, σ_{mn}]$ ,共计2mn维。实验中,取3个尺度( $m = 3$ ),8个方向( $n = 8$ ),因此纹理特征为48维向量。

1.3 Parzen窗密度估计

Parzen窗密度估计(Parzen windows density estimation)又称核密度窗估计,是一种重要的非参数密度估计方法,最早由Parzen^[20]提出,它不需要向参数估计方法那样,假定数据分布的概率密度函数参数形式已知,它可以对任意分布的数据作密度估计。现有 $N$ 个 $d$ 维空间样本 $x_{1}, x_{2}, \dots, x_{N}$ ,Parzen窗密度估计即以这 $N$ 个已知样本来对空间中任一点 $x$ 的概率密度进行估计,即

(5)

p (x) = \frac{1}{N h^{d}} \overset{N}{\sum_{i=1}} K (\frac{x - x_{i}}{h})

式中: 参数 $h$ 为核函数的带宽(bandwidth); $K (\cdot)$ 为核函数(kernel function),一般为对称和单峰的函数,且满足如下条件,即

(6)

\{\begin{array}{l} K (x) = K (- x) \\ K (x) \geq 0 \\ \int_{-}^{\infty} K (x) d x = 1 \end{array}

。

常用的核函数有Epanechnikov,Triangular 和Gaussian等。研究表明,在带宽确定的情况下,核函数的选择对估计的准确度影响相对不大^[21],因此本文都采用Gaussian核函数。而不同的带宽则对估计的准确度影响较大。若带宽取值较大,则密度估计是几个波动平缓的核函数叠加而成,估计出的密度函数也是变化平缓,并不能反映实际的数据分布情况。若带宽取得过小,则密度估计是若干尖锐函数叠加而成,密度估计也变化剧烈,也不符合实际数据密度分布情形^[22,23]。因此,对带宽的选择进行了广泛研究,本文采用文献[24]提出的一种基于数据驱动的带宽自动选择方法。

1.4 提出的算法

经过超像素初始分割后,2个超像素块直接的纹理相似度定义为:

(7)

w_{ij} = \sum_{m} \sum_{n} \sqrt[]{(σ_{_{mn}}^{i} - σ_{_{mn}}^{j})^{2} - (μ_{_{mn}}^{i} - μ_{_{mn}}^{j})^{2}}

式中 $σ_{_{mn}}^{i}$ , $σ_{_{mn}}^{j}$ 和 $μ_{_{mn}}^{i}$ , $μ_{_{mn}}^{j}$ 分别表示第 $i$ 和第 $j$ 个超像素块在尺度参数 $m$ 、方向参数 $n$ 下的均值和标准差。将超像素块视为图结构中的顶点,记作 $v_{i} \in V$ ,则连接2顶点的边 $(v_{i}, v_{j}) \in E$ 上权值为 $w_{ij}$ ,这样构成以超像素块为顶点的区域邻接图 $G = < V, E >$ 。

根据超像素块之间的纹理特征的相似度,每个顶点(超像素块) $v_{i}$ 的概率密度由与它相连的顶点按照Parzen窗密度估计方法可以估计为:

(8)

p (v_{i}) = \frac{1}{N h^{d}} \overset{N}{\sum_{j=1}} G (\frac{w_{ij}}{h})

。

式中 $G (\cdot)$ 为Gaussian核函数。在式(8)中仅仅包含了纹理信息,而没有考虑空间信息,而实际上邻接的超像素块极有可能属于同类,即具有近似的概率密度。因此,本文提出同时包含纹理信息、光谱信息和空间信息的Parzen窗密度估计方法。

最小生成树是最小权重生成树的简称,它是无向图中包含所有顶点且权值和最小的子图,任意2个顶点之间距离同时蕴含了特征的相似度(权值)和空间的信息^[25]。因此,用最小生成树上距离带入Parzen窗密度估计方法中描述顶点(超像素块)的概率密度。

首先,可以用经典的算法,如Krusal算法、Prim算法^[26],在以超像素块为顶点的区域邻接图上建立最小生成树; 然后在最小生成树上寻找任意2顶点 $v_{i}$ 和 $v_{j}$ 的路径 ${v_{i}, v_{i + 1}, \dots, v_{j}}$ ,其中 $v_{i}$ 和 $v_{i + 1}$ 是路径中相邻的顶点,这样,顶点 $v_{i}$ 和 $v_{j}$ 的距离D_MST为:

(9)

D_{MST} (i, j) = \overset{j}{\sum_{p=i}} w_{p, p + 1}

式中 $w_{p, p + 1}$ 为最小生成树上连接相邻顶点 $v_{p}$ 和 $v_{p + 1}$ 的权值。然后,将式(8)中的 $w_{ij}$ 替换为 $D_{MST} (i, j)$ 进行Parzen窗估计,即

(10)

p (v_{i}) = \frac{1}{N h^{d}} \overset{N}{\sum_{j=1}} G [\frac{D_{MST} (i, j)}{h}]

。

可以看到,在Parzen窗密度估计中的距离 $D_{MST} (i, j)$ 中,既含有SLIC算法的光谱信息,也融入了超像素块的纹理信息,同时在最小生成树上度量也自然引入了空间近邻信息。在Parzen窗密度估计中是以每个顶点为中心的窗函数(这里是Gaussian核函数)到待估计点的叠加。由Gaussian核函数的性质,对概率密度有所贡献的点只能是与待估计点空间距离较近(累计权重较小)的点,以及与待估计点特征(光谱特征、纹理特征)相似(边上权重较小)的点。所以,本文提出的这种概率密度估计方法是合理的。

最后,将具有相似的概率密度的顶点被认为属于同一模态(类),采用K-means算法完成聚类,得到最终分割结果。整个分割算法流程如图2所示。

图2

图2 提出的多光谱遥感图像分割算法流程

Fig.2 Flow chart of the proposed multispectral remote sensing image segmentation algorithm

2 实验结果及讨论

本文多光谱遥感图像分割的实验平台为2.8 GHz的Pentium4处理器、8 G RAM的计算机,采用软件为MATLAB R2004a。实验1是讨论参数的选择对提出算法分割效果的影响; 实验2和实验3是将提出的算法与eCognition软件中不同参数FNEA算法作对比,验证提出算法的有效性。

为了更有效地评价分割结果,从定性和定量2个方面进行评价。定性即为主观的目视对比判别; 定量则基于手动标注的实际地物边界采用P-R方法^[27] 计算,公式分别为:

(11)

Precesion = TP / (TP + FP)

(12)

Recall = TP / (TP + FN)

式中: $Precesion$ 为准确率,其值越大,表示分割精度越高; $Recall$ 为召回率,其值越大,则表示边界的附着度越好; TP为被正确分割的地物目标像素数目; FP为被误分为地物目标的背景像素数目; FN为被误分为背景的地物目标像素数目。

2.1 实验分析一

该实验遥感图像选自NWPU VHR-10数据集^[28]。图像采集自Google Earth,包括10个类别目标的高分辨率RGB彩色图像和红外图像。实验图像为数据集中178号图像的局部,其中包括船只、水体、植被、建筑物、桥梁等地物目标,图像大小为266像素×385像素,如图3所示。该实验目的是讨论提出算法中的参数设置对分割效果的影响。在提出的算法中主要需要设置3个参数: ①SLIC算法中的S,用于控制超像素块大小; ②Parzen窗带宽h; ③K-means的聚类数。聚类数的选择无疑会对聚类效果有较大影响,许多文献讨论如何自动选择聚类数的问题^[29,30],这不是本文主要关注点(实验中发现,只要聚类数在一个大致合理的范围内,分割结果相对稳定,限于篇幅,没有给出实验图像),实验中还是依据经验采用手动给定聚类数。该实验中,所有的聚类数手动选择为5。

图3

图3 实验1的原始图像

Fig.3 Original image of experiment 1

表1中给出了参数 $S$ 和 $h$ 取不同数值时的分割结果。其中,从左至右,第1—3列依次是 $S$ 设置为5,20和50时的分割结果; 从上到下,第1行为超像素预分割结果,第2—5行分别是带宽 $h$ 取0.5,5,20和50时的分割结果。参数 $S$ 越小,预分割的超像素块数目就越多; 反之, $S$ 越大,超像素块越大,其数目就越少。因为采用的是分裂-合并的分割策略,若 $S$ 设置过大,会使得后续合并的分割结果过于粗糙,容易产生欠分割问题(如表1第3列所示)。由于合并过程是基于Parzen窗密度估计,这也要求样本点不可以过少。由于样本点过少,导致密度估计不够准确,也是导致表1第3列中分割效果较差的原因之一。但另一方面,若 $S$ 设置太小,超像素数目过大,会使得计算量(包括超像素分割、纹理特征测量和Parzen窗密度估计)显著增加。

表1 实验1的分割结果

Tab.1 Segmentation results of experiment 1

参数	S
参数	5	20	50
预分割
h=0.5
h=5
h=20
h=50

表2中是参数 $S$ 取不同值时的平均计算时间的比较,容易见到 $S$ 取5时比取20时计算时间增加了近2倍,同时分割效果并不更好,且更容易出现过分割问题(见表1第1列与第2列的比较)。

表2 实验1中参数S的选取对计算时间的影响

Tab.2 Computing time versus parameter S in experiment 1(s)

参数S	5	20	50
平均计算时间	58.487 6	19.783 4	14.347 2

另一个参数带宽h,涉及到密度估计的准确性,自然会影响到最后聚类结果(如表1第5行h=50时,带宽取得过大,严重降低了分割效果)。但同时,实际的分割结果对带宽的选择相对而言并不敏感,如第2—4行,带宽差异并不小,可分割结果却远没有预计的大。实际上,实验中选择了多个带宽,结果表明,只要带宽不是过大(如第5行)或过小,分割结果差异不会太大。而实验中采用文献[24]的方法都能够选择到理想的带宽。所以,后面的实验都是采用该方法自动选择带宽。

从表3的P-R定量评价中也可以看出,这2个参数的选择在Precision指标和Recall指标上基本也可以反映出于目视判别解读相同的结论。

表3 实验1的定量评价

Tab.3 Segmentation results evaluation of experiment 1

h	S=5		S=20		S=50
h	Precision	Recall	Precision	Recall	Precision	Recall
0.5	0.913 4	0.927 2	0.914 6	0.958 6	0.793 4	0.828 3
5	0.917 2	0.957 3	0.916 2	0.959 5	0.814 1	0.841 3
20	0.904 6	0.921 7	0.920 7	0.938 6	0.819 2	0.839 6
50	0.831 5	0.874 6	0.742 8	0.789 1	0.732 5	0.749 3

2.2 实验分析二

实验2图像是2010年4月15日青海玉树7.1级地震发生后由QuickBird卫星拍摄的多光谱图像,分辨率为0.6 m^[31]。实验中采用了其局部图,大小为 $650 像素 \times 838$ 像素,包含植被、建筑物、道路、山体等地物目标,如图4(a)所示。图4(b)和(c)分别是FNEA算法尺度参数分别设置为50和150的分割结果,其中形状异质度和紧致度参数分别设置为默认值shape=0.1和compactness=0.5。图4(d)—(f)都是本文方法的分割结果,其中带宽h由文献[24]的算法自动选择,类别数设置为6,图4(d)—(f)参数S分别设置为5,20和30。

图4

图4 实验2的分割结果

Fig.4 Segmentation results of experiment 2

实验3图像是NWPU VHR-10数据集^[28]中286号图像的局部图,图像大小为 $751 像素 \times 979$ 像素,包括飞机、水体、舰船、植被、机场地物标志等地物目标,如图5(a)所示。与图4中实验2类似,图5(b)和(c)分别是FNEA算法尺度参数分别设置为150和200的分割结果,其中形状异质度和紧致度参数也都设置为默认值shape=0.1和compactness=0.5。而图5(d)—(f)也是参数S分别设置为5,20,30的分割结果,带宽h由文献[24]中算法自动选择,类别数设置为5。

图5

图5 实验3的分割结果

Fig.5 Segmentation results of experiment 3

从图4(b)和(c)以及图5(b)和(c)中可以看到,在FNEA方法中,当尺度参数变大,则过分割的问题会得到一定程度克服,但很难完全避免。如图4(b)和(c)中的植被部分,由于植被的光谱异质度较大,产生了明显的过分割,而图5(b)中的水体部分,由于光谱相似度较大,也产生了比较明显的误分割问题。而尺度参数大,又很容易产生欠分割,如图5(c)。同时,图4中建筑物的光谱信息“同谱异物”的情况比较明显,大多数尺度情况下,都容易出现过分割情况。所以,很难找到合理的尺度参数,同时避免以上各种问题的出现。从表4和表5中的定量评价来看,实验2和实验3中分别取比较典型的大小2个不同尺度参数FNEA方法分割结果,其大尺度下的Precision和Recall指标均较小尺度下的有所提高,但非常有限。这也从另一个方面印证了上面的分析。

表4 实验2定量评价

Tab.4 Segmentation results evaluation of experiment 2

指标	FNEA		本文方法
指标	50	150	S=5	S=20	S=30
Precision	0.782 9	0.798 9	0.783 6	0.879 8	0.884 2
Recall	0.879 6	0.882 7	0.870 7	0.936 8	0.937 1

表5 实验3定量评价

Tab.5 Segmentation results evaluation of experiment 3

指标	FNEA		本文方法
	150	200	S=5	S=20	S-30
Precision	0.841 1	0.856 3	0.897 2	0.903 7	0.912 7
Recall	0.884 3	0.892 7	0.912 6	0.921 9	0.930 5

在本文方法中,初始分割阶段,SLIC算法考虑了像素的光谱特征; 然后又融入了超像素块的纹理信息; 距离测量时,利用最小生成树结构,整合了超像素块的空间近邻信息。在此融合了各种信息的距离测度基础上,用Parzen窗估计顶点密度,距离较近的顶点(超像素块),其密度应该更接近,后续的K-means算法更倾向于将其分为一类。因而,从图4和图5的(d)—(f)中也可以看到,本文方法能够在一定程度上处理好过分割、欠分割和误分割等问题,即使地物目标复杂的遥感影像,也可以产生较为合理的分割结果。

但是,正如实验1中所指出的,提出的算法中超像素预分割中参数 $S$ 还是对分割结果有一定影响,如图4和图5中(d)比(e)和(f)存在更明显的过分割问题。所以参数 $S$ 取得过小,超像素块数目过多,合并的效果并不好; 当然,参数 $S$ 过大也容易出现分割效果粗糙(实验2和3中没有再给出分割效果图)。好在分割结果对参数 $S$ 并不十分敏感,只要位于合理范围(实验中一般在10~30之间),其分割结果相对比较接近(如图4和图5(e)和(f))。在表4和表5的定量分析中也可以看到,提出的算法中参数S取5,20和30时,Precision和Recall指标均比FNEA方法好,而参数S取20和30的结果则提高更明显,且比较接近。

3 结论

针对传统基于像素的遥感图像分割算法易受噪声干扰、计算效率低等缺点,在分裂-合并的框架下,本文提出了一种将超像素和Parzen窗密度估计相结合的遥感图像分割方法,该方法预分割阶段是采用SLIC算法将遥感图像粗分割为超像素,每个超像素块视作图结构中的一个顶点,在图的最小生成树上测量顶点间距离,并采用Parzen窗估计每个顶点密度,然后以这些概率密度为指标对超像素块进行K-means聚类,以达到“融合”目的,得到最终分割结果。提出的方法中有2个方面的主要工作: 一是构建了基于最小生成树的整合了光谱信息、纹理特征和空间信息的距离测量方式; 二是提出了基于图上顶点的Parzen窗密度估计的聚类方法。

为验证提出算法的有效性,在多种多光谱遥感图像上进行分割实验。通过算法中不同参数下的分割结果,以及与不同参数的FNEA算法的分割结果进行比较研究,可以发现提出的算法结果稳定,鲁棒性较好,同时能够克服过分割、误分割和欠分割等问题,得到较好的分割效果。

(责任编辑: 张仙)

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

Chehata

, Orny

, Boukir

, et al.

Object-based change detection in wind storm-damaged forest using high-resolution multispectral images

[J]. International Journal of Remote Sensing, 2014, 35(13):4758-4777.

DOI:10.1080/01431161.2014.930199 URL [本文引用: 1]

[2]

Gao L

, Shi W

, Miao Z

, et al.

Method based on edge constraint and fast marching for road centerline extraction from very high-resolution remote sensing images

[J]. Remote Sensing, 2018, 10(6):900.

DOI:10.3390/rs10060900 URL [本文引用: 1]

[3]

Porter

, Linderman M

Historic land cover change in the agricultural midwest using an object-based approach for classification of high-resolution imagery

[J]. Journal of Applied Remote Sensing, 2013, 7(1):073506.

DOI:10.1117/1.JRS.7.073506 URL [本文引用: 1]

[4]

黄鹏, 郑淇, 梁超.

图像分割方法综述

[J]. 武汉大学学报(理学版), 2020,(6):519-531.

Huang

, Zheng

, Liang

Overview of image segmentation metho-ds

[J]. Journal of Wuhan University(Natural Science Edition), 2020, 66(6):519-531.

[5]

Peng

, Zhang

A survey of graph theoretical approaches to image segmentation

[J]. Pattern Recognition, 2013, 46(3):1020-1038.

DOI:10.1016/j.patcog.2012.09.015 URL [本文引用: 1]

[6]

Fan

, Sun

, Shui

Region-merging method with texture pattern attention for SAR image segmentation

[J]. IEEE Geoscience and Remote Sensing Letters, 2020, 18(1):112-116.

DOI:10.1109/LGRS.8859 URL [本文引用: 1]

[7]

Zhou

, Wu

, Qin

, et al.

An efficient two-stage region merging method for interactive image segmentation

[J]. Computers and Electrical Engineering, 2016, 54:220-229.

DOI:10.1016/j.compeleceng.2015.09.013 URL [本文引用: 1]

[8]

Lassalle

, Inglada

, Michel

, et al.

A scalable tile-based framework for region-merging segmentation

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(10):5473-5485.

DOI:10.1109/TGRS.2015.2422848 URL [本文引用: 1]

[9]

黄亮, 姚丙秀, 陈朋弟, 等.

高分辨率遥感影像超像素的模糊聚类分割法

[J]. 测绘学报, 2020, 49(5):589-597.

Huang

, Yao B

, Chen P

, et al.

Superpixel segmentation method of high resolution remote sensing image based on fuzzy clustering

[J]. Acta Geodaetica et Cartographica Sinica, 2020, 49(5):589-597.

[10]

, Shi

, Han

, et al.

Extract and merge:Superpixel segmentation with regional attributes

[C]// European Conference on Computer Vision.Springer, 2020:155-170.

[11]

, Zhang

, He

, et al.

Superpixel-based spatial-spectral dimension reduction for hyperspectral imagery classification

[J]. Neurocomputing, 2019, 360:138-150.

DOI:10.1016/j.neucom.2019.06.023 URL [本文引用: 1]

[12]

Achanta

, Shaji

, Smith

, et al.

SLIC Superpixels compared to state-of-the-art superpixel methods

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11):2274-2282.

DOI:10.1109/TPAMI.2012.120 URL [本文引用: 2]

[13]

Karydas

, Jiang

Scale optimization in topographic and hydrographic feature mapping using fractal analysis

[J]. International Journal of Geo-Information, 2020, 9(11):631.

[14]

Comaniciu D M

A robust approach toward feature space analysis

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(5):313-329.

DOI:10.1109/34.990134 URL [本文引用: 1]

[15]

Park J

, Lee G

, Park S

Color image segmentation using adaptive mean shift and statistical model-based methods

[J]. Computers and Mathematics with Applications, 2009, 57(6):970-980.

DOI:10.1016/j.camwa.2008.10.053 URL [本文引用: 1]

[16]

Wang

, Chung

, Xiong

A novel image thresholding method based on Parzen window estimate

[J]. Pattern Recognition, 2008, 41(1):117-129.

DOI:10.1016/j.patcog.2007.03.029 URL [本文引用: 1]

[17]

向日华, 王润生.

一种基于高斯混合模型的距离图像分割算法

[J]. 软件学报, 2003, 14(7):1250-1257.

Xiang R

, Wang R

A range image segmentation algorithm based on Gaussian mixture model

[J]. Journal of Software, 2003, 14(7):1250-1257.

[18]

赵泉华, 石雪, 王玉, 等.

可变类空间约束高斯混合模型遥感图像分割

[J]. 通信学报, 2017, 38(2):34-43.

Zhang Q

, Shi

, Wang

, et al.

Remote sensing image segmentation based on spatially constrained Gaussian mixture model with unknown class number

[J]. Journal on Communications, 2017, 38(2):34-43.

[19]

, Mao

, Zhang

, et al.

Selection of Gabor filters for improved texture feature extraction

[C]// 2010 IEEE International Conference on Image Processing.IEEE, 2010:361-364.

[20]

Parzen

On estimation of a probability density function and mode

[J]. Annals of Mathematical Statistics, 1962, 33(3):1065-1076.

DOI:10.1214/aoms/1177704472 URL [本文引用: 1]

[21]

Scott D

Multivariate density estimation:Theory,practice,and visualization

[M]. John Wiley and Sons, 2015.

[22]

Jones M

, Marron J

, Sheather S

A brief survey of bandwidth selection for density estimation

[J]. Journal of the American Statistical Association, 1996, 91(433):401-407.

DOI:10.1080/01621459.1996.10476701 URL [本文引用: 1]

[23]

Raykar V

, Duraiswami

Fast optimal bandwidth selection for kernel density estimation

[C]// Proceedings of the 2006 SIAM International Conference on Data Mining.Society for Industrial and Applied Mathematics, 2006:524-528.

[24]

Botev Z

, Kroese D

Non-asymptotic bandwidth selection for density estimation of discrete data

[J]. Methodology and Computing in Applied Probability, 2008, 10(3):435-451.

DOI:10.1007/s11009-007-9057-z URL [本文引用: 4]

[25]

Trudeau R

Introduction to graph theory

[M]. Courier Corporation, 2013.

[26]

Foulds L

Graph theory applications

[M]. Springer Science and Business Media, 2012.

[27]

Unnikrishnan

, Pantofaru

, Hebert

Toward objective evaluation of image segmentation algorithms

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(6):929-944.

PMID:17431294 [本文引用: 1]

Unsupervised image segmentation is an important component in many image understanding algorithms and practical vision systems. However, evaluation of segmentation algorithms thus far has been largely subjective, leaving a system designer to judge the effectiveness of a technique based only on intuition and results in the form of a few example segmented images. This is largely due to image segmentation being an ill-defined problem-there is no unique ground-truth segmentation of an image against which the output of an algorithm may be compared. This paper demonstrates how a recently proposed measure of similarity, the Normalized Probabilistic Rand (NPR) index, can be used to perform a quantitative comparison between image segmentation algorithms using a hand-labeled set of ground-truth segmentations. We show that the measure allows principled comparisons between segmentations created by different algorithms, as well as segmentations on different images. We outline a procedure for algorithm evaluation through an example evaluation of some familiar algorithms-the mean-shift-based algorithm, an efficient graph-based segmentation algorithm, a hybrid algorithm that combines the strengths of both methods, and expectation maximization. Results are presented on the 300 images in the publicly available Berkeley Segmentation Data Set.

[28]

Gong

, Zhou

, Han J

Learning rotation-invariant convolutional neural networks for object detection in VHR optical remote sensing images

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(12):7405-7415.

DOI:10.1109/TGRS.2016.2601622 URL [本文引用: 2]

[29]

Fang

, Wang

Selection of the number of clusters via the bootstrap method

[J]. Computational Statistics and Data Analysis, 2012, 56(3):468-477.

DOI:10.1016/j.csda.2011.09.003 URL [本文引用: 1]

[30]

Haslbeck J M

, Wulff D

Estimating the number of clusters via a corrected clustering instability

[J]. Computational Statistics, 2020(35):1879-1894.