基于视觉双驱动认知的高分辨率遥感影像自学习分割方法

doi:10.6046/zrzyyg.2024206

[1]

Pan

X

, Zhang

C

, Xu

J

, et al.

Simplified object-based deep neural network for very high resolution remote sensing image classification

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2021, 181:218-237.

[本文引用: 1]

[2]

程结海, 黄中意, 王建如, 等.

高空间分辨率遥感影像最优分割结果自动确定方法

[J]. 测绘学报, 2022, 51(5):658-667.

DOI:10.11947/j.AGCS.2022.20210423

针对现有方法普遍存在不能充分顾及遥感影像多波段光谱信息，以及忽视遥感影像中地理要素的多尺度特性等问题，提出一种自动确定高空间分辨率遥感影像最优分割结果的非监督评价方法。该方法基于信息熵生成光谱信息离散度，利用光谱信息离散度构建能表达分割对象内部光谱均质性指标和分割对象与其相邻分割对象间光谱异质性指标。基于构建的光谱均质性和光谱异质性指标，采用“粗估计+精确定”的策略，逐步得到一个多级优化后的影像最优分割结果。本文在3个不同下垫面影像区域进行试验。结果表明，该方法能有效地实现自动确定高空间分辨率遥感影像最优分割结果，与现有方法相比，本文方法确定出的影像最优分割结果质量更高，与参考分割结果更加贴近。

Cheng

J H

, Huang

Z Y

, Wang

J R

, et al.

The automatic determination method of the optimal segmentation result of high-spatial resolution remote sensing image

[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(5):658-667.

DOI:10.11947/j.AGCS.2022.20210423

The existing methods cannot fully take into account the multi-band spectral information of remote sensing images, and ignore the multi-scale characteristics of geographical elements in remote sensing images. This study proposed an unsupervised evaluation method for automatically determining the optimal segmentation result of high-spatial resolution remote sensing image. This method generates the spectral information divergence based on information entropy, and uses the spectral information divergence to construct the indexes that can express the intra-segment homogeneity and inter-segment heterogeneity. Based on the constructed homogeneity and heterogeneity indexes, the strategy of "rough estimation + fine determination" is adopted to gradually obtain an optimal image segmentation result after multi-level optimization. The proposed method was carried out in three different underlying surface image areas. Experimental results demonstrate that the method can effectively automatically determine the optimal segmentation results of high-spatial resolution remote sensing images. Compared with existing methods, the optimal image segmentation results determined by the method have higher quality and are closer to the reference segmentation results.

[3]

吴强强, 王帅, 王彪, 等.

空间信息感知语义分割模型的高分辨率遥感影像道路提取

[J]. 遥感学报, 2022, 26(9):1872-1885.

Wu

Q Q

, Wang

S

, Wang

B

, et al.

Road extraction method of high-resolution remote sensing image on the basis of the spatial information perception semantic segmentation model

[J]. National Remote Sensing Bulletin, 2022, 26(9):1872-1885.

[4]

Liu

Y

, Li

E

, Wang

S

, et al.

Superpixel segmentation of high-resolution remote sensing image based on feature reconstruction method by salient edges

[J]. Journal of Applied Remote Sensing, 2023, 17(2):026516.

[本文引用: 1]

[5]

邵振峰, 孙悦鸣, 席江波, 等.

智能优化学习的高空间分辨率遥感影像语义分割

[J]. 武汉大学学报(信息科学版), 2022, 47(2):234-241.

[本文引用: 1]

Shao

Z F

, Sun

Y M

, Xi

J B

, et al.

Intelligent optimization learning for semantic segmentation of high spatial resolution remote sensing images

[J]. Geomatics and Information Science of Wuhan University, 2022, 47(2):234-241.

[本文引用: 1]

[6]

石雪.

基于层次化混合模型的高分辨率遥感影像分割方法研究

[J]. 测绘学报, 2023, 52(1):168.

DOI:10.11947/j.AGCS.2023.20210147

Shi

X

.

Hierarchical mixture model based high-resolution remote sensing image segmentation method

[J]. Acta Geodaetica et Cartographica Sinica, 2023, 52(1):168.

DOI:10.11947/j.AGCS.2023.20210147

[7]

Cao

Y

, Huang

X

.

A coarse-to-fine weakly supervised learning method for green plastic cover segmentation using high-resolution remote sensing images

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2022, 188:157-176.

[8]

Su

Y

, Cheng

J

, Bai

H

, et al.

Semantic segmentation of very-high-resolution remote sensing images via deep multi-feature learning

[J]. Remote Sensing, 2022, 14(3):533.

[本文引用: 1]

[9]

Ding

C

, Weng

L

, Xia

M

, et al.

Non-local feature search network for building and road segmentation of remote sensing image

[J]. ISPRS International Journal of Geo-Information, 2021, 10(4):245.

[本文引用: 1]

[10]

Ju

H

, Bi

F

, Bian

M

, et al.

Multiscale feature fusion network for automatic port segmentation from remote sensing images

[J]. Journal of Applied Remote Sensing, 2022, 16(4):044506.

[11]

周荣荣, 刘扬, 周一凡, 等.

基于语义分割的遥感影像建筑物自动提取方法

[J]. 河南科学, 2023, 41(4):612-618.

Zhou

R R

, Liu

Y

, Zhou

Y F

, et al.

Automatic building extraction from remote sensing images based on semantic segmentation

[J]. Henan Science, 2023, 41(4):612-618.

[12]

刘勇, 郝新宇, 赵晨, 等.

结合分类和语义分割的遥感影像洪涝灾害检测方法

[J]. 黑龙江大学工程学报, 2023, 14(1):76-82.

[本文引用: 1]

Liu

Y

, Hao

X Y

, Zhao

C

, et al.

Remote sensing image flood disaster detection method based on classification and semantic segmentation

[J]. Journal of Engineering of Heilongjiang University, 2023, 14(1):76-82.

[本文引用: 1]

[13]

王振华, 张鑫月, 刘智翔, 等.

遥感地物分割的改进格子玻尔兹曼并行模型

[J]. 遥感信息, 2021, 36(4):1-6.

[本文引用: 1]

Wang

Z H

, Zhang

X Y

, Liu

Z X

, et al.

Improved lattice Boltzmann parallel model for remote sensing object segmentation

[J]. Remote Sensing Information, 2021, 36(4):1-6.

[本文引用: 1]

[14]

刘思言, 李玲, 特日根, 等.

基于直方图区域生长的遥感图像阈值分割算法

[J]. 测绘通报, 2021(2):25-29.

DOI:10.13474/j.cnki.11-2246.2021.0037 [本文引用: 1]

传统阈值分割算法从单阈值扩展到多阈值的过程中，时间复杂度会大幅度增加，并且由于遥感图像信息复杂，会导致分割效果降低。为了解决这些问题，本文提出了基于直方图区域生长的遥感图像阈值分割算法。在本文算法中，每一个灰度级均作为1个初始阈值，用256个阈值将直方图分割成256个原始小区域。为了减少阈值数目，本文将小区域合并成大区域，每一次合并都可视为一次区域的生长。在每次生长过程中，选取熵值H最小的区域作为直方图各区域中的主区域，并通过本文提出的预匹配策略将其与相邻区域合并。每一次区域生长后，阈值数目均减少1个。在整个过程中，最多只需要生长255次。算法的时间复杂度稳定在O（L）级别。最后通过单阈值和多阈值试验证明本文算法在运行时间和分割精度上均具有优势。

Liu

S Y

, Li

L

, Te

R G

, et al.

Threshold segmentation algorithm based on histogram region growing for remote sensing images

[J]. Bulletin of Surveying and Mapping, 2021(2):25-29.

DOI:10.13474/j.cnki.11-2246.2021.0037 [本文引用: 1]

In the process of traditional thresholding algorithm from single-threshold to multi-threshold, the time complexity will increase greatly, and because of the complexity of remote sensing image information, the segmentation effect will be reduced. This paper creatively proposes the idea based on histogram region growing for remote sensing images. Each gray level is regarded as a threshold, so that the histogram is divided into 256 original small regions by the 256 thresholds. For reducing the number of thresholds, small regions are merged into large regions. Each merging can be regarded as the growth of a region. In each growth, the region with the smallest entropy H is selected as the main one in all regions of the histogram, and then it is merged with the adjacent region by the way of pre-judgment. After growing, the number of thresholds decreases. In the whole process, the growth times are only 255 at most, and the time complexity is stable at O(L). In this paper, single-threshold and multi-threshold experiments show that the algorithm has high accuracy in segmentation results, and has advantages in run time.

[15]

高瑞璞, 李礼.

使用超像素编码的交互式影像语义分割方法

[J]. 测绘地理信息, 2022, 47(s1):148-152.

[本文引用: 1]

Gao

R P

, Li

L

.

A method for interactive image semantic segmentation using superpixel encoding

[J]. Journal of Geomatics, 2022, 47(s1):148-152.

[本文引用: 1]

[16]

张汉中.

基于小波域三重MRF分割算法的遥感图像分割分析

[J]. 北京测绘, 2021, 35(7):866-869.

[本文引用: 1]

Zhang

H Z

.

Analysis of remote sensing image segmentation based on wavelet domain triple MRF segmentation algorithm

[J]. Beijing Surveying and Mapping, 2021, 35(7):866-869.

[本文引用: 1]

[17]

Song

Y

, Qu

J

.

Real-time segmentation of remote sensing images with a combination of clustering and Bayesian approaches

[J]. Journal of Real-Time Image Processing, 2021, 18(5):1541-1554.

[本文引用: 1]

[18]

苏腾飞.

深度卷积语义分割网络在农田遥感影像分类中的对比研究——以河套灌区为例

[J]. 自然资源遥感, 2024, 36(4):210-217.doi:10.6046/zrzyyg.2023150.

[本文引用: 1]

Su

T F

.

A comparative study on semantic segmentation-orientated deep convolutional networks for remote sensing image-based farmland classification:A case study of the Hetao irrigation district

[J]. Remote Sensing for Natural Resources, 2024, 36(4):210-217.doi:10.6046/zrzyyg.2023150.

[本文引用: 1]

[19]

张瑞瑞, 夏浪, 陈立平, 等.

深度语义分割网络无人机遥感松材线虫病变色木识别

[J]. 自然资源遥感, 2024, 36(3):216-224.doi:10.6046/zrzyyg.2023094.

[本文引用: 1]

Zhang

R R

, Xia

L

, Chen

L P

, et al.

Identifying discolored trees inflected with pine wilt disease using DSSN-based UAV remote sensing

[J]. Remote Sensing for Natural Resources, 2024, 36(3):216-224.doi:10.6046/zrzyyg.2023094.

[本文引用: 1]

[20]

杨军, 于茜子.

结合空洞卷积的FuseNet变体网络高分辨率遥感影像语义分割

[J]. 武汉大学学报(信息科学版), 2022, 47(7):1071-1080.

[本文引用: 1]

Yang

J

, Yu

X Z

.

Semantic segmentation of high-resolution remote sensing images based on improved FuseNet combined with atrous convolution

[J]. Geomatics and Information Science of Wuhan University, 2022, 47(7):1071-1080.

[本文引用: 1]

[21]

Xi

J B

, Ersoy

O K

, Cong

M

, et al.

Wide and deep Fourier neural network for hyperspectral remote sensing image classification

[J]. Remote Sensing, 2022, 14(12):2931-2931.

[22]

潘建平, 李鑫, 孙博文, 等.

基于注意力密集连接金字塔网络的新增建设用地变化检测

[J]. 测绘通报, 2022(3):41-46,59.

DOI:10.13474/j.cnki.11-2246.2022.0075 [本文引用: 1]

城市新增建设用地变化迅速频繁、场景复杂等因素导致变化检测结果出现欠分割或过分割等问题,基于此本文提出了一种融合注意力机制的密集连接金字塔网络用于城市新增建设用地变化检测。在编码阶段运用卷积注意力模型提升对变化信息的关注度,突出重要特征;采用密集连接空洞卷积空间金字塔池化模块实现多尺度特征的提取与融合,提高特征的利用率与传播效率;在解码阶段通过对提取的特征图进行上采样还原图像的空间尺度特征。试验结果表明,该方法有效改善了欠分割与过分割问题,变化检测效果更好。

Pan

J P

, Li

X

, Sun

B W

, et al.

Detection of new construction land change based on attention intensive connection pyramid network

[J]. Bulletin of Surveying and Mapping, 2022(3):41-46,59.

DOI:10.13474/j.cnki.11-2246.2022.0075 [本文引用: 1]

To settle the problems of frequent and rapid changes of new urban construction sites and complex scenarios which lead to under-segmentation or over-segmentation of change detection results,this paper proposes a densely connected pyramid network with a fused attention mechanism for urban new construction site change detection.In the coding stage,a convolutional attention model is applied to enhance the attention to change information and highlight important features;then a densely connected null convolutional spatial pyramid pooling module is used to realize the extraction and fusion of multi-scale features and improves the feature utilization and propagation efficiency;in the decoding stage,the spatial scale features of the image are restored by upsampling the extracted feature maps.The experimental results show that the method in this paper effectively improves the under-segmentation and oversegmentation problems,and the change detection effect is better.

[23]

孙汉淇, 潘晨, 何灵敏, 等.

多模态特征融合的遥感图像语义分割网络

[J]. 计算机工程与应用, 2022, 58(24):256-264.

DOI:10.3778/j.issn.1002-8331.2207-0010 [本文引用: 2]

遥感图像语义分割是指通过对遥感图像上每个像素分配语义标签并标注，从而形成分割图的过程，在国土资源规划、智慧城市等领域有着广泛的应用。高分辨率遥感图像存在目标大小尺度不一与阴影遮挡等问题，单一模态下对相似地物和阴影遮挡地物分割较为困难。针对上述问题，提出了将IRRG（infrared、red、green）图像与DSM（digital surface model）图像融合的遥感图像语义分割网络MMFNet。网络采用编码器-解码器的结构，编码层采用双输入流的方式同时提取IRRG图像的光谱特征和DSM图像的高度特征。解码器使用残差解码块（residual decoding block，RDB）提取融合后的特征，并使用密集连接的方式加强特征的传播和复用。提出复合空洞空间金字塔（complex atrous spatial pyramid pooling，CASPP）模块提取跳跃连接的多尺度特征。在国际摄影测量与遥感学会（international society for photogrammetry and remote sensing，ISPRS）提供的Vaihingen和Potsdam数据集上进行了实验，MMFNet分别取得了90.44%和90.70%的全局精确度，相比较与DeepLabV3+、OCRNet等通用分割网络和CEVO、UFMG_4等同数据集专用分割网络具有更高的分割精确度。

Sun

H Q

, Pan

C

, He

L M

, et al.

Remote sensing image semantic segmentation network based on multimodal feature fusion

[J]. Computer Engineering and Applications, 2022, 58(24):256-264.

DOI:10.3778/j.issn.1002-8331.2207-0010 [本文引用: 2]

Semantic segmentation of remote sensing images refers to the process of forming a segmentation map by semantically labeling each pixel on a remote sensing image, and it has a wide range of applications in land and resource planning, smart city and other fields. High-resolution remote sensing images have problems such as different target size and scale and shadow occlusion, and it is difficult to segment similar objects and shadow occluded objects in a single mode. Aiming at the above problems, a remote sensing image semantic segmentation network MMFNet is proposed, which fuses IRRG（infrared, red, green） images with DSM（digital surface model） images. The network adopts an encoder-decoder structure, and the encoding layer uses a dual-input stream to extract the spectral features of IRRG images and the height features of DSM images simultaneously. The decoder uses the residual decoding block（RDB） to extract the fused features, and uses dense connections to enhance feature propagation and multiplexing. A complex atrous spatial pyramid pooling（CASPP） module is proposed to extract skip-connected multi-scale features. Experiments are conducted on the Vaihingen and Potsdam datasets provided by the international society for photogrammetry and remote sensing（ISPRS）, and MMFNet achieves global accuracy of 90.44% and 90.70%, respectively, compared with DeepLabV3+, OCRNet Equal general segmentation network and CEVO, UFMG_4 equivalent dataset dedicates segmentation network have higher segmentation accuracy.

[24]

Sun

L

, Cheng

S

, Zheng

Y

, et al.

SPANet:Successive pooling attention network for semantic segmentation of remote sensing images

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2022, 15:4045-4057.

[本文引用: 1]

[25]

Cong

M

, Xi

J

, Han

L

, et al.

Multi-resolution classification network for high-resolution UAV remote sensing images

[J]. Geocarto International, 2022, 37(11):3116-3140.

[26]

刘晨晨, 葛小三, 武永斌, 等.

基于混合注意力机制和Deeplabv3+的遥感影像建筑物提取方法

[J]. 自然资源遥感, 2025, 37(1):31-37.doi:10.6046/zrzyyg.2023295.

Liu

C C

, Ge

X S

, Wu

Y B

, et al.

A method for information extraction of buildings from remote sensing images based on hybrid attention mechanism and Deeplabv3+

[J]. Remote Sensing for Natural Resources, 2025, 37(1):31-37.doi:10.6046/zrzyyg.2023295.

[27]

曲海成, 梁旭.

融合混合注意力机制与多尺度特征增强的高分影像建筑物提取

[J]. 自然资源遥感, 2024, 36(4):107-116.doi:10.6046/zrzyyg.2023146.

[本文引用: 1]

Qu

H C

, Liang

X

.

Building extraction from high-resolution images using a hybrid attention mechanism combined with multi-scale feature enhancement

[J]. Remote Sensing for Natural Resources, 2024, 36(4):107-116.doi:10.6046/zrzyyg.2023146.

[本文引用: 1]

[28]

冯炜明, 张新长, 孙颖, 等.

融合Transformer结构的高分辨率遥感影像变化检测网络

[J]. 测绘通报, 2022(8):36-40,92.

DOI:10.13474/j.cnki.11-2246.2022.0229 [本文引用: 1]

为解决遥感影像变化检测全局上下文信息捕获的问题,本文提出了基于孪生结构、跳跃连接结构及Transformer结构的TSU-Net。该模型编码器采用混合CNN-Transformers结构,借助自注意力机制捕获遥感影像的全局上下文信息,增强了模型对于像素级遥感影像变化检测任务的长距离上下文建模能力。该模型在LEVIR-CD数据集和CDD数据集进行测试,F1得分分别为90.73和93.14,优于各对比模型。

Feng

W M

, Zhang

X C

, Sun

Y

, et al.

High-resolution remote sens-ing image change detection network with Transformer structure

[J]. Bulletin of Surveying and Mapping, 2022(8):36-40,92.

[本文引用: 1]

[29]

He

Q B

, Sun

X

, Diao

W H

, et al.

Multimodal remote sensing image segmentation with intuition-inspired hypergraph modeling

[J]. IEEE Transactions on Image Processing, 2023, 32:1474-1487.

[本文引用: 1]

[30]

马妍, 古丽米拉·克孜尔别克.

图像语义分割方法在高分辨率遥感影像解译中的研究综述

[J]. 计算机科学与探索, 2023, 17(7):1526-1548.

DOI:10.3778/j.issn.1673-9418.2211015 [本文引用: 1]

快速获取遥感信息对图像语义分割方法在遥感影像解译应用发展具有重要的研究意义。随着卫星遥感影像记录的数据种类越来越多，特征信息越来越复杂，精确有效地提取遥感影像中的信息，成为图像语义分割方法解译遥感图像的关键。为了探索快速高效解译遥感影像的图像语义分割方法，对大量关于遥感影像的图像语义分割方法进行了总结。首先，综述了传统的图像语义分割方法，并将其划分为基于边缘检测的分割方法、基于区域的分割方法、基于阈值的分割方法和结合特定理论的分割方法，同时分析了传统图像语义分割方法的局限性。其次，详细阐述了基于深度学习的语义分割方法，并以每种方法的基本思想和技术特点作为划分标准，将其分为基于FCN的方法、基于编解码器的方法、基于空洞卷积的方法和基于注意力机制的方法四类，概述了每类方法中包含的子方法，并对比分析了这些方法的优缺点。然后，简单介绍了遥感图像语义分割常用数据集和性能评价指标，给出了经典网络模型在不同数据集上的实验结果，同时对不同模型的性能进行了评估。最后，分析了图像语义分割方法在高分辨率遥感图像解译上面临的挑战，并对未来的发展趋势进行了展望。

Ma

Y

, Gulimila

K

.

Research review of image semantic segmentation method in high-resolution remote sensing image interpretation

[J]. Journal of Frontiers of Computer Science and Technology, 2023, 17(7):1526-1548.

[本文引用: 1]

[31]

潘俊杰, 慎利, 鄢薪, 等.

一种基于对抗学习的高分辨率遥感影像语义分割无监督域自适应方法

[J]. 自然资源遥感, 2024, 36(4):149-157.doi:10.6046/zrzyyg.2023169.

[本文引用: 1]

Pan

J J

, Shen

L

, Yan

X

, et al.

An adversarial learning-based unsupervised domain adaptation method for semantic segmentation of high-resolution remote sensing images

[J]. Remote Sensing for Natural Resources, 2024, 36(4):149-157.doi:10.6046/zrzyyg.2023169.

[本文引用: 1]

[32]

Katsuki

F

, Constantinidis

C

.

Bottom-up and top-down attention:Different processes and overlapping neural systems

[J]. The Neuroscientist:A Review Journal Bringing Neurobiology,Neurology and Psychiatry, 2014, 20(5):509-521.

[本文引用: 1]

[33]

Katsumi

Y

, Putcha

D

, Eckbo

R

, et al.

Anterior dorsal attention network tau drives visual attention deficits in posterior cortical atrophy

[J]. Brain, 2023, 146(1):295-306.

[本文引用: 1]

[34]

Goferman

S

, Zelnik-Manor

L

, Tal

A

.

Context-aware saliency detection

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(10):1915-1926.

PMID:22201056 [本文引用: 1]

We propose a new type of saliency—context-aware saliency—which aims at detecting the image regions that represent the scene. This definition differs from previous definitions whose goal is to either identify fixation points or detect the dominant object. In accordance with our saliency definition, we present a detection algorithm which is based on four principles observed in the psychological literature. The benefits of the proposed approach are evaluated in two applications where the context of the dominant objects is just as essential as the objects themselves. In image retargeting, we demonstrate that using our saliency prevents distortions in the important regions. In summarization, we show that our saliency helps to produce compact, appealing, and informative summaries.

[35]

郑少佳, 邱崧, 李庆利, 等.

傅里叶变换通道注意力网络的胆管癌高光谱图像分割

[J]. 中国图象图形学报, 2021, 26(8):1836-1846.

[本文引用: 1]

Zheng

S J

, Qiu

S

, Li

Q L

, et al.

Fourier transform channel attention network for cholangiocarcinoma hyperspectral image segmentation

[J]. Journal of Image and Graphics, 2021, 26(8):1836-1846.

[本文引用: 1]

[36]

Zhou

Z

, Zhou

Y

, Wang

D

, et al.

Self-attention feature fusion network for semantic segmentation

[J]. Neurocomputing, 2021, 453:50-59.

[本文引用: 1]

[37]

杨开富.

前端视觉通路信息加工的计算模型及应用研究[D]. 成都: 电子科技大学, 2016.

[本文引用: 1]

Yang

K F

.

Computational models and applications of the early stages of biological visual system[D]. Chengdu: University of Electronic Science and Technology of China, 2016.

[本文引用: 1]

[38]

Marks

W B

, Dobelle

W H

, Macnichol Jr

E F

.

Visual pigments of single primate cones

[J]. Science, 1964, 143(3611):1181-1183.

PMID:14108303 [本文引用: 1]

Single parafoveal cones from human and monkey retinas were examined in a recording microspectrophotometer. Three types of receptors with maximum absorption in the yellow, green, and violet regions of the spectruin were found. Thus the commonly held belief, for which there has previously been no direct and unequivocal evidence, that color vision is mediated by several kinds of receptors (possibly three), each containing photopigments absorbing in diflerent regions of the spectrum, is confirmed.

[39]

Li

C Y

, Pei

X

, Zhow

Y X

, et al.

Role of the extensive area outside the x-cell receptive field in brightness information transmission

[J]. Vision Research, 1991, 31(9):1529-1540.

PMID:1949622 [本文引用: 1]

Stimulus area-response functions of retinal ganglion cells show an extensive disinhibitory region (DIR) outside the classical receptive field (RF). The DIR has a wide summation area but low sensitivity. Spatial responses of the retinal ganglion cells have been simulated in a model which takes into account also the properties of the DIR. By scanning the RF and its DIR with a visual image and reconstructing the transferred image for single cells, it is shown that these properties of the DIR are beneficial in the transmission of area brightness and image grey scales.

[40]

Grigorescu

C

, Petkov

N

, Westenberg

M A

.

Contour detection based on nonclassical receptive field inhibition

[J]. IEEE Transactions on Image Processing, 2003, 12(7):729-739.

DOI:10.1109/TIP.2003.814250 PMID:18237948 [本文引用: 1]

We propose a biologically motivated method, called nonclassical receptive field (non-CRF) inhibition (more generally, surround inhibition or suppression), to improve contour detection in machine vision. Non-CRF inhibition is exhibited by 80% of the orientation-selective neurons in the primary visual cortex of monkeys and has been shown to influence human visual perception as well. Essentially, the response of an edge detector at a certain point is suppressed by the responses of the operator in the region outside the supported area. We combine classical edge detection with isotropic and anisotropic inhibition, both of which have counterparts in biology. We also use a biologically motivated method (the Gabor energy operator) for edge detection. The resulting operator responds strongly to isolated lines, edges, and contours, but exhibits weak or no response to edges that are part of texture. We use natural images with associated ground truth contour maps to assess the performance of the proposed operator for detecting contours while suppressing texture edges. Our method enhances contour detection in cluttered visual scenes more effectively than classical edge detectors used in machine vision (Canny edge detector). Therefore, the proposed operator is more useful for contour-based object recognition tasks, such as shape comparison, than traditional edge detectors, which do not distinguish between contour and texture edges. Traditional edge detection algorithms can, however, also be extended with surround suppression. This study contributes also to the understanding of inhibitory mechanisms in biology.

[41]

宋晓风.

数字脉冲压缩技术在雷达中的应用

[J]. 现代电子技术, 2009, 32(12):118-120.

[本文引用: 1]

Song

X F

.

Application of digital pulse compression technique in Radar

[J]. Modern Electronics Technique, 2009, 32(12):118-120.

[本文引用: 1]

[42]

Michelson

A A

.

Studies in optics[M]. Mineola,NY: Dover Publications, 1995.

[本文引用: 1]

[43]

Damera-Venkata

N

, Kite

T D

, Geisler

W S

, et al.

Image quality assessment based on a degradation model

[J]. IEEE Transactions on Image Processing, 2000, 9(4):636-650.

DOI:10.1109/83.841940 PMID:18255436 [本文引用: 1]

We model a degraded image as an original image that has been subject to linear frequency distortion and additive noise injection. Since the psychovisual effects of frequency distortion and noise injection are independent, we decouple these two sources of degradation and measure their effect on the human visual system. We develop a distortion measure (DM) of the effect of frequency distortion, and a noise quality measure (NQM) of the effect of additive noise. The NQM, which is based on Peli's (1990) contrast pyramid, takes into account the following: 1) variation in contrast sensitivity with distance, image dimensions, and spatial frequency; 2) variation in the local luminance mean; 3) contrast interaction between spatial frequencies; 4) contrast masking effects. For additive noise, we demonstrate that the nonlinear NQM is a better measure of visual quality than peak signal-to noise ratio (PSNR) and linear quality measures. We compute the DM in three steps. First, we find the frequency distortion in the degraded image. Second, we compute the deviation of this frequency distortion from an allpass response of unity gain (no distortion). Finally, we weight the deviation by a model of the frequency response of the human visual system and integrate over the visible frequencies. We demonstrate how to decouple distortion and additive noise degradation in a practical image restoration system.

[44]

Cong

M

, Cui

J

, Peng

X

, et al.

Preliminary analytical method for unsupervised remote sensing image classification based on visual perception and a force field

[J]. Geocarto International, 2018, 33(12):1350-1366.

[本文引用: 1]

[45]

Hubel

D H

, Wiesel

T N

.

Receptive fields of single neurones in the cat’s striate cortex

[J]. The Journal of Physiology, 1959, 148(3):574-591.

[本文引用: 1]

[46]

Hubel

D H

, Wiesel

T N

.

Receptive fields and functional architecture of monkey striate cortex

[J]. The Journal of Physiology, 1968, 195(1):215-243.

[47]

Hubel

D H

, Wiesel

T N

.

The period of susceptibility to the physiological effects of unilateral eye closure in kittens

[J]. The Journal of Physiology, 1970, 206(2):419-436.

[48]

Hubel

D H

, Wiesel

T N

. Ferrier

lecture

.

Functional architecture of macaque monkey visual cortex

[J]. Proceedings of the Royal Society of London Series B,Biological Sciences, 1977, 198(1130):1-59.

[本文引用: 1]

[49]

徐安林, 杜丹, 王海红, 等.

结合层次化搜索与视觉残差网络的光学舰船目标检测方法

[J]. 光电工程, 2021, 48(4):39-46.

[本文引用: 1]

Xu

A L

, Du

D

, Wang

H H

, et al.

Optical ship target detection method combining hierarchical search and visual residual network

[J]. Opto-Electronic Engineering, 2021, 48(4):39-46.

[本文引用: 1]

[50]

许妙忠, 丛铭, 万丽娟, 等.

视觉感受与Markov随机场相结合的高分辨率遥感影像分割法

[J]. 测绘学报, 2015, 44(2):198-205,213.

DOI:10.11947/j.AGCS.2015.20130453

鉴于视觉感受对外界强大的感知与识别能力, 模拟视觉神经感知的工作机制, 并结合Markov随机场模型, 提出一种新的影像分割方法。首先, 分析视觉感知系统的工作机制, 将其特性归纳为等级层次性、学习能力、特征检测能力和稀疏编码特性, 继而利用小波变换、非监督聚类、特征分析和Laplace分布模拟视觉工作机制, 然后结合Markov随机场模型实现高分辨率遥感影像的分割。通过不同卫星的真实遥感影像进行相关试验。试验结果表明本文提出的方法在高分辨率遥感影像分割任务中有非常良好的表现。

Xu

M Z

, Cong

M

, Wan

L J

, et al.

A methodology of image segmentation for high resolution remote sensing image based on visual system and Markov random field

[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(2):198-205,213.

DOI:10.11947/j.AGCS.2015.20130453

In consideration of the visual system's tremendous ability to perceive and identify the information, a new image segmentation method is presented which simulates the mechanism of visual system for the high resolution remote sensing image segmentation with Markov random field model. Firstly, the characteristics of the visual system have been summarized as: hierarchy, learning ability, feature detection capability and sparse coding property. Secondly, the working mechanism of visual system is simulated by wavelet transform, unsupervised clustering algorithm, feature analysis and Laplace distribution. Then, the segmentation is achieved by the visual mechanism and the Markov random field. Different satellites remote sensing images are adopted as the experimental data, and the segmentation results demonstrate the proposed method have good performance in high resolution remote sensing images.

[51]

Zheng

R

, Zhong

Y

, Yan

S

, et al.

MsVRL:Self-supervised multiscale visual representation learning via cross-level consistency for medical image segmentation

[J]. IEEE Transactions on Medical Imaging, 2023, 42(1):91-102.

[本文引用: 1]

[52]

Ibbotson

M

, Krekelberg

B

.

Visual perception and saccadic eye movements

[J]. Current Opinion in Neurobiology, 2011, 21(4):553-558.

DOI:10.1016/j.conb.2011.05.012 PMID:21646014 [本文引用: 1]

We use saccades several times per second to move the fovea between points of interest and build an understanding of our visual environment. Recent behavioral experiments show evidence for the integration of pre- and postsaccadic information (even subliminally), the modulation of visual sensitivity, and the rapid reallocation of attention. The recent physiological literature has identified a characteristic modulation of neural responsiveness-perisaccadic reduction followed by a postsaccadic increase-that is found in many visual areas, but whose source is as yet unknown. This modulation seems optimal for reducing sensitivity during and boosting sensitivity between saccades, but no study has yet established a direct causal link between neural and behavioral changes.Copyright © 2011 Elsevier Ltd. All rights reserved.

[53]

Stewart

E E M

, Valsecchi

M

, Schütz

A C

.

A review of interactions between peripheral and foveal vision

[J]. Journal of Vision, 2020, 20(12):2.

DOI:10.1167/jov.20.12.2 PMID:33141171 [本文引用: 3]

Visual processing varies dramatically across the visual field. These differences start in the retina and continue all the way to the visual cortex. Despite these differences in processing, the perceptual experience of humans is remarkably stable and continuous across the visual field. Research in the last decade has shown that processing in peripheral and foveal vision is not independent, but is more directly connected than previously thought. We address three core questions on how peripheral and foveal vision interact, and review recent findings on potentially related phenomena that could provide answers to these questions. First, how is the processing of peripheral and foveal signals related during fixation? Peripheral signals seem to be processed in foveal retinotopic areas to facilitate peripheral object recognition, and foveal information seems to be extrapolated toward the periphery to generate a homogeneous representation of the environment. Second, how are peripheral and foveal signals re-calibrated? Transsaccadic changes in object features lead to a reduction in the discrepancy between peripheral and foveal appearance. Third, how is peripheral and foveal information stitched together across saccades? Peripheral and foveal signals are integrated across saccadic eye movements to average percepts and to reduce uncertainty. Together, these findings illustrate that peripheral and foveal processing are closely connected, mastering the compromise between a large peripheral visual field and high resolution at the fovea.

[54]

Rucci

M

, Iovin

R

, Poletti

M

, et al.

Miniature eye movements enhance fine spatial detail

[J]. Nature, 2007, 447(7146):852-855.

[本文引用: 1]

[55]

McCamy

M B

, Otero-Millan

J

, Macknik

S L

, et al.

Microsaccadic efficacy and contribution to foveal and peripheral vision

[J]. The Journal of Nearoscience, 2012, 32(27):9194-9204.

[本文引用: 2]

[56]

Martinez-Conde

S

, Otero-Millan

J

, Macknik

S L

.

The impact of microsaccades on vision:Towards a unified theory of saccadic function

[J]. Nature Reviews Neuroscience, 2013, 14(2):83-96.

DOI:10.1038/nrn3405 PMID:23329159 [本文引用: 1]

When we attempt to fix our gaze, our eyes nevertheless produce so-called 'fixational eye movements', which include microsaccades, drift and tremor. Fixational eye movements thwart neural adaptation to unchanging stimuli and thus prevent and reverse perceptual fading during fixation. Over the past 10 years, microsaccade research has become one of the most active fields in visual, oculomotor and even cognitive neuroscience. The similarities and differences between microsaccades and saccades have been a most intriguing area of study, and the results of this research are leading us towards a unified theory of saccadic and microsaccadic function.

[57]

杜方家, 徐杨, 李长军.

改进的CIELAB均匀颜色空间

[J]. 光学学报, 2022, 42(1):292-300.

[本文引用: 1]

Du

F J

, Xu

Y

, Li

C J

.

Modified CIELAB uniform color space

[J]. Acta Optica Sinica, 2022, 42(1):292-300.

[本文引用: 1]

[58]

陈少军, 张莉华, 许新德, 等.

微胶囊叶黄素吸收光谱及色调的影响因素研究

[J]. 中国食品添加剂, 2013, 24(4):100-102.

[本文引用: 1]

Chen

S J

, Zhang

L H

, Xu

X D

, et al.

Studies on factors influence UV-absorbance and color value of microencapsulated lutein

[J]. China Food Additives, 2013, 24(4):100-102.

[本文引用: 1]

[59]

CIE.

CIE 217:2016 Recommended method for evaluating the performance of colour-difference formulae[S]. Vienna:CIE, 2016.

[本文引用: 1]

[60]

Chen

Q

, Wu

Q

, Wang

J

, et al.

MixFormer:Mixing features across windows and dimensions[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).June 18-24,2022,New Orleans,LA,USA.IEEE,2022:5239-5249.

[本文引用: 1]

[61]

Yang

R

, Ma

H L

, Wu

J

, et al.

ScalableViT:Rethinking the context-oriented generalization of vision Transformer[C]// Computer Vision-ECCV 2022 Proceedings. Cham: Springer Nature Switzerland,2022:480-496.

[本文引用: 4]

[62]

李世琦, 姚国清.

基于CNN与SETR的特征融合滑坡体检测

[J]. 自然资源遥感, 2024, 36(4):158-164.doi:10.6046/zrzyyg.2023117.

[本文引用: 1]

Li

S Q

, Yao

G Q

.

A landslide detection method using CNN- and SETR-based feature fusion

[J]. Remote Sensing for Natural Resources, 2024, 36(4):158-164.doi:10.6046/zrzyyg.2023117.

[本文引用: 1]

[63]

李婉悦, 娄德波, 王成辉, 等.

基于改进U-Net网络的花岗伟晶岩信息提取方法

[J]. 自然资源遥感, 2024, 36(2):89-96.doi:10.6046/zrzyyg.2022500.

[本文引用: 1]

Li

W Y

, Lou

D B

, Wang

C H

, et al.

A granitic pegmatite information extraction method based on improved U-Net

[J]. Remote Sensing for Natural Resources, 2024, 36(2):89-96.doi:10.6046/zrzyyg.2022500.

[本文引用: 1]

[64]

陈佳雪, 肖东升, 陈虹宇.

一种边界引导与跨尺度信息交互网络用于遥感影像水体提取

[J]. 自然资源遥感, 2025, 37(1):15-23.doi:10.6046/zrzyyg.2023230.

[本文引用: 1]

Chen

J X

, Xiao

D S

, Chen

H Y

.

A boundary guidance and cross-scale information interaction network for water body extraction from remote sensing images

[J]. Remote Sensing for Natural Resources, 2025, 37(1):15-23.doi:10.6046/zrzyyg.2023230.

[本文引用: 1]

[65]

姚群力, 胡显, 雷宏.

基于多尺度卷积神经网络的遥感目标检测研究

[J]. 光学学报, 2019, 39(11):346-353.

[本文引用: 1]

Yao

Q L

, Hu

X

, Lei

H

.

Object detection in remote sensing images using multiscale convolutional neural networks

[J]. Acta Optica Sinica, 2019, 39(11):346-353.

[本文引用: 1]

[66]

雷大江, 杜加浩, 张莉萍, 等.

联合多流融合和多尺度学习的卷积神经网络遥感图像融合方法

[J]. 电子与信息学报, 2022, 44(1):237-244.

[本文引用: 1]

Lei

D J

, Du

J H

, Zhang

L P

, et al.

Multi-stream architecture and multi-scale convolutional neural network for remote sensing image fusion

[J]. Journal of Electronics & Information Technology, 2022, 44(1):237-244.

[本文引用: 1]

[67]

Cong

M

, Cui

J

, Chen

S

, et al.

Enhanced shuffle attention network based on visual working mechanism for high-resolution remote sensing image classification

[J]. Geocarto International, 2022, 37(27):18731-18766.

[本文引用: 2]

[68]

Guo

M H

, Lu

C Z

, Hou

Q B

, et al.

SegNeXt:Rethinking convolutional attention design for semantic segmentation

[J/OL]. arXiv, 2022(2022-09-18). https://arxiv.org/abs/2209.08575v1.

URL [本文引用: 2]

[69]

Cong

M

, Xi

J

, Ding

M

, et al.

Two-pathway anti-interference neural network based on the retinal perception mechanism for classification of remote sensing images from unmanned aerial vehicles

[J]. Journal of Applied Remote Sensing, 2020, 14(2):026511.

[本文引用: 1]

[70]

Sharma

A K

, Nandal

A

, Dhaka

A

, et al.

Enhanced watershed segmentation algorithm-based modified ResNet50 model for brain tumor detection

[J]. BioMed Research International, 2022, 2022:7348344.

[本文引用: 1]

[71]

Zhao

X Q

, Jia

H P

, Pang

Y W

, et al.

M²SNet:Multi-scale in multi-scale subtraction network for medical image segmentation

[J/OL]. arXiv, 2023(2023-03-20). https://arxiv.org/abs/2303.10894.

URL [本文引用: 1]

[72]

Mahmoud

A

, Mohamed

S

, El-Khoribi

R

, et al.

Object detection using adaptive mask RCNN in optical remote sensing images

[J]. International Journal of Intelligent Engineering and Systems, 2020, 13(1):65-76.

[本文引用: 2]

[73]

Song

K S

.

Globally convergent algorithms for estimating generalized gamma distributions in fast signal and image processing

[J]. IEEE Transactions on Image Processing, 2008, 17(8):1233-1250.

[本文引用: 1]

[74]

白石, 唐攀攀, 苗朝, 等.

基于高分辨率遥感影像和改进U-Net模型的滑坡提取——以汶川地区为例

[J]. 自然资源遥感, 2024, 36(3):96-107.doi:10.6046/zrzyyg.2023132.

[本文引用: 1]

Bai

S

, Tang

P P

, Miao

Z

, et al.

Information extraction of landslides based on high-resolution remote sensing images and an improved U-Net model:A case study of Wenchuan,Sichuan

[J]. Remote Sensing for Natural Resources, 2024, 36(3):96-107.doi:10.6046/zrzyyg.2023132.

[本文引用: 1]

[75]

Pontius

R G Jr

, Millones

M

.

Death to Kappa:Birth of quantity disagreement and allocation disagreement for accuracy assessment

[J]. International Journal of Remote Sensing, 2011, 32(15):4407-4429.

[本文引用: 1]

Simplified object-based deep neural network for very high resolution remote sensing image classification

1

2021

... 高分辨率遥感影像作为当前空天地全方位观测体系中的重要环节，能够针对各类场景进行精确、细致的观测，从而为众多科学研究和工程应用提供基础数据支持和可靠的实景参考^[1-4]. ...

高空间分辨率遥感影像最优分割结果自动确定方法

0

2022

高空间分辨率遥感影像最优分割结果自动确定方法

0

2022

空间信息感知语义分割模型的高分辨率遥感影像道路提取

0

2022

空间信息感知语义分割模型的高分辨率遥感影像道路提取

0

2022

Superpixel segmentation of high-resolution remote sensing image based on feature reconstruction method by salient edges

1

2023

... 高分辨率遥感影像作为当前空天地全方位观测体系中的重要环节，能够针对各类场景进行精确、细致的观测，从而为众多科学研究和工程应用提供基础数据支持和可靠的实景参考^[1-4]. ...

智能优化学习的高空间分辨率遥感影像语义分割

1

2022

... 高分辨率遥感影像分割是根据一定的规则，将高分辨率遥感影像划分为不同的区域或对象的过程，旨在将影像中的不同地物和特征清晰地区分开来.这不仅能降低遥感影像的解译难度，还能压缩庞大的数据量，简化遥感影像的处理过程，是高分辨率遥感影像数据处理的关键技术^[5-8]. ...

智能优化学习的高空间分辨率遥感影像语义分割

1

2022

... 高分辨率遥感影像分割是根据一定的规则，将高分辨率遥感影像划分为不同的区域或对象的过程，旨在将影像中的不同地物和特征清晰地区分开来.这不仅能降低遥感影像的解译难度，还能压缩庞大的数据量，简化遥感影像的处理过程，是高分辨率遥感影像数据处理的关键技术^[5-8]. ...

基于层次化混合模型的高分辨率遥感影像分割方法研究

0

2023

基于层次化混合模型的高分辨率遥感影像分割方法研究

0

2023

A coarse-to-fine weakly supervised learning method for green plastic cover segmentation using high-resolution remote sensing images

0

2022

Semantic segmentation of very-high-resolution remote sensing images via deep multi-feature learning

1

2022

... 高分辨率遥感影像分割是根据一定的规则，将高分辨率遥感影像划分为不同的区域或对象的过程，旨在将影像中的不同地物和特征清晰地区分开来.这不仅能降低遥感影像的解译难度，还能压缩庞大的数据量，简化遥感影像的处理过程，是高分辨率遥感影像数据处理的关键技术^[5-8]. ...

Non-local feature search network for building and road segmentation of remote sensing image

1

2021

... 这种高效快速的影像信息提取技术，对于土地利用与土地覆盖调查来说，能够迅速估算出土地利用的面积、比例和分布情况.在生态环境保护领域，它可以对一些典型的污染情况进行监测、探查与定位.此外，在城市规划方面，高分辨率遥感影像分割提供了城市中的建筑物、道路、绿化场地等空间信息.同时，它还具有快速提取灾害区域、分析灾害程度的能力.总体上，高分辨率遥感影像分割在遥感领域中具有举足轻重的地位和作用，是目前遥感技术发展的主要方向之一^[9-12]. ...

Multiscale feature fusion network for automatic port segmentation from remote sensing images

0

2022

基于语义分割的遥感影像建筑物自动提取方法

0

2023

基于语义分割的遥感影像建筑物自动提取方法

0

2023

结合分类和语义分割的遥感影像洪涝灾害检测方法

1

2023

... 这种高效快速的影像信息提取技术，对于土地利用与土地覆盖调查来说，能够迅速估算出土地利用的面积、比例和分布情况.在生态环境保护领域，它可以对一些典型的污染情况进行监测、探查与定位.此外，在城市规划方面，高分辨率遥感影像分割提供了城市中的建筑物、道路、绿化场地等空间信息.同时，它还具有快速提取灾害区域、分析灾害程度的能力.总体上，高分辨率遥感影像分割在遥感领域中具有举足轻重的地位和作用，是目前遥感技术发展的主要方向之一^[9-12]. ...

结合分类和语义分割的遥感影像洪涝灾害检测方法

1

2023

... 这种高效快速的影像信息提取技术，对于土地利用与土地覆盖调查来说，能够迅速估算出土地利用的面积、比例和分布情况.在生态环境保护领域，它可以对一些典型的污染情况进行监测、探查与定位.此外，在城市规划方面，高分辨率遥感影像分割提供了城市中的建筑物、道路、绿化场地等空间信息.同时，它还具有快速提取灾害区域、分析灾害程度的能力.总体上，高分辨率遥感影像分割在遥感领域中具有举足轻重的地位和作用，是目前遥感技术发展的主要方向之一^[9-12]. ...

遥感地物分割的改进格子玻尔兹曼并行模型

1

2021

... 目前常用的高分辨率遥感影像分割方法主要分为非监督分析方法与监督学习方法.其中，非监督分析方法大多需要从影像中提取典型特征，并依赖地物的特征差异实现分割任务，主要方法包括：阈值分割法^[13]、区域分割法^[14]、边缘检测分割法^[15]、基于小波变换的分割方法^[16]以及基于聚类的分割方法^[17]等.这种分析思路在地物特征明显、不同地物特征差异较大的地面场景中，能够以无需样本、自动化的优势获取较好的分割效果.然而，受制于特征设计、特征提取和特征统计分析的性能，再加上噪声等干扰因素的存在，这类方法在面对高分辨率的复杂地面场景时，可能在地物认知性能、泛化推理程度与抗干扰能力等方法还有所欠缺，在实现高精度的高分辨率遥感影像分割方面仍需面临诸多挑战. ...

遥感地物分割的改进格子玻尔兹曼并行模型

1

2021

... 目前常用的高分辨率遥感影像分割方法主要分为非监督分析方法与监督学习方法.其中，非监督分析方法大多需要从影像中提取典型特征，并依赖地物的特征差异实现分割任务，主要方法包括：阈值分割法^[13]、区域分割法^[14]、边缘检测分割法^[15]、基于小波变换的分割方法^[16]以及基于聚类的分割方法^[17]等.这种分析思路在地物特征明显、不同地物特征差异较大的地面场景中，能够以无需样本、自动化的优势获取较好的分割效果.然而，受制于特征设计、特征提取和特征统计分析的性能，再加上噪声等干扰因素的存在，这类方法在面对高分辨率的复杂地面场景时，可能在地物认知性能、泛化推理程度与抗干扰能力等方法还有所欠缺，在实现高精度的高分辨率遥感影像分割方面仍需面临诸多挑战. ...

基于直方图区域生长的遥感图像阈值分割算法

1

2021

... 目前常用的高分辨率遥感影像分割方法主要分为非监督分析方法与监督学习方法.其中，非监督分析方法大多需要从影像中提取典型特征，并依赖地物的特征差异实现分割任务，主要方法包括：阈值分割法^[13]、区域分割法^[14]、边缘检测分割法^[15]、基于小波变换的分割方法^[16]以及基于聚类的分割方法^[17]等.这种分析思路在地物特征明显、不同地物特征差异较大的地面场景中，能够以无需样本、自动化的优势获取较好的分割效果.然而，受制于特征设计、特征提取和特征统计分析的性能，再加上噪声等干扰因素的存在，这类方法在面对高分辨率的复杂地面场景时，可能在地物认知性能、泛化推理程度与抗干扰能力等方法还有所欠缺，在实现高精度的高分辨率遥感影像分割方面仍需面临诸多挑战. ...

基于直方图区域生长的遥感图像阈值分割算法

1

2021

... 目前常用的高分辨率遥感影像分割方法主要分为非监督分析方法与监督学习方法.其中，非监督分析方法大多需要从影像中提取典型特征，并依赖地物的特征差异实现分割任务，主要方法包括：阈值分割法^[13]、区域分割法^[14]、边缘检测分割法^[15]、基于小波变换的分割方法^[16]以及基于聚类的分割方法^[17]等.这种分析思路在地物特征明显、不同地物特征差异较大的地面场景中，能够以无需样本、自动化的优势获取较好的分割效果.然而，受制于特征设计、特征提取和特征统计分析的性能，再加上噪声等干扰因素的存在，这类方法在面对高分辨率的复杂地面场景时，可能在地物认知性能、泛化推理程度与抗干扰能力等方法还有所欠缺，在实现高精度的高分辨率遥感影像分割方面仍需面临诸多挑战. ...

使用超像素编码的交互式影像语义分割方法

1

2022

... 目前常用的高分辨率遥感影像分割方法主要分为非监督分析方法与监督学习方法.其中，非监督分析方法大多需要从影像中提取典型特征，并依赖地物的特征差异实现分割任务，主要方法包括：阈值分割法^[13]、区域分割法^[14]、边缘检测分割法^[15]、基于小波变换的分割方法^[16]以及基于聚类的分割方法^[17]等.这种分析思路在地物特征明显、不同地物特征差异较大的地面场景中，能够以无需样本、自动化的优势获取较好的分割效果.然而，受制于特征设计、特征提取和特征统计分析的性能，再加上噪声等干扰因素的存在，这类方法在面对高分辨率的复杂地面场景时，可能在地物认知性能、泛化推理程度与抗干扰能力等方法还有所欠缺，在实现高精度的高分辨率遥感影像分割方面仍需面临诸多挑战. ...

使用超像素编码的交互式影像语义分割方法

1

2022

... 目前常用的高分辨率遥感影像分割方法主要分为非监督分析方法与监督学习方法.其中，非监督分析方法大多需要从影像中提取典型特征，并依赖地物的特征差异实现分割任务，主要方法包括：阈值分割法^[13]、区域分割法^[14]、边缘检测分割法^[15]、基于小波变换的分割方法^[16]以及基于聚类的分割方法^[17]等.这种分析思路在地物特征明显、不同地物特征差异较大的地面场景中，能够以无需样本、自动化的优势获取较好的分割效果.然而，受制于特征设计、特征提取和特征统计分析的性能，再加上噪声等干扰因素的存在，这类方法在面对高分辨率的复杂地面场景时，可能在地物认知性能、泛化推理程度与抗干扰能力等方法还有所欠缺，在实现高精度的高分辨率遥感影像分割方面仍需面临诸多挑战. ...

基于小波域三重MRF分割算法的遥感图像分割分析

1

2021

... 目前常用的高分辨率遥感影像分割方法主要分为非监督分析方法与监督学习方法.其中，非监督分析方法大多需要从影像中提取典型特征，并依赖地物的特征差异实现分割任务，主要方法包括：阈值分割法^[13]、区域分割法^[14]、边缘检测分割法^[15]、基于小波变换的分割方法^[16]以及基于聚类的分割方法^[17]等.这种分析思路在地物特征明显、不同地物特征差异较大的地面场景中，能够以无需样本、自动化的优势获取较好的分割效果.然而，受制于特征设计、特征提取和特征统计分析的性能，再加上噪声等干扰因素的存在，这类方法在面对高分辨率的复杂地面场景时，可能在地物认知性能、泛化推理程度与抗干扰能力等方法还有所欠缺，在实现高精度的高分辨率遥感影像分割方面仍需面临诸多挑战. ...

基于小波域三重MRF分割算法的遥感图像分割分析

1

2021

... 目前常用的高分辨率遥感影像分割方法主要分为非监督分析方法与监督学习方法.其中，非监督分析方法大多需要从影像中提取典型特征，并依赖地物的特征差异实现分割任务，主要方法包括：阈值分割法^[13]、区域分割法^[14]、边缘检测分割法^[15]、基于小波变换的分割方法^[16]以及基于聚类的分割方法^[17]等.这种分析思路在地物特征明显、不同地物特征差异较大的地面场景中，能够以无需样本、自动化的优势获取较好的分割效果.然而，受制于特征设计、特征提取和特征统计分析的性能，再加上噪声等干扰因素的存在，这类方法在面对高分辨率的复杂地面场景时，可能在地物认知性能、泛化推理程度与抗干扰能力等方法还有所欠缺，在实现高精度的高分辨率遥感影像分割方面仍需面临诸多挑战. ...

Real-time segmentation of remote sensing images with a combination of clustering and Bayesian approaches

1

2021

... 目前常用的高分辨率遥感影像分割方法主要分为非监督分析方法与监督学习方法.其中，非监督分析方法大多需要从影像中提取典型特征，并依赖地物的特征差异实现分割任务，主要方法包括：阈值分割法^[13]、区域分割法^[14]、边缘检测分割法^[15]、基于小波变换的分割方法^[16]以及基于聚类的分割方法^[17]等.这种分析思路在地物特征明显、不同地物特征差异较大的地面场景中，能够以无需样本、自动化的优势获取较好的分割效果.然而，受制于特征设计、特征提取和特征统计分析的性能，再加上噪声等干扰因素的存在，这类方法在面对高分辨率的复杂地面场景时，可能在地物认知性能、泛化推理程度与抗干扰能力等方法还有所欠缺，在实现高精度的高分辨率遥感影像分割方面仍需面临诸多挑战. ...

深度卷积语义分割网络在农田遥感影像分类中的对比研究——以河套灌区为例

1

2024

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

深度卷积语义分割网络在农田遥感影像分类中的对比研究——以河套灌区为例

1

2024

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

深度语义分割网络无人机遥感松材线虫病变色木识别

1

2024

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

深度语义分割网络无人机遥感松材线虫病变色木识别

1

2024

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

结合空洞卷积的FuseNet变体网络高分辨率遥感影像语义分割

1

2022

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

结合空洞卷积的FuseNet变体网络高分辨率遥感影像语义分割

1

2022

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

Wide and deep Fourier neural network for hyperspectral remote sensing image classification

0

2022

基于注意力密集连接金字塔网络的新增建设用地变化检测

1

2022

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

基于注意力密集连接金字塔网络的新增建设用地变化检测

1

2022

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

多模态特征融合的遥感图像语义分割网络

2

2022

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

... [23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

多模态特征融合的遥感图像语义分割网络

2

2022

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

... [23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

SPANet:Successive pooling attention network for semantic segmentation of remote sensing images

1

2022

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

Multi-resolution classification network for high-resolution UAV remote sensing images

0

2022

基于混合注意力机制和Deeplabv3+的遥感影像建筑物提取方法

0

2025

基于混合注意力机制和Deeplabv3+的遥感影像建筑物提取方法

0

2025

融合混合注意力机制与多尺度特征增强的高分影像建筑物提取

1

2024

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

融合混合注意力机制与多尺度特征增强的高分影像建筑物提取

1

2024

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

融合Transformer结构的高分辨率遥感影像变化检测网络

1

2022

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

融合Transformer结构的高分辨率遥感影像变化检测网络

1

2022

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

Multimodal remote sensing image segmentation with intuition-inspired hypergraph modeling

1

2023

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

图像语义分割方法在高分辨率遥感影像解译中的研究综述

1

2023

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

图像语义分割方法在高分辨率遥感影像解译中的研究综述

1

2023

... 而监督学习方法主要尝试从样本中学习到可泛化的分割规律，对影像进行划分.当下随着卷积神经网络（convolutional neural network，CNN）不断地发展，深度学习神经网络分割成为目前最为流行的监督学习分割方法^[18-19].这种深度学习方法，通过层次化的卷积与后向传播修正，自动化地映射影像数据与地物类别的关系，能够从影像中抽象出非线性的隐含特征，实施高精度的地物划分，主要包括：基于编码器-解码器的分割方法^[20-23]、基于金字塔融合的分割方法^[22]、基于多分支融合的分割方法^[23]、基于注意力机制的分割方法^[24-27]及基于 Transformer 的分割方法^[28-29]等.这些方法在样本数量与样本质量有充分保证的前提下，能够准确、泛化地建立多维数据与地物类别间的映射关系，从而对复杂精细的地面场景进行高精度的地物识别.但相对于计算机视觉研究中大量应用的常见图像，遥感影像随光照、时间、季节等因素的变化较为巨大，难以使用常规样本库，致使这类方法难以落地实用，难以完全胜任各种各样条件下的高分辨率遥感影像分割任务^[30]. ...

一种基于对抗学习的高分辨率遥感影像语义分割无监督域自适应方法

1

2024

... 经过多年研究，高分辨率遥感影像分割方法在充足样本条件下已经能够对典型、完整的地物区块进行高精度划分，为各种应用提供准确的地物分布参考.然而，高分辨率遥感影像地物繁复无规律，且地面场景易受多种因素影响而变化较大，不但非监督分析难以解析复杂地物，监督学习也难以建立可靠、通用的样本库.因此，在面对缺乏样本和存在大量干扰信息的复杂地面场景时，单纯依赖非监督分析和监督学习可能难以从影像中抽取出可信、准确的地物语义信息.尽管现有研究通过半监督学习（如伪标签技术）^[31]、自监督学习（如对比学习框架）及混合方法（如协同训练）等类自学习分割方法，尝试缓解样本依赖问题，但这些方法仍面临伪标签噪声累积、模型复杂度高或跨场景适应性不足等挑战.为此，迫切需要探索一种具备自学习能力的分割方法，以克服非监督分析在认知性能上的局限性和监督学习对样本的过度依赖. ...

一种基于对抗学习的高分辨率遥感影像语义分割无监督域自适应方法

1

2024

... 经过多年研究，高分辨率遥感影像分割方法在充足样本条件下已经能够对典型、完整的地物区块进行高精度划分，为各种应用提供准确的地物分布参考.然而，高分辨率遥感影像地物繁复无规律，且地面场景易受多种因素影响而变化较大，不但非监督分析难以解析复杂地物，监督学习也难以建立可靠、通用的样本库.因此，在面对缺乏样本和存在大量干扰信息的复杂地面场景时，单纯依赖非监督分析和监督学习可能难以从影像中抽取出可信、准确的地物语义信息.尽管现有研究通过半监督学习（如伪标签技术）^[31]、自监督学习（如对比学习框架）及混合方法（如协同训练）等类自学习分割方法，尝试缓解样本依赖问题，但这些方法仍面临伪标签噪声累积、模型复杂度高或跨场景适应性不足等挑战.为此，迫切需要探索一种具备自学习能力的分割方法，以克服非监督分析在认知性能上的局限性和监督学习对样本的过度依赖. ...

Bottom-up and top-down attention:Different processes and overlapping neural systems

1

2014

... 人眼的双驱动注意模式能够筛选观测场景的内容，减少待处理信息的复杂度，从而对不同目标实施不同权重的观察，快速、灵活地对场景观察与反馈.这种双驱动注意机制通常以自底向上（bottom-up）的数据驱动方式来快速、模糊地解读低空间频率的场景，并通过自顶向下（top-down）的任务驱动来精细、准确地观察高空间频率或运动的目标^[32].这种机制能有效地利用数据和任务之间的互补性，达成更高效、准确的场景理解. ...

Anterior dorsal attention network tau drives visual attention deficits in posterior cortical atrophy

1

2023

... 其中，自底向上的数据驱动由外界场景刺激视觉系统，通过光谱、明暗、纹理等特征^[33] 对整个场景进行快速感知与理解，这种初步解读过程为后续任务驱动提供基础.在此之上，自顶向下的任务驱动会结合先验知识，从方向、形状、熵等复杂特征^[34]出发，调动眼球等视神经功能对感兴趣区域进行深入聚焦. ...

Context-aware saliency detection

1

2012

... 其中，自底向上的数据驱动由外界场景刺激视觉系统，通过光谱、明暗、纹理等特征^[33] 对整个场景进行快速感知与理解，这种初步解读过程为后续任务驱动提供基础.在此之上，自顶向下的任务驱动会结合先验知识，从方向、形状、熵等复杂特征^[34]出发，调动眼球等视神经功能对感兴趣区域进行深入聚焦. ...

傅里叶变换通道注意力网络的胆管癌高光谱图像分割

1

2021

... 双驱动注意机制细致的观察能力已在图像分析领域得到广泛应用，尤其在场景的精细解读工作中展现出显著优势^[35-36].通过动态分配观察权重，该机制既能保证对图像关键信息的优先获取，又能维持整体场景的快速反馈，体现了生物视觉系统在信息处理中的智能优化策略. ...

傅里叶变换通道注意力网络的胆管癌高光谱图像分割

1

2021

... 双驱动注意机制细致的观察能力已在图像分析领域得到广泛应用，尤其在场景的精细解读工作中展现出显著优势^[35-36].通过动态分配观察权重，该机制既能保证对图像关键信息的优先获取，又能维持整体场景的快速反馈，体现了生物视觉系统在信息处理中的智能优化策略. ...

Self-attention feature fusion network for semantic segmentation

1

2021

... 双驱动注意机制细致的观察能力已在图像分析领域得到广泛应用，尤其在场景的精细解读工作中展现出显著优势^[35-36].通过动态分配观察权重，该机制既能保证对图像关键信息的优先获取，又能维持整体场景的快速反馈，体现了生物视觉系统在信息处理中的智能优化策略. ...

1

2016

... 关于视觉的颜色拮抗感知能力的认知目前已形成共识，该认知特性描述了视网膜中结构不同的光电转换神经元细胞具有不同的光信号感知性能，即视网膜中视杆细胞与视锥细胞有不同的光敏感性^[37].其中，视杆细胞对光线强弱较为敏感，能够解析光的强度，但对光谱的分辨能力较弱；而视锥细胞对光的波段较为敏感.经Marks等^[38]研究发现，人类视锥细胞最为敏感3种光的波长分别为564 nm，533 nm和437 nm，分别接近黄、绿和紫.同时，配合外膝体及视觉皮层的光谱处理神经元细胞，形成了对光谱与颜色的生理认知能力，模拟此视觉特性可用于影像的光谱校正. ...

1

2016

... 关于视觉的颜色拮抗感知能力的认知目前已形成共识，该认知特性描述了视网膜中结构不同的光电转换神经元细胞具有不同的光信号感知性能，即视网膜中视杆细胞与视锥细胞有不同的光敏感性^[37].其中，视杆细胞对光线强弱较为敏感，能够解析光的强度，但对光谱的分辨能力较弱；而视锥细胞对光的波段较为敏感.经Marks等^[38]研究发现，人类视锥细胞最为敏感3种光的波长分别为564 nm，533 nm和437 nm，分别接近黄、绿和紫.同时，配合外膝体及视觉皮层的光谱处理神经元细胞，形成了对光谱与颜色的生理认知能力，模拟此视觉特性可用于影像的光谱校正. ...

Visual pigments of single primate cones

1

1964

... 关于视觉的颜色拮抗感知能力的认知目前已形成共识，该认知特性描述了视网膜中结构不同的光电转换神经元细胞具有不同的光信号感知性能，即视网膜中视杆细胞与视锥细胞有不同的光敏感性^[37].其中，视杆细胞对光线强弱较为敏感，能够解析光的强度，但对光谱的分辨能力较弱；而视锥细胞对光的波段较为敏感.经Marks等^[38]研究发现，人类视锥细胞最为敏感3种光的波长分别为564 nm，533 nm和437 nm，分别接近黄、绿和紫.同时，配合外膝体及视觉皮层的光谱处理神经元细胞，形成了对光谱与颜色的生理认知能力，模拟此视觉特性可用于影像的光谱校正. ...

Role of the extensive area outside the x-cell receptive field in brightness information transmission

1

1991

... 随着生物神经信息学的研究不断深入，Li等^[39]发现视觉神经元感受野外部存在一个能够对经典感受野进行调制、响应的大外周区域，称为非经典感受野（non-classical receptive field，NCRF），可以通过三高斯模型来模拟NCRF对经典感受野的调制特性，其数学表达式为： ...

Contour detection based on nonclassical receptive field inhibition

1

2003

... 在此基础上，Grigorescu等^[40]采用二维Gabor函数表征视皮层感知轮廓的方向选择性，配合高斯差分（difference of Gaussian，DoG）函数及高斯拉普拉斯（Laplacian of a Gaussian，LoG）函数模拟外周环绕的侧抑制作用，构建了模拟NCRF各向同性和各向异性的轮廓认知模型，实现了对遥感影像较好的边缘特征认知.其数学表达式为： ...

数字脉冲压缩技术在雷达中的应用

1

2009

... 瑞利判据（Rayleigh criterion）作为分析光学成像系统分辨相邻光斑（爱里斑）的指标，指出了当爱里斑的中心与相邻爱里斑的第一级暗环重合时，视觉成像系统刚好能分辨出2个爱里斑.并根据宋晓风^[41]的研究，在瑞利判据中，爱里斑第一级暗环的亮度为爱里斑最大亮度的73.5%.受此启发，可以采用迈克尔逊对比度^[42]推导人眼视觉明暗感知的对比度阈值，公式为： ...

数字脉冲压缩技术在雷达中的应用

1

2009

... 瑞利判据（Rayleigh criterion）作为分析光学成像系统分辨相邻光斑（爱里斑）的指标，指出了当爱里斑的中心与相邻爱里斑的第一级暗环重合时，视觉成像系统刚好能分辨出2个爱里斑.并根据宋晓风^[41]的研究，在瑞利判据中，爱里斑第一级暗环的亮度为爱里斑最大亮度的73.5%.受此启发，可以采用迈克尔逊对比度^[42]推导人眼视觉明暗感知的对比度阈值，公式为： ...

1

1995

... 瑞利判据（Rayleigh criterion）作为分析光学成像系统分辨相邻光斑（爱里斑）的指标，指出了当爱里斑的中心与相邻爱里斑的第一级暗环重合时，视觉成像系统刚好能分辨出2个爱里斑.并根据宋晓风^[41]的研究，在瑞利判据中，爱里斑第一级暗环的亮度为爱里斑最大亮度的73.5%.受此启发，可以采用迈克尔逊对比度^[42]推导人眼视觉明暗感知的对比度阈值，公式为： ...

Image quality assessment based on a degradation model

1

2000

... 式中：C为视觉的明暗对比度阈值，为15.27%；I_max为爱里斑亮度最大值；I_min为爱里斑亮度最小值.在此基础上，参考基于瑞利明暗判据的迈克尔逊对比度阈值，可以模拟视觉感知的明暗认知能力，解析场景与影像的光强和光谱^[43-44]，运用于影像地物的聚类. ...

Preliminary analytical method for unsupervised remote sensing image classification based on visual perception and a force field

1

2018

... 式中：C为视觉的明暗对比度阈值，为15.27%；I_max为爱里斑亮度最大值；I_min为爱里斑亮度最小值.在此基础上，参考基于瑞利明暗判据的迈克尔逊对比度阈值，可以模拟视觉感知的明暗认知能力，解析场景与影像的光强和光谱^[43-44]，运用于影像地物的聚类. ...

Receptive fields of single neurones in the cat’s striate cortex

1

1959

... 神经信息学的研究^[45-48]发现：大脑视皮层可按照其复杂程度被划分为多个区域，然后按照从简单到复杂的顺序，在复杂场景中分解出多个层次的单项元素，从而高效、多层次地解读视觉信号并理解视觉场景.受该视觉特性的启发，已有大量研究以多尺度方法或多分辨率算法模拟视觉的等级层次认知特征，对图像多方面特征进行不同层次的解析与综合，取得了良好的效果^[49-51]，为本文轻量神经网络的层次化特征提取提供生物启示. ...

Receptive fields and functional architecture of monkey striate cortex

0

1968

The period of susceptibility to the physiological effects of unilateral eye closure in kittens

0

1970

Functional architecture of macaque monkey visual cortex

1

1977

... 神经信息学的研究^[45-48]发现：大脑视皮层可按照其复杂程度被划分为多个区域，然后按照从简单到复杂的顺序，在复杂场景中分解出多个层次的单项元素，从而高效、多层次地解读视觉信号并理解视觉场景.受该视觉特性的启发，已有大量研究以多尺度方法或多分辨率算法模拟视觉的等级层次认知特征，对图像多方面特征进行不同层次的解析与综合，取得了良好的效果^[49-51]，为本文轻量神经网络的层次化特征提取提供生物启示. ...

结合层次化搜索与视觉残差网络的光学舰船目标检测方法

1

2021

... 神经信息学的研究^[45-48]发现：大脑视皮层可按照其复杂程度被划分为多个区域，然后按照从简单到复杂的顺序，在复杂场景中分解出多个层次的单项元素，从而高效、多层次地解读视觉信号并理解视觉场景.受该视觉特性的启发，已有大量研究以多尺度方法或多分辨率算法模拟视觉的等级层次认知特征，对图像多方面特征进行不同层次的解析与综合，取得了良好的效果^[49-51]，为本文轻量神经网络的层次化特征提取提供生物启示. ...

结合层次化搜索与视觉残差网络的光学舰船目标检测方法

1

2021

... 神经信息学的研究^[45-48]发现：大脑视皮层可按照其复杂程度被划分为多个区域，然后按照从简单到复杂的顺序，在复杂场景中分解出多个层次的单项元素，从而高效、多层次地解读视觉信号并理解视觉场景.受该视觉特性的启发，已有大量研究以多尺度方法或多分辨率算法模拟视觉的等级层次认知特征，对图像多方面特征进行不同层次的解析与综合，取得了良好的效果^[49-51]，为本文轻量神经网络的层次化特征提取提供生物启示. ...

视觉感受与Markov随机场相结合的高分辨率遥感影像分割法

0

2015

视觉感受与Markov随机场相结合的高分辨率遥感影像分割法

0

2015

MsVRL:Self-supervised multiscale visual representation learning via cross-level consistency for medical image segmentation

1

2023

... 神经信息学的研究^[45-48]发现：大脑视皮层可按照其复杂程度被划分为多个区域，然后按照从简单到复杂的顺序，在复杂场景中分解出多个层次的单项元素，从而高效、多层次地解读视觉信号并理解视觉场景.受该视觉特性的启发，已有大量研究以多尺度方法或多分辨率算法模拟视觉的等级层次认知特征，对图像多方面特征进行不同层次的解析与综合，取得了良好的效果^[49-51]，为本文轻量神经网络的层次化特征提取提供生物启示. ...

Visual perception and saccadic eye movements

1

2011

... 眼球底部的视网膜，主要依赖小面积的中央凹视锥细胞，与双极细胞及其之后的神经节细胞进行“一对一”的信息传输，获取分辨度和清晰度都较高的清晰视野^[52-53]，并通过分布在偏离中央凹的外周区视杆细胞，与双极细胞及其之后的神经节细胞进行“多对一”形式的信息传输，形成分辨率与清晰度都较低的模糊视觉^[53]. ...

A review of interactions between peripheral and foveal vision

3

2020

... 眼球底部的视网膜，主要依赖小面积的中央凹视锥细胞，与双极细胞及其之后的神经节细胞进行“一对一”的信息传输，获取分辨度和清晰度都较高的清晰视野^[52-53]，并通过分布在偏离中央凹的外周区视杆细胞，与双极细胞及其之后的神经节细胞进行“多对一”形式的信息传输，形成分辨率与清晰度都较低的模糊视觉^[53]. ...

... [53]. ...

... 在眼球只有中央凹能够清晰成像的情况下，视神经通过微颤动来不停地转动眼球，从而转动中央凹获取大范围场景的清晰视野^[54-55].同时利用外周区模糊视觉进行场景概略初步认知，为细致的场景认知提供背景信息.而中央凹的视锥细胞则在此基础上，对场景中的边缘、纹理、色彩等细节特征进行深入细致的观察，从而形成清晰视野，完成场景认知^[53].经神经信息学研究发现，视觉始终保持着快速、连续且无意识的微颤动，从而对场景进行清晰、连续不断地认知^[55-56].模拟这种协同机制，可以修复图像像素的分割错误. ...

Miniature eye movements enhance fine spatial detail

1

2007

... 在眼球只有中央凹能够清晰成像的情况下，视神经通过微颤动来不停地转动眼球，从而转动中央凹获取大范围场景的清晰视野^[54-55].同时利用外周区模糊视觉进行场景概略初步认知，为细致的场景认知提供背景信息.而中央凹的视锥细胞则在此基础上，对场景中的边缘、纹理、色彩等细节特征进行深入细致的观察，从而形成清晰视野，完成场景认知^[53].经神经信息学研究发现，视觉始终保持着快速、连续且无意识的微颤动，从而对场景进行清晰、连续不断地认知^[55-56].模拟这种协同机制，可以修复图像像素的分割错误. ...

Microsaccadic efficacy and contribution to foveal and peripheral vision

2

2012

... 在眼球只有中央凹能够清晰成像的情况下，视神经通过微颤动来不停地转动眼球，从而转动中央凹获取大范围场景的清晰视野^[54-55].同时利用外周区模糊视觉进行场景概略初步认知，为细致的场景认知提供背景信息.而中央凹的视锥细胞则在此基础上，对场景中的边缘、纹理、色彩等细节特征进行深入细致的观察，从而形成清晰视野，完成场景认知^[53].经神经信息学研究发现，视觉始终保持着快速、连续且无意识的微颤动，从而对场景进行清晰、连续不断地认知^[55-56].模拟这种协同机制，可以修复图像像素的分割错误. ...

... [55-56].模拟这种协同机制，可以修复图像像素的分割错误. ...

The impact of microsaccades on vision:Towards a unified theory of saccadic function

1

2013

... 在眼球只有中央凹能够清晰成像的情况下，视神经通过微颤动来不停地转动眼球，从而转动中央凹获取大范围场景的清晰视野^[54-55].同时利用外周区模糊视觉进行场景概略初步认知，为细致的场景认知提供背景信息.而中央凹的视锥细胞则在此基础上，对场景中的边缘、纹理、色彩等细节特征进行深入细致的观察，从而形成清晰视野，完成场景认知^[53].经神经信息学研究发现，视觉始终保持着快速、连续且无意识的微颤动，从而对场景进行清晰、连续不断地认知^[55-56].模拟这种协同机制，可以修复图像像素的分割错误. ...

改进的CIELAB均匀颜色空间

1

2022

... 参考已探明的视杆细胞解析光强、视锥细胞解析波段的视觉颜色拮抗理论，将影像中的地物光谱由成像时常用的RGB颜色空间，转换到目前已广泛使用的CIE-Lab颜色模型^[57]，以“L”通道描述光强明度，以“a”通道描述从红色到深绿的光谱，以“b”通道描述从蓝色到黄色的光谱^[58]，从而对光谱范围进行更加全面的表达.并且CIE-Lab颜色模型还能够在不同照明和观察条件下，最大程度地令任意2种颜色刺激的感知差异和数值计算出的色差保持一致^[59].这种与光线及设备无关的颜色表征性能，能够帮助地物光谱的量化数值贴近人眼视觉感受，为地物光谱特征的认知提供基础保障，能够有效提高分割算法的认知性能与分割精度.具体来说，先将RGB过渡至CIE-XYZ空间，再转换到CIE-Lab空间，其转换关系表达式为： ...

改进的CIELAB均匀颜色空间

1

2022

... 参考已探明的视杆细胞解析光强、视锥细胞解析波段的视觉颜色拮抗理论，将影像中的地物光谱由成像时常用的RGB颜色空间，转换到目前已广泛使用的CIE-Lab颜色模型^[57]，以“L”通道描述光强明度，以“a”通道描述从红色到深绿的光谱，以“b”通道描述从蓝色到黄色的光谱^[58]，从而对光谱范围进行更加全面的表达.并且CIE-Lab颜色模型还能够在不同照明和观察条件下，最大程度地令任意2种颜色刺激的感知差异和数值计算出的色差保持一致^[59].这种与光线及设备无关的颜色表征性能，能够帮助地物光谱的量化数值贴近人眼视觉感受，为地物光谱特征的认知提供基础保障，能够有效提高分割算法的认知性能与分割精度.具体来说，先将RGB过渡至CIE-XYZ空间，再转换到CIE-Lab空间，其转换关系表达式为： ...

微胶囊叶黄素吸收光谱及色调的影响因素研究

1

2013

... 参考已探明的视杆细胞解析光强、视锥细胞解析波段的视觉颜色拮抗理论，将影像中的地物光谱由成像时常用的RGB颜色空间，转换到目前已广泛使用的CIE-Lab颜色模型^[57]，以“L”通道描述光强明度，以“a”通道描述从红色到深绿的光谱，以“b”通道描述从蓝色到黄色的光谱^[58]，从而对光谱范围进行更加全面的表达.并且CIE-Lab颜色模型还能够在不同照明和观察条件下，最大程度地令任意2种颜色刺激的感知差异和数值计算出的色差保持一致^[59].这种与光线及设备无关的颜色表征性能，能够帮助地物光谱的量化数值贴近人眼视觉感受，为地物光谱特征的认知提供基础保障，能够有效提高分割算法的认知性能与分割精度.具体来说，先将RGB过渡至CIE-XYZ空间，再转换到CIE-Lab空间，其转换关系表达式为： ...

微胶囊叶黄素吸收光谱及色调的影响因素研究

1

2013

... 参考已探明的视杆细胞解析光强、视锥细胞解析波段的视觉颜色拮抗理论，将影像中的地物光谱由成像时常用的RGB颜色空间，转换到目前已广泛使用的CIE-Lab颜色模型^[57]，以“L”通道描述光强明度，以“a”通道描述从红色到深绿的光谱，以“b”通道描述从蓝色到黄色的光谱^[58]，从而对光谱范围进行更加全面的表达.并且CIE-Lab颜色模型还能够在不同照明和观察条件下，最大程度地令任意2种颜色刺激的感知差异和数值计算出的色差保持一致^[59].这种与光线及设备无关的颜色表征性能，能够帮助地物光谱的量化数值贴近人眼视觉感受，为地物光谱特征的认知提供基础保障，能够有效提高分割算法的认知性能与分割精度.具体来说，先将RGB过渡至CIE-XYZ空间，再转换到CIE-Lab空间，其转换关系表达式为： ...

1

2016

... 参考已探明的视杆细胞解析光强、视锥细胞解析波段的视觉颜色拮抗理论，将影像中的地物光谱由成像时常用的RGB颜色空间，转换到目前已广泛使用的CIE-Lab颜色模型^[57]，以“L”通道描述光强明度，以“a”通道描述从红色到深绿的光谱，以“b”通道描述从蓝色到黄色的光谱^[58]，从而对光谱范围进行更加全面的表达.并且CIE-Lab颜色模型还能够在不同照明和观察条件下，最大程度地令任意2种颜色刺激的感知差异和数值计算出的色差保持一致^[59].这种与光线及设备无关的颜色表征性能，能够帮助地物光谱的量化数值贴近人眼视觉感受，为地物光谱特征的认知提供基础保障，能够有效提高分割算法的认知性能与分割精度.具体来说，先将RGB过渡至CIE-XYZ空间，再转换到CIE-Lab空间，其转换关系表达式为： ...

1

... 在场景感知过程中，视觉注意机制能够将中央凹视锥细胞对准感兴趣目标，从而形成注视现象，完成对感兴趣目标或区域的精细观察.由于能够提供灵活且强大的空间关系建模思路，这种注意机制目前被广泛应用于计算机视觉 Transformer神经网络当中^[60-62].与传统的CNN相比，Transformer中的注意力结构Self-Attention^[61]提供了分析不同卷积长度的能力，从而摆脱了一般卷积的局部限制，并通过动态权重的方法，保障不同特征之间的动态权重主要依赖于特征自身的特性，从而具备凸显典型特征的能力.本文结合CNN和Self-Attention注意力结构，形成一种全新的轻量神经网络结构，该结构通过自注意机制对特征权重进行再分配，使网络能够更加有效地关注图像中的重要区域. ...

4

... 在场景感知过程中，视觉注意机制能够将中央凹视锥细胞对准感兴趣目标，从而形成注视现象，完成对感兴趣目标或区域的精细观察.由于能够提供灵活且强大的空间关系建模思路，这种注意机制目前被广泛应用于计算机视觉 Transformer神经网络当中^[60-62].与传统的CNN相比，Transformer中的注意力结构Self-Attention^[61]提供了分析不同卷积长度的能力，从而摆脱了一般卷积的局部限制，并通过动态权重的方法，保障不同特征之间的动态权重主要依赖于特征自身的特性，从而具备凸显典型特征的能力.本文结合CNN和Self-Attention注意力结构，形成一种全新的轻量神经网络结构，该结构通过自注意机制对特征权重进行再分配，使网络能够更加有效地关注图像中的重要区域. ...

... 此外，参考Self-Attention结构发挥出的特征权重评价功能^[61]，在使用2个3×3卷积作为感受野的基础上，通过1×1卷积增加非线性特性，结合Softmax概率函数进行归一化，配合通道相乘的运算，可以架构一个轻量且有效的自注意特征权重再分配的网络结构，从而避开已有且复杂的变形结构与自注意结构，直接对挖掘出的特征进行权重评选，找出并凸显对地物识别有重要作用的特征，如图5所示. ...

... 同时，为了客观评价本文方法的地物认知性能与分割精度，选取同样带有注意力结构的神经网络，并嵌入本文提出的双通路分割思路以保持相同的实验条件，从而进行真实、公平的对比.具体来说，使用了已经非常成熟且广受好评的Mask R-CNN（MR）网络及清华大学近期发布的ScalableViT（SViT）网络^[61,72].其中，MR网络在经典Faster R-CNN^[73]目标识别网络中加入了基于Mask的注意力机制，能够在识别目标的基础上，通过Mask注意力机制找出目标的轮廓与边界，完成高精度分割，受到广泛好评^[72]；SViT网络则通过可伸缩自我注意在空间和通道维度进行上下文泛化，并结合一个交互式自注意结构，增强了期望的全局接受域，利用Transformer在单层以最显著的优势取得了高精度的分割性能^[61].此外，所有网络大致都设置在60层左右，卷积通道数不超过64，未知数个数限制为30万左右，学习率统一选在为0.005，即可形成足够的地物认知能力以进行实验比对. ...

... [61].此外，所有网络大致都设置在60层左右，卷积通道数不超过64，未知数个数限制为30万左右，学习率统一选在为0.005，即可形成足够的地物认知能力以进行实验比对. ...

基于CNN与SETR的特征融合滑坡体检测

1

2024

... 在场景感知过程中，视觉注意机制能够将中央凹视锥细胞对准感兴趣目标，从而形成注视现象，完成对感兴趣目标或区域的精细观察.由于能够提供灵活且强大的空间关系建模思路，这种注意机制目前被广泛应用于计算机视觉 Transformer神经网络当中^[60-62].与传统的CNN相比，Transformer中的注意力结构Self-Attention^[61]提供了分析不同卷积长度的能力，从而摆脱了一般卷积的局部限制，并通过动态权重的方法，保障不同特征之间的动态权重主要依赖于特征自身的特性，从而具备凸显典型特征的能力.本文结合CNN和Self-Attention注意力结构，形成一种全新的轻量神经网络结构，该结构通过自注意机制对特征权重进行再分配，使网络能够更加有效地关注图像中的重要区域. ...

基于CNN与SETR的特征融合滑坡体检测

1

2024

... 在场景感知过程中，视觉注意机制能够将中央凹视锥细胞对准感兴趣目标，从而形成注视现象，完成对感兴趣目标或区域的精细观察.由于能够提供灵活且强大的空间关系建模思路，这种注意机制目前被广泛应用于计算机视觉 Transformer神经网络当中^[60-62].与传统的CNN相比，Transformer中的注意力结构Self-Attention^[61]提供了分析不同卷积长度的能力，从而摆脱了一般卷积的局部限制，并通过动态权重的方法，保障不同特征之间的动态权重主要依赖于特征自身的特性，从而具备凸显典型特征的能力.本文结合CNN和Self-Attention注意力结构，形成一种全新的轻量神经网络结构，该结构通过自注意机制对特征权重进行再分配，使网络能够更加有效地关注图像中的重要区域. ...

基于改进U-Net网络的花岗伟晶岩信息提取方法

1

2024