基于多源海量国产卫星影像智能优选实现
郑雄伟1, 魏英娟1, 李春英1, 雷兵2, 甘宇航2
1.中国国土资源航空物探遥感中心,北京 100083
2.国家测绘地理信息局卫星测绘应用中心,北京 100048

第一作者: 郑雄伟(1981-),男,学士,高级工程师,主要从事卫星遥感、航空遥感方法技术研究与应用等工作。Email:zheng_xiongwei@163.com

摘要

针对海量国产卫星数据使用过程中优质数据筛选困难且费时费力的问题,设计并实现自动化优质数据筛选。构建基于资源一号02C、高分一号、高分二号等多源国产卫星影像智能优选模型,将卫星及传感器类型、空间范围、时相、空间分辨率和空间分析方法等各项指标要求抽象为数学模型,完成异构元数据的高效集成与管理,制定遥感影像评价指标体系和评价模型,面向用户的定制化需求,通过自适应优选规则和自主性权重设置,运用典型运筹学方法进行定量分析,实现目标区域的卫星影像自动最优化覆盖。实验结果表明,自动优选与人工精选的结果重合率在85%以上,执行效率提高了10倍以上,验证了自动优选方法的正确性和高效性。

关键词: 多源海量; 国产卫星数据; 优质数据自动筛选; 影像智能优选
文献标志码:A 文章编号:1001-070X(2017)s1-0013-08 doi: 10.6046/gtzyyg.2017.s1.03
The realization of intelligent optimization based on multi-source and massive domestic satellite image
ZHENG Xiongwei1, WEI Yingjuan1, LI Chunying1, LEI Bing2, GAN Yuhang2
1. China Areo Geophysical Survey and Remote Sensing Center for Land and Resources, Beijing 100083, China
2. Satellite Surveying and Mapping Application Center, NASG, Beijing 100048, China
Abstract

In view of the difficulty and time-consuming problem of high quality data filtering in the utilization of massive domestic satellite image data, the authors designed and realized automatic high quality data filtering. The intelligent optimization model of domestic satellite image was constructed based on ZY1-02C,GF-1, GF-2. The requirements of satellite and sensor type, space range, time, spatial resolution and spatial analysis method were abstracted into mathematical model to complete the efficient integration and management of heterogeneous metadata. The evaluation index system and evaluation model of remote sensing image were developed, and the customization requirements of users were set up. By means of adaptive preference rules and autonomous weight setting, the typical operational research methods were used to quantitatively analyze the satellite images so as to optimize the coverage of satellite images. The experimental results show that the coincidence rate of automatic selection and artificial selection is higher than 85%, and the efficiency of implementation is improved by more than 10 times, which verifies the correctness and efficiency of the automatic optimization method.

Keyword: multi - source and massive; domestic satellite image data; high quality data automatic filtering; intelligent optimization of image
0 前言

随着国产卫星传感器类型及数据量的级数增长, 国产卫星数据需求的与日俱增, 遥感影像作为时效性要求高、数据量大的一种数据类型, 势必对数据查询检索提出很高的要求。由于海量遥感数据的筛选过程较为复杂、主观性强、不确定性强, 目前市面上尚未形成较为成熟的数据筛选软件和相关研究成果。以国土资源部作为主用户的资源一号02C(ZY1-02C)、高分一号(GF-1)和高分二号(GF-2)3颗在轨运行卫星, 基于系统查询检索、而后人工目视筛选优质数据的方法已经无法适应当前多种传感器类型的需要、多景数、多需求、高时效的优质数据查询检索挑选。因此, 根据业务需要, 开发满足自身需求的算法, 突破多源海量影像智能优选关键技术, 实现多源海量国产卫星数据的自适应智能优选, 可大大提高国产卫星数据检索、处理及分发效率。

在海量遥感数据中筛选出指定区域、指定时段、质量最优、符合当前任务需求的数据, 具有数据量庞大、复杂度高、不确定性强等特征。针对数据量庞大的问题, 本文方法采用基于元数据分析取代传统的基于实体数据分析的方法, 将实体数据的基本信息和影像质量信息与元数据绑定, 所有的优选分析都通过元数据分析来完成, 大大减少了数据量; 针对复杂度高的问题, 本文将遥感数据评价指标要素抽象为数学模型, 通过构建评价模型, 对所有数据进行定量的评价打分, 将传统人工筛选过程中关注的主观因素抽象为定量化的指标要素和评价规则, 减少主观性带来的误差; 针对不确定性强的问题, 本文面向不同需求制定自适应规则, 如覆盖最全、质量最佳、时相最新、成本最低等规则, 来筛选出最适用于当前任务的最佳数据集。

1 技术流程

构建多源国产遥感影像(ZY1-02C, GF-1和GF-2)智能优选模型, 将遥感影像数据源(卫星类型和传感器类型)、空间范围需求、时相需求、空间分辨率需求和空间分析方法等抽象为数学模型, 完成异构元数据的高效集成与管理, 制定遥感影像评价指标体系和评价模型, 面向用户的定制化需求, 通过自适应优选规则和自主性权重设置, 运用典型运筹学方法进行定量分析, 实现影像的自适应智能优选, 实现目标区域的最优化影像覆盖。

图1 多源海量国产卫星影像智能优选技术流程图Fig.1 Multi - source and massive satellite image intelligent optimization technology flow

2 技术方法
2.1 多源遥感影像评价模型与方法

2.1.1 遥感影像评价指标体系构建

建立评价指标体系: ①确定评价目标, 本文的评价对象是多源国产遥感影像, 目标是优选出目标区域的最优影像集合; ②分解评价对象, 把所要评价的综合属性分解成小的、具体的评价要素; ③建立指标集, 收集与评价要素有关的指标, 并构成多个指标集; ④确定指标与评价要素的关系, 即确定各项指标反映哪些评价要素; ⑤确定最优指标集。

根据以上构建程序, 对评价目标和评价对象开展分析, 并对评价对象的综合属性进行分解, 明确具体评价指标。评价对象的综合属性分为影像筛选指标和影像优选指标, 影像筛选指标为布尔型, 即该类指标的值为“ 是” 或者“ 否” , 满足则为有效数据, 不满足则为无效数据; 影像优选指标是根据权重的不同, 通过优选目标函数参与加权计算, 最终按得分高低对所参选的影像进行排序, 根据需要选出分值高的影像集合。影像筛选指标见表1

表1 影像筛选指标信息及设置示例 Tab.1 Image filtering indicator information and setting example

以上4个指标为一级指标, 包括卫星类型、获取时间、云覆盖比例和有效面积, 4个指标的权重之和为1, 其中卫星类型指标下分设了二级指标, 即各颗卫星的权重, 可根据该卫星的分辨率、时效性等特征进行自主性赋值。针对用户需求制定一个影像优劣评定方案, 包含卫星类型分值及权重, 时间、云量、有效面积等因子的权重等。

2.1.2 遥感影像评价模型构建

影像优劣的评价是一个相对的概念, 通过加权平均法建立多因素— 单一综合评价指标体系可避免不利因素的影响, 同时该指标体系能够比较全面地涵盖影像优劣的影响因素, 通过融合各因素得到一个定量的综合评价指标值, 以该指标对所有的影像进行排序, 即可对影像优劣进行定量评价。

根据加权平均法建立多源遥感影像多因素— 单一综合评价指标体系, 其基本模型为

rj= j=1ncijWij , (1)

式中: rj为第j张影像的综合评价指标值; cij为第j张影像的第i个影响因子的评价分值; wij为第j张影像的第i个影响因子的权重值, 其中wij∈ (0, 1); n为影像因子的数目。

对于本文而言, 影像优劣评价的基本模型为

rj=cjwcj+gjwgj+yjwyj+ejwej , (2)

式中: rj为第j张影像的综合评价指标值; cj为第j张影像的影像类型分值; wcj为第j张影像的卫星类型因子的权重值; gj为第j张影像的获取时间分值; wgj为第j张影像的获取时间因子的权重值; yj为第j张影像的云盖面积分值; wyj为第j张影像的云盖面积因子的权重值; ej为第j张影像的有效面积分值; wej为第j张影像的有效面积的权重值; 其中, wcj, wgj, wyj, wej∈ (0, 1); 且wcj+wgj+wyj+wej=1。

2.1.3 确定评价指标的分值

在多源遥感影像优劣评价指标中有很多可定量的指标值。例如影像空间分辨率、影像云量大小、影像获取时相、影像有效面积等均为定量指标值。这些指标值不仅量纲不同, 而且数量级也不同, 如果不进行处理, 这些指标不具可比性。

本文通过对各指标数据进行无量纲化处理, 使各个不同量纲指标具有可比性。具体方法是将实测指标值转化为0~100间的分值, 方法如下:

以各指标的理想状态为最优状态, 以影像获取时相为例, 当影像获取时相为任务最需要的时期(如4— 6月), 则影像获取时相因子的权重则最高, 随着影像获取时相离需求时期越远, 权重则越低。把实际影响因子分值与最优值进行对比, 通过一定方式, 把实际值转化为评价值, 再经过综合评价得各项的综合评价值。釆用的无量纲化函数为

f(x)= 100       xminxxmax100-10(x-xmax), xmaxx100-10(xmin-x)xxmin, (3)

式中xmaxxmin分别为容许的最大值和最小值, 在该范围内的为最优值, 超出该范围的将随着距离越远分值越低。该函数可用图2表示。

图2 线性无量纲化模型Fig.2 Linear dimensionless model

当指标实际值偏离最优值达到某种程度后, 该指标可认为处于危险状态, 其值称为评价时的临界值, 超过临界值的部分其评价分数为0。不考虑实际值对评价总体状态的影响差异性, 假定各实际值的极限偏离程度是相同的。据此认为各实际值小于最优值相同的比例和超过最优值相同的比例时, 对影像优劣的影响是相同的, 其评价值相等。

本文中的卫星类型指标分值采用用户可控的操作方式, 在程序运行过程中, 可以根据监测任务的不同需求, 结合各颗卫星不同的传感器特点, 自主、灵活的设置不同的分值, 以此来提高评价模型的可操控性和适应性。

2.2 多源海量遥感影像空间覆盖算法

2.2.1 影像填充算法

首先根据设定的时间范围、空间范围、云量范围等初级条件筛选出符合初级条件的影像, 然后利用优劣评价模型计算所有符合初级条件的影像的综合得分, 按照综合得分从高到低对筛选出的影像进行排序, 并利用优选出的影像去填充目标区域, 直至目标区域被完全覆盖, 或优选出的影像被全部使用完, 如图3所示。

图3 利用优选结果覆盖目标区域示意图Fig.3 The target area is covered with the preferred result

在填充目标区域时, 本文设计了2种不同的填充方法, 分别为常规填充算法和蝉食填充算法, 二者各有优缺点, 可根据任务需要选择相适应的算法。

1)常规填充算法。以影像为驱动, 即将优选出的影像按照综合评分从高到低进行排序, 然后按照顺序从最前面的影像开始, 利用它的有效面积去填充目标区域, 直到目标区域被全部覆盖, 或者优选结果中的影像已经全部使用完毕为止。其算法思想如图4所示。

图4 常规填充算法的设计思想Fig.4 The design of conventional coverage

2)蝉食填充算法。以目标区域为驱动, 即以目标区域的某个位置为起点, 将优选出的影像按照综合评分从高到低进行排序, 在影像优选结果列表中, 从上往下搜索满足该空间位置要求的影像, 对目标区域进行填充, 然后将位置移动到周边区域, 继续搜索满足要求的影像进行填充, 以此方式向周边扩展, 直到整个目标区域被全部覆盖, 或者优选结果中的影像被全部使用完毕。其算法思想如图5所示, 影像填充顺序为4-2-1-3-5。

图5 蝉食填充算法的设计思想Fig.5 Cicadas covering algorithm

2.2.2 有效面积原则

一张影像的有效覆盖范围等于该影像的覆盖范围减去无效覆盖范围, 而无效覆盖范围由两部分组成, 一是被云雪雾遮盖的区域, 二是在目标区域中已经被有效覆盖过的区域如图6所示, 影像4的红色区域为云雪雾覆盖的无效区域, 蓝色区域为目标区域中已经被影像2有效覆盖过的区域, 因此蓝色区域也是无效区域, 减去红色区域和蓝色区域, 剩余的黄色区域即为影像4的有效面积。

图6 有效面积原则示意图Fig.6 Effective area principle illustration

2.2.3 有云影像候补填充

经过影像填充这一步后, 如果目标区域被优选出的影像覆盖的有效面积完全覆盖一遍, 则此次覆盖任务完成。若优选出的影像全部使用完, 目标区域仍有未被覆盖的区域(图7中的黑色区域), 则退而求其次, 寻求候补的有云影像对未覆盖区域进行填充。通过选用云量占比在40%以下影像的有效面积, 以目标区域中未被覆盖的区域为驱动, 搜寻该空间范围满足条件的有云影像进行填充, 直至未覆盖区域被完全覆盖, 或者有云影像被全部利用为止。

图7 有云影像候补填充示意图Fig.7 Cloud image alternate fill illustration

2.2.4 可视化窗口叠加顺序

软件的图形可视化窗口提供对所有参与填充的影像进行图形可视化展示, 其叠加顺序为: 候补填充的有云影像叠加于最底层, 然后将优选出的影像按照综合得分由低到高的顺序, 得分低的叠于下层, 得分高的叠于上层, 直到所有参与填充的影像全部叠加完成。

2.3 面向定制化需求的自适应智能优选方法

面向定制化需求的自适应智能优选技术流程见图8。

图8 面向定制化需求的自适应智能优选技术流程Fig.8 Adaptive intelligent optimization technology process oriented to customized needs

1)定制化用户需求。影像数据需求可以是具体的, 也可以是抽象的, 可以是常规通用的。抽象的需求需要专业技术人员对用户需求进行解析, 然后明确影像数据的各类要求。

2)用户需求解析。需求解析的主要目标就是将抽象需求和定制化需求转化成软件能够执行的具体参数, 针对常规通用需求(如时间及空间分辨率等各方面都明确的需求), 则直接转换成可执行参数, 然而针对一些抽象的、定制化的需求, 则需要利用专业知识, 结合经验, 分析出满足该需求的具体参数。

3)影像自主筛选。根据需求解析结果, 从多个方面对数据库中的影像进行过滤, 主要包括影像过滤, 空间过滤和属性过滤。影像过滤是指将不满足要求的影像类型和影像传感器类型过滤掉, 主要包括卫星类型、传感器类型、完整性匹配3个参数(图9)。空间过滤是指任务区的空间需求范围, 本项目支持用户的空间需求可以多种形式提出, 包括按经纬度区域、按行政区范围和按图层选择要素3种。属性过滤主要是对影像的云量和影像的获取时间两个属性进行过滤。

图9 影像过滤界面Fig.9 Image filtering interface

4)自适应覆盖规则。自适应覆盖规则是指在解析用户需求的基础上, 判断用户看重的因素是哪一类或哪几类, 如果看重任务区的空间覆盖必须完整, 则选取“ 覆盖最全” 规则; 如果看重任务区影像的质量, 包括卫星类型、传感器类型、空间分辨率、影像清晰度等因素, 则选取“ 质量最佳” 规则; 如果看重影像数据的时相需求, 如只需要某个时段的数据, 或者需要时效性最强、时相最新的影像数据, 则选取“ 时相最优” 规则; 如果看重数据的成本, 需要在尽量减少成本的基础上, 选取满足要求的数据, 则选取“ 成本最低” 规则。以上几种规则为常用规则, 但不是所有规则, 可根据用户的不同需求提出各式各样的自适应覆盖规则。

5)自主性参数设定。参与评价的定量指标有卫星类型、获取时间、云盖比例及有效面积4个指标, 同时卫星类型下有高分一号、高分二号、资源一号02C卫星类型(如图10)。根据自适应覆盖规则选定的规则, 即覆盖最全、质量最佳、时相最优、成本最低中的一种, 或者其他的某种规则, 影像优劣评定方案将自适应设定相应参数, 以更好地适应覆盖规则, 如为满足覆盖最全, 参数设定将是以最全覆盖为最大宗旨, 可以适当牺牲影像时效性、影像质量、影像成本等因素, 最大限度的满足任务区的全覆盖。

图10 权重设定界面Fig.10 Weight setting interface

6)优选结果表达。实现优选结果的可视化表达, 利用多源遥感影像智能优选技术, 在同样满足用户需求的条件下, 可以节省影像资源约60%, 且实现了综合最优的覆盖。

3 试验结果与分析

以北京市行政区为试验区, 采用将软件自动优选和人工优选的结果进行对比分析, 以此来验证软件自动优选结果的合理性。

3.1 试验一: 单颗卫星优选

3.1.1 软件自动优选

1)参数设置。卫星及传感器类型: 高分一号多光谱; 空间范围: 北京市; 影像云量占比: 0%~15%; 时间范围: 2015年1月1日— 2015年12月31日; 优劣评价模型权重设置: 卫星类型: 0.0; 获取时间: 0.4; 云盖比例: 0.3; 有效面积: 0.3。由于是单颗卫星影像优选, 因此卫星类型的权重设置为0, 将获取时间权重设置最高, 希望优选出时相最优的影像。

2)优选结果。按照以上设置的参数开展软件自动优选, 软件自动优选出了34张影像将北京市完全覆盖一遍。影像时相分别有3, 5, 7, 8, 10, 11月, 使用时间为11 min, 优选结果见图11。

图11 单颗卫星软件自动优选结果Fig.11 Single satellite data automatically high quality choosing results show

3.1.2 人工优选

1)优选方法。将北京市2015年全年的高分一号卫星多光谱影像数据, 满足云量占比在0%~15%之间的全部提取出来, 然后由具备一定经验的作业员开展人工优选, 从时相较新的影像开始筛选, 直到筛选出的影像能够将北京市完全覆盖一遍为止。

2)优选结果。人工优选方法共筛选出了42张影像, 完全覆盖北京市, 影像时相分别有3, 5, 7, 8, 10和11月, 使用时间为1 h 45 min, 优选结果如图12所示。

图12 单颗卫星人工优选结果Fig.12 Single satellite data artificially high quality choosing results show

3.1.3 结果对比分析

1)软件自动优选和人工优选均能通过筛选合适的影像将目标区域完全覆盖一遍, 自动优选效率提高了11倍。

2)软件优选结果中有31张影像与人工优选结果相重合, 数据重合率为91%, 验证了软件自动优选的合理性。

3)人工优选结果数据量多于软件自动优选, 只要是由于人工优选时通过经验估计影像范围, 相邻影像之间的重叠度较高, 而软件自动优选可根据影像覆盖范围定量计算覆盖区域。

3.2 试验二: 多颗卫星优选

3.2.1 软件自动优选

1)参数设置。卫星及传感器类型: GF-1-MSS, GF-2-MSS和ZY1-02C-MUX。空间范围: 北京市; 云量占比: 0%~10%; 时间范围: 2015年1月1日— 2015年6月30日。优劣评价模型权重设置: 卫星类型: 0.3; 获取时间: 0.3; 云盖比例: 0.2; 有效面积: 0.2。由于是多颗卫星影像优选, 因此卫星类型的权重设置较大, 希望多利用分辨率更高的影像, 而在影像分值方面, 设置GF-2分值为100分, GF-1卫星分值为95分, ZY1-02C卫星的分值为90分; 同时将获取时间权重设置较高, 希望优选出时相最优的影像。

2)优选结果。按照以上设置的参数, 开展软件自动优选, 优选出了59张影像将北京市完全覆盖了一遍, 影像时相分别有1, 3, 4, 5和6月, 使用时间为8 min, 如图13所示。

图13 多颗卫星软件自动优选结果Fig.13 Multi-satellite data automatically high quality choosing results show

3.2.2 人工优选

1)优选方法。将北京市2016年上半年的GF-1-MSS影像、GF-2-MSS影像、ZY1-02C-MUX影像数据, 满足云量占比在0%~10%之间的, 全部提取出来, 然后由具备一定经验的作业员开展人工优选, 卫星类型上按照GF-2, GF-1, ZY1-02C的优先顺序, 时相上按照由新到旧的优先顺序, 云量占比按照先少后多的优先顺序, 开展影像筛选工作。多颗影像人工优选将更注重综合合理性, 也即前面筛选出的优质影像很可能被后面更加优质的影像所替换, 因此会增加一定的返工量, 以及最终优选结果的不确定性, 直到筛选出的影像能够将北京市完全覆盖一遍为止。

2)优选结果。人工优选方法共筛选出了76张影像, 将北京市完全覆盖了一遍, 影像时相分别有1, 3, 4, 5和6月, 使用时间为1 h 25 min, 结果如图14所示。

图14 多颗卫星人工优选结果展示图Fig.14 Multi-satellite data artificially high quality choosing results show

3.2.3 结果对比分析

1)软件自动优选和人工优选均能通过筛选合适的影像将目标区域完全覆盖一遍, 自动优选效率提高了10倍。

2)软件优选结果中有51张影像与人工优选结果相重合, 数据重合率为86%, 由于多颗卫星影像人工优选时对于不同卫星类型的影像质量判断存在不确定性, 增加了最终优选结果的不确定性, 因此数据重合率相比单颗卫星要低一些, 但也能一定程度上验证软件自动优选的合理性。

3)人工优选结果的GF-2卫星影像数量较软件自动优选会偏多一些, 主要是由于人工优选时从GF-2开始筛选, 对分辨率更高的GF-2卫星会更偏重, 云量稍微高一点时也会被选中, 而软件优选则会根据权重进行定量化的筛选。

4 结论

单颗星和多颗星的优选实验结果表明, 自动优选与人工精选的影像均能将目标区域覆盖一遍, 筛选结果符合要求, 二者重合率分别为91%和86%, 验证了自动优选结果的正确性; 而在执行效率方面, 单颗星和多颗星自动优选实验分别提高了11倍和10倍, 并且自动优选的执行效率将随着数据量的增加体现的更加突出, 验证了自动优选方法的高效性。

该方法从源头上解放了人工筛选数据的繁杂工作, 规避了主观筛选数据的随意性和不确定性, 能够以更加高效、更加科学、更加准确的方式自动筛选出满足要求、符合条件的优质数据集, 将显著提高卫星数据的检索、提取、处理及分发效率, 进一步推动国产卫星遥感数据的深化和广泛应用。

当然本文研究成果也有不足之处, 一是遥感数据的评价指标体系还不完善, 只初步明确了对影像质量有重要影响的几个主要指标, 后期将进一步细化和补充遥感数据的评价指标; 二是本文方法在进行空间运算时耗时较多, 由于云检测产生的碎片化矢量, 在进行空间交割运算时效率较低, 是下一步亟待优化的地方。

The authors have declared that no competing interests exist.

参考文献
[1] 丁晓东. 不确定系统优化理论与应用研究[D]. 上海: 东华大学, 2002: 11-15.
Ding X D. A study on optimal theory and its application for uncertain systems[D]. Shanghai: Donghua University, 2002: 11-15. [本文引用:1]
[2] 许雪燕. 模糊综合评价模型的研究及应用[D]. 南充: 西南石油大学, 2011: 3-27.
Xu X Y. Research and application of fuzzy comprehensive evaluation model[D]. Nanchong: Southwest Petroleum University, 2001: 3-27. [本文引用:1]
[3] 刘进生, 魏毅强, 王绪柱. 区间数判断矩阵的建立及其权重计算[J]. 系统工程, 1993, 11(3): 44-46, 52.
Liu J X, Wei Y Q, Wang X Z. Establishment of interval number judgment matrix and its weight calculation[J]. Systems Engineering, 1993, 11(3): 44-46, 52. [本文引用:1]
[4] 樊治平, 潘德惠. 不确定性判断矩阵权重计算的一种实用方法[J]. 系统工程, 1996, 14(2): 57-59.
Fan Z P, Pan D H. A practical method for calculating the weight of matrix of uncertainty Judgment[J]. Systems Engineering, 1996, 14(2): 57-59. [本文引用:1]
[5] 靳奉祥, 丁世飞, 王健. 基于熵权的主成分投影决策研究[C]//第二十七届中国控制会议论文集. 昆明: 中国自动化学会, 2008: 414.
Jin F X, Ding S F, Wang J. Research on principal component projection decision based on entropy weight[C]//Proceedings of the 27th China Conference. Kunming: Chinese Automation Society, 2008: 414. [本文引用:1]
[6] 胡永宏, 贺思辉. 综合评价方法[M]. 北京: 科学出版社, 2000: 16-18.
Hu Y H, He S H. Comprehensive Evaluation Method[M]. Beijing: Science Press, 2000: 16-18. [本文引用:1]