关于文本的图形解析

原文发布时间:2011-01-14 14:05:51

作者:跑

联系:QQ44295133


(一)          引子

近日,手上有这么一个项目,数据来源是某应用软件生成的交换格式,即按一定规则描述的纯文本。内容如下

                  

其中前9行关于坐标系的描述,由于信息不全可忽略。随后关于图形描述的信息,大致分为两类:一是属性信息,如第10、18、24行;另一是坐标信息,即多边形各顶点坐标。

此外,源文件以文件夹形式提供,各子文件夹下有若干该文本文件。最终完成成果要求输出格式为ESRI Shape,文件以原文件夹同名。

                   

(二)          实施

1)   对各行进行分类

扫描二维码关注公众号,回复: 2475601 查看本文章

对于前9行,我们可以通过Tester把它筛除(下左图);余下各行均以“,”逗号分隔,并且属性描述行逗号数目与坐标描述行不一致,根据这一点,我们又可以方便地把它们区分出来(下右图);此外,坐标描述行第二列是一个标识码,区别文本内的其它多边形。

 

 

2)   展点、连线

将上述Tester_2输出端PASSED依次运行2DPointReplacer + PointConnector,其中连接分类属性选择第二列,前面已有解释,这里不再赘述。

 

       3)   属性关联

前面的分析,我们已经知道图形属性在图形坐标上一行,将上一步得到的图形行号减1,即可通过行号将图形与属性关联起来。而至于属性具体的解释,这里不是重点也不作介绍。

 

 

 

 

4)   扇出

一般按文件扇出需要在Navigator目标数据集高级设置项配置,考虑到SHP为单一数据集格式,因此这里可以直接在画布目标数据集设置fanout即可。所取字段我们可以通过以下处理得到,其中第二个转换器索引号因目录不同而不同。

                                                

  
(三)          小结

通过这样的配置,我们可以将纯文本中的坐标串解析为图形,这也是自定义数据格式的一种尝试。

猜你喜欢

转载自blog.csdn.net/fmechina/article/details/81235935