一尘不染

JavaDOM处理后XML属性的顺序

java

通过标准DOM处理XML时,不能保证属性顺序在重新序列化之后。最后,这是我在使用标准java XML Transform API序列化输出时刚刚意识到的。

但是我确实需要保持秩序。我想知道在Java上是否有可能保持通过DOM API处理的XML文件的属性的原始顺序,或以任何方式强制执行该顺序(可能通过使用替代的序列化API来让你进行设置)一种财产)。就我而言,处理减少了用一堆属性来更改同一元素序列的某些属性(不是全部)的值,并可能插入更多元素的可能性。

有什么“简便”的方法,还是我必须定义自己的XSLT转换样式表以指定输出并更改整个输入XML文件?

更新我必须感谢你的所有答复。现在,答案似乎比我预期的更加明显。我从没有对属性顺序给予任何关注,因为我以前从不需要它。

需要属性顺序的主要原因是生成的XML文件看起来有所不同。目标是一个包含数百个警报的配置文件(每个警报均由一组属性定义)。该文件通常随时间进行很少的修改,但是使它保持有序很方便,因为当我们需要修改某些内容时,它是手动编辑的。有时某些项目需要对该文件进行少量修改,例如将属性之一设置为客户特定的代码。

我刚刚开发了一个小应用程序,用于将原始文件(在所有项目中通用)与每个项目的特定部分合并(修改某些属性的值),因此特定于项目的文件将获取基本文件的更新(新的警报定义或某些属性)值错误修正)。我要求有序属性的主要动机是能够通过文本比较工具(例如Winmerge)来检查应用程序的输出是否再次原始文件。如果格式(主要是属性顺序)保持不变,则可以轻松发现差异。

我真的以为这是可能的,因为XML处理程序(例如XML Spy)使你可以编辑XML文件并应用一些排序(网格模式)。也许我唯一的选择是使用这些程序之一来手动修改输出文件。


阅读 816

收藏
2020-03-06

共1个答案

一尘不染

抱歉地说,但是答案比“不,你不能做”或“为什么首先需要这样做?”要微妙得多。

简短的答案是“ DOM不允许你这样做,但SAX可以”。

这是因为DOM并不关心属性顺序,因为就标准而言,它毫无意义,并且到XSL掌握输入流时,信息已经丢失。大多数XSL引擎实际上会适当地保留输入流的属性顺序(例如Xalan-C(在某些情况下除外)或Xalan-J(始终))。特别是如果你使用<xsl:copy*>

据我所知,没有保留属性顺序的情况是这样。-如果输入流是DOM-Xalan-C:如果你按字面意义插入结果树标记(例如<elem att1={@att1} .../>

这是SAX的一个示例,用于记录(也禁止DTD中断)。

SAXParserFactory spf = SAXParserFactoryImpl.newInstance();
spf.setNamespaceAware(true);
spf.setValidating(false);
spf.setFeature("http://xml.org/sax/features/validation", false);
spf.setFeature("http://apache.org/xml/features/nonvalidating/load-dtd-grammar", false);
spf.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);
SAXParser sp = spf.newSAXParser() ;
Source src = new SAXSource ( sp.getXMLReader(), new InputSource( input.getAbsolutePath() ) ) ;
String resultFileName = input.getAbsolutePath().replaceAll(".xml$", ".cooked.xml" ) ;
Result result = new StreamResult( new File (resultFileName) ) ;
TransformerFactory tf = TransformerFactory.newInstance();
Source xsltSource = new StreamSource( new File ( COOKER_XSL ) );
xsl = tf.newTransformer( xsltSource ) ;
xsl.setParameter( "srcDocumentName", input.getName() ) ;
xsl.setParameter( "srcDocumentPath", input.getAbsolutePath() ) ;

xsl.transform(src, result );

我还要指出,许多反对者的意图是,在某些情况下属性顺序确实很重要。

回归测试是一个明显的例子。曾经被要求优化写得不好的XSL的人都知道,你通常希望确保“新”结果树与“旧”结果树相似或相同。当结果树大约有一百万行时,XML diff工具就显得笨拙……在这种情况下,保留属性顺序很有帮助。

2020-03-06