一尘不染

如何使用XPath在Java中使用名称空间查询XML?

java

当我的XML看起来像这样(no xmlns)时,我可以使用XPath轻松查询它/workbook/sheets/sheet[1]

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<workbook>
  <sheets>
    <sheet name="Sheet1" sheetId="1" r:id="rId1"/>
  </sheets>
</workbook>

但是当看起来像这样我就不能

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<workbook xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships">
  <sheets>
    <sheet name="Sheet1" sheetId="1" r:id="rId1"/>
  </sheets>
</workbook>

有任何想法吗?


阅读 472

收藏
2020-03-09

共1个答案

一尘不染

在第二个示例XML文件中,元素绑定到名称空间。你的XPath尝试处理绑定到默认“无名称空间”名称空间的元素,因此它们不匹配。

首选方法是使用名称空间前缀注册名称空间。它使你的XPath更加易于开发,读取和维护。

但是,并不一定要注册名称空间并在XPath中使用名称空间前缀。

你可以公式化一个XPath表达式,该表达式对元素使用通用匹配,并使用谓词过滤器来限制所需local-name()和的匹配namespace-uri()。例如:

/*[local-name()='workbook'
    and namespace-uri()='http://schemas.openxmlformats.org/spreadsheetml/2006/main']
  /*[local-name()='sheets'
      and namespace-uri()='http://schemas.openxmlformats.org/spreadsheetml/2006/main']
  /*[local-name()='sheet'
      and namespace-uri()='http://schemas.openxmlformats.org/spreadsheetml/2006/main'][1]

如你所见,它会产生一个非常冗长且冗长的XPath语句,该语句很难读取(和维护)。

你也可以只匹配local-name()元素的,而忽略名称空间。例如:

/*[local-name()='workbook']/*[local-name()='sheets']/*[local-name()='sheet'][1]

但是,你冒着匹配错误元素的风险。如果你的XML混合使用了相同的词汇表(对于该实例而言可能不是问题)local-name(),则你的XPath可能匹配错误的元素并选择了错误的内容:

2020-03-09