一尘不染

Java-从xml中删除标签

java

我有一个xml,如下所示:

<Row ss:Index="76" ss:AutoFitHeight="0" ss:Height="25">
   <Cell ss:Index="1" ss:MergeAcross="9" ss:StyleID="s38">
      <ss:Data ss:Type="String" xmlns="http://www.w3.org/TR/REC-html40">
          <Font html:Size="15" html:Face="Times New Roman" x:Family="Roman" html:Color="#000000">
            <B> ABCD </B>
          </Font>
       </ss:Data>
   </Cell>
</Row>

现在,我想删除标记,但在此处保留内容“ ABCD”。或者有没有一种方法可以使用java从整个XML文件中删除。请帮忙。谢谢。


阅读 562

收藏
2020-12-03

共1个答案

一尘不染

  1. 使用DOM4JSAX解析器解析文档

  2. Font标签中获取价值

<Font html:Size="15" html:Face="Times New Roman" x:Family="Roman" html:Color="#000000"> <B> ABCD </B> </Font>

  1. 从值中删除所有html标签

JSoup三通

Jsoup.parse(html).text();

字符串替换

replaceAll("\<(\/)?B\>","")
  1. 将新值设置为XML字体标签
2020-12-03