我有一个xml,如下所示:
<Row ss:Index="76" ss:AutoFitHeight="0" ss:Height="25"> <Cell ss:Index="1" ss:MergeAcross="9" ss:StyleID="s38"> <ss:Data ss:Type="String" xmlns="http://www.w3.org/TR/REC-html40"> <Font html:Size="15" html:Face="Times New Roman" x:Family="Roman" html:Color="#000000"> <B> ABCD </B> </Font> </ss:Data> </Cell> </Row>
现在,我想删除标记,但在此处保留内容“ ABCD”。或者有没有一种方法可以使用java从整个XML文件中删除。请帮忙。谢谢。
使用DOM4J或SAX解析器解析文档
从Font标签中获取价值
Font
<Font html:Size="15" html:Face="Times New Roman" x:Family="Roman" html:Color="#000000"> <B> ABCD </B> </Font>
JSoup三通
Jsoup.parse(html).text();
字符串替换
replaceAll("\<(\/)?B\>","")