一尘不染

和之间的区别

jsp

谁能解释我之间的区别  and  

我有以二进制形式存储在数据库中的html数据,其中的空间可以是  或有时是 

同样的问题是,当我使用 JSoup lib
它将HTML转换为纯文本时,可以正确转换它,但是如果我使用Java的String.contains(my
string)方法。看起来具有的HTML数据与具有的HTML数据 不同 。反之亦然,找不到字符串。

例:

HTML1: This is my test string

HTML2: This is my test string

如果我使用JSoup将其转换为纯文本。它返回

HTML 1:这是我的测试字符串

HTML 2:这是我的测试字符串

但是仍然两个字符串都不相同。为什么会这样呢?


阅读 333

收藏
2020-06-08

共1个答案

一尘不染

  是经典空间,当您按下空格键时会得到一个经典空间,以他的HTML实体等价物表示。

 并且 表示不间断空间,通常用于防止浏览器将多个空间合并在一起而崩溃:

"    " =>“”(仅折叠为一个空格)

"    " =>“”(未折叠)

如果要解析同时包含经典空格和不间断空格的字符串,则可以安全地用另一个替换。

2020-06-08