一尘不染

检查网址是否相等的正确方法

java

我有以下情况:

URL u1 = new URL("http://www.yahoo.com/");
URL u2 = new URL("http://www.yahoo.com");

if (u1.equals(u2)) {
    System.out.println("yes");
}
if (u1.toURI().equals(u2.toURI())) {
    System.out.println("uri equality");
}
if (u1.toExternalForm().equals(u2.toExternalForm())) {
    System.out.println("external form equality");
}
if (u1.toURI().normalize().equals(u2.toURI().normalize())) {
    System.out.println("uri normalized equality");
}

这些检查都没有成功。只有路径不同:u1的路径为“
/”,而u2的路径为“”。这些URL是否指向相同的资源,是否可以在不打开连接的情况下检查这种情况?我是否误解了有关URL的一些基本知识?

编辑 我应该指出,需要非黑客检查。说空路径== /是否合理?我希望没有这种代码


阅读 266

收藏
2020-12-03

共1个答案

一尘不染

从2007 JavaOne中:

第二个难题的标题是“集的更多乐趣”,它使用户可以创建由多个URL对象组成的HashMap键。同样,大多数观众无法猜测正确的答案。

观众在这里学到的重要一点是,实际上 ,URL对象的equals()方法被破坏了
。在这种情况下,如果两个URL对象解析为相同的IP地址和端口,则它们是相等的,而不仅仅是它们具有相同的字符串。但是,布洛赫(Bloch)和普格(Pugh)指出了更为严重的致命弱点:平等行为的不同取决于您是否连接到网络,虚拟地址可以解析到同一主机,或者您是否不在网络上,解决是阻塞操作。因此,根据经验教训,他们建议:

不要使用URL; 请改用URI。URI不会尝试比较地址或端口。此外,请勿将URL用作Set元素或Map键。
对于API设计人员,equals()方法不应依赖于环境。例如,在这种情况下,如果计算机连接到Internet而不是独立网络,则平等性不会改变。


从URI等于文档:

为了使两个分层URI相等, 它们的路径必须相等, 并且它们的查询必须都未定义或相等。

在您的情况下,两条路径是不同的。一个是“ /”,另一个是“”。


根据URI RFC§6.2.3:

实现 可以 使用特定于方案的规则,以进一步的处理成本来减少误报的可能性。例如,由于“ http”方案使用权限组件,默认端口为“
80”,并且定义了一个等效于“ /”的空路径,因此以下四个URI是等效的:

 http://example.com
 http://example.com/
 http://example.com:/
 http://example.com:80/

似乎此实现未使用特定于方案的规则。


资源:

2020-12-03