一尘不染

一对多关系无需使用“不同”即可获取重复的对象。为什么?

hibernate

我有一对多关系中的两个类和一个有点奇怪的HQL查询。即使我已经阅读了一些已经发布的问题,对我来说也不清楚。

Class Department{
   @OneToMany(fetch=FetchType.EAGER, mappedBy="department")
   Set<Employee> employees;
}
Class Employee{
   @ManyToOne
   @JoinColumn(name="id_department")
   Department department;
}

当我使用以下查询时,我得到重复的Department对象:

session.createQuery("select dep from Department as dep left join dep.employees");

因此,我必须使用不同的:

session.createQuery("select distinct dep from Department as dep left join dep.employees");

这是一种预期的行为吗?我认为这与SQL比较是不寻常的。


阅读 260

收藏
2020-06-20

共1个答案

一尘不染

这个问题在Hibernate FAQ中有详尽的解释:

首先,您需要了解SQL以及OUTER
JOIN在SQL中的工作方式。如果您不完全理解和理解SQL中的外部联接,请不要继续阅读此FAQ项,而请查阅SQL手册或教程。否则,您将无法理解以下说明,并且会在Hibernate论坛上抱怨此行为。可能返回相同Order对象的重复引用的典型示例:

List result = session.createCriteria(Order.class)  
                        .setFetchMode("lineItems", FetchMode.JOIN)  
                        .list();

<class name="Order">           
    <set name="lineItems" fetch="join">
    ...
</class>

List result = session.createCriteria(Order.class)  
                        .list();

List result = session.createQuery("select o from Order o left join fetch o.lineItems").list();

所有这些示例均产生相同的SQL语句:

SELECT o.*, l.* from ORDER o LEFT OUTER JOIN LINE_ITEMS l ON o.ID = l.ORDER_ID

想知道为什么有重复吗?查看SQL结果集,Hibernate不会在外部联接结果的左侧隐藏这些重复项,而是返回驱动表的所有重复项。如果数据库中有5个订单,并且每个订单有3个订单项,则结果集将为15行。这些查询的Java结果列表将包含15个元素,所有元素均为Order类型。Hibernate将仅创建5个Order实例,但是SQL结果集的重复项将保留为这5个实例的重复引用。如果您不明白这最后一句话,则需要阅读Java以及Java堆上的实例与对该实例的引用之间的区别。(为什么选择左外部联接?如果您还有其他订单,但没有任何订单项,结果集将为16行,右侧填充NULL,其中订单项数据用于其他订单。即使他们没有订单项,您也要订单,对吗?如果没有,请在您的HQL中使用内部联接提取。
默认情况下,Hibernate不会过滤掉这些重复的引用。有些人(不是您)实际上想要这个。如何过滤掉它们?像这样:

Collection result = new LinkedHashSet( session.create*(...).list() );

LinkedHashSet过滤掉重复的引用(它是一个集合),并保留插入顺序(结果中元素的顺序)。那太简单了,因此您可以通过许多不同且更困难的方式来做到这一点:

List result = session.createCriteria(Order.class)  
                        .setFetchMode("lineItems", FetchMode.JOIN)  
                        .setResultTransformer(Criteria.DISTINCT_ROOT_ENTITY)  
                        .list();


<class name="Order">  
    ...  
    <set name="lineItems" fetch="join">

List result = session.createCriteria(Order.class)  
                        .setResultTransformer(Criteria.DISTINCT_ROOT_ENTITY)  
                        .list();

List result = session.createQuery("select o from Order o left join fetch o.lineItems")  
                      .setResultTransformer(Criteria.DISTINCT_ROOT_ENTITY) // Yes, really!  
                      .list();

List result = session.createQuery("select distinct o from Order o left join fetch o.lineItems").list();

最后一个很特别。看来您在这里使用SQL
DISTINCT关键字。当然,这不是SQL,这是HQL。在这种情况下,这种区别只是结果转换器的捷径。是的,在其他情况下,HQL变量将直接转换为SQL
DISTINCT。并非在这种情况下:您无法在SQL级别上过滤掉重复项,产品/联接的本质禁止这样做-
您想要重复项或没有获得所需的所有数据。当结果集被编组到对象中时,所有对重复项的过滤都在内存中进行。同样显而易见的是,为什么基于结果集基于行的“限制”操作(例如setFirstResult(5)和setMaxResults(10))无法与这类急切的获取查询一起使用。如果您将结果集限制为一定数量的行,您随机切断数据。有一天,Hibernate可能很聪明,知道如果调用setFirstResult()或setMaxResults(),则不应使用联接,而应使用第二个SQL
SELECT。尝试一下,您的Hibernate版本可能已经足够聪明了。如果不是,则编写两个查询,一个查询用于限制内容,另一个查询用于快速获取。您是否想知道为什么带有Criteria查询的示例没有忽略映射中的fetch
=“ join”设置,但是HQL不在乎?阅读下一个常见问题解答。您是否想知道为什么带有Criteria查询的示例没有忽略映射中的fetch =“
join”设置,但是HQL不在乎?阅读下一个常见问题解答。您是否想知道为什么带有Criteria查询的示例没有忽略映射中的fetch =“
join”设置,但是HQL不在乎?阅读下一个常见问题解答。

2020-06-20