admin

将数据库结果筛选为查找列中每个值的前n条记录

sql

假设我的数据库中有两个表。

TABLE:Categories
ID|CategoryName
01|CategoryA
02|CategoryB
03|CategoryC

还有一个引用类别的表,该表还具有存储一些随机数的列。

TABLE:CategoriesAndNumbers
CategoryType|Number
   CategoryA|24
   CategoryA|22
   CategoryC|105
   .....(20,000 records)
   CategoryB|3

现在,我该如何过滤掉这些数据?因此,我想知道每个类别中最小的3个数字是什么,然后删除其余的数字。最终结果将是这样的:

TABLE:CategoriesAndNumbers
CategoryType|Number
   CategoryA|2
   CategoryA|5
   CategoryA|18
   CategoryB|3
   CategoryB|500
   CategoryB|1601
   CategoryC|1
   CategoryC|4
   CategoryC|62

现在,我可以获得所有类别中最小的数字,但是我希望每个类别都可以单独进行比较。

编辑:我正在使用Access和到目前为止这是我的代码

SELECT TOP 10 cdt1.sourceCounty, cdt1.destCounty, cdt1.distMiles
FROM countyDistanceTable as cdt1, countyTable
WHERE cdt1.sourceCounty = countyTable.countyID
ORDER BY cdt1.sourceCounty, cdt1.distMiles, cdt1.destCounty

EDIT2:感谢Remou,这将是可以解决我问题的有效查询。 谢谢!

DELETE
FROM CategoriesAndNumbers a
WHERE a.Number NOT IN (
    SELECT Top 3 [Number] 
    FROM CategoriesAndNumbers b 
    WHERE b.CategoryType=a.CategoryType 
    ORDER BY [Number])

阅读 143

收藏
2021-07-01

共1个答案

admin

您可以使用类似:

SELECT a.CategoryType, a.Number
FROM CategoriesAndNumbers a
WHERE a.Number IN (
    SELECT Top 3 [Number] 
    FROM CategoriesAndNumbers b 
    WHERE b.CategoryType=a.CategoryType 
    ORDER BY [Number])
ORDER BY a.CategoryType

这样做的困难在于,Jet / ACE
Top选择存在重复值的地方,因此您不一定会得到三个值,如果有联系,您会得到更多的值。如果存在一个关键字段,通常可以通过一个关键字段来解决该问题:

WHERE a.Number IN (
    SELECT Top 3 [Number] 
    FROM CategoriesAndNumbers b 
    WHERE b.CategoryType=a.CategoryType 
    ORDER BY [Number], [KeyField])

但是,在这种情况下,我认为这不会有所帮助,因为外部表将包含联系。

2021-07-01