MongoDB 几种查询嵌套数据(Embedded)的方式

原文地址:https://www.jianshu.com/p/b28a73ba9a16

前言

MongoDB 推荐使用「内嵌文档(Embedded)」,所以带来一个问题,如何查询嵌入文档内的数据?

假如我们有一个 storage 的 Collection,包含一条数据:

// `storage` Collection
{
    "_id": "alpha",
    "name": "Storage Alpha",
    "items": [
        {
            "category": "food",
            "name": "apple"
        },
        {
            "category": "food",
            "name": "banana"
        },
        {
            "category": "tool",
            "name": "hammer"
        },
        {
            "category": "furniture",
            "name": "couch"
        }
    ]
}

如何查出 items.categoryfood 的数据?

熟悉 MongoDB 查询语句的同学可能立刻想到了以下查询语句:

db.storage.find({
    'items.category': { 
        $eq: 'food'
    }
})

但是这样只能查出这一条 storage 数据,并不能过滤 items 字段中不符合条件数据,实时上就是返回了整个 document。

解决方案

$ 映射操作符(Projection Operator)

第一个解决方案是使用 $ 映射操作符。

这是 官方文档 的介绍:

$ 操作符会限制 array 类型数据的返回结果,使其仅返回第一个满足条件的元素。

那么我们使用 $ 进行查询:

db.storage.find(
    {
        'items.category': { 
            $eq: 'food'
        }
    },
    {
        'items.$': 1
    }
)

就会得到这样的结果:

{
    "_id" : "alpha",
    "items" : [ 
        {
            "category" : "food",
            "name" : "apple"
        }
    ]
}

可以看到,不符合条件的 items 确实没有返回了(_id 字段是默认会返回的),但因为 $ 映射操作符只会返回数组中第一个符合条件的元素,另一条同样符合条件的元素无法被获取到。

$ 映射操作符还有一些其他限制条件

$elemMatch 映射操作符(Projection Operator)

另一种方式是使用 $elemMatch 操作符(官方文档)。

同样是「映射操作符」,$elemMatch$ 的区别在于,$ 使用的是数据查询条件作为来映射(或者说过滤)array 中的数据,而 $elemMatch 需要指定单独的条件(可以指定多个条件)。

查询示例如下:

db.storage.find(
    // 对 `items` 的过滤条件不需要写在查询条件中
    {
        '_id': "alpha"
    },
    {
        'items': {
            '$elemMatch': {
                'category': 'food'
            }
        }
    }
)

查询结果:

{
    "_id" : "alpha",
    "items" : [ 
        {
            "category" : "food",
            "name" : "apple"
        }
    ]
}

但和 $ 一样,$elemMatch 也只能返回数组中的第一条元素。

聚合(Aggregation)

MongoDB >= 3.2

$filter

「聚合」这里我们就简单理解为对数据的批处理(分组、转换、统计等)。它的功能实际上太强大了,详细介绍还是推荐看官方文档,用它来做数组过滤其实有一些杀鸡用牛刀的感觉。

查询语句看起来有一些复杂:

db.storage.aggregate(
    {
        $project: {
            "items": {
                $filter: {
                    input: "$items",
                    as: "item",
                    cond: { 
                        $eq: [ '$$item.category', 'food' ]
                    }
                }
            }
        }
    }
)

查询结果:

{
    "_id" : "alpha",
    "items" : [ 
        {
            "category" : "food",
            "name" : "apple"
        }, 
        {
            "category" : "food",
            "name" : "banana"
        }
    ]
}

终于我们得到了想要的结果!

$unwind

同样使用「聚合」,还可以使用 $unwind 操作符

如果文档中包含 array 类型字段、并且其中包含多个元素,使用 $unwind 操作符会根据元素数量输出多个文档,每个文档的 array 字段中仅包含 array 中的单个元素。

我们来试试看:

db.storage.aggregate(
    { 
        $match : {
            'items.category': 'food'
        }
    },
    {
        $unwind : '$items' 
    },
    {
        $match : {
            'items.category': 'food'
        }
    }
)

查询结果:

{
    "_id" : "alpha",
    "name" : "Storage Alpha",
    "items" : {
        "category" : "food",
        "name" : "apple"
    }
}

{
    "_id" : "alpha",
    "name" : "Storage Alpha",
    "items" : {
        "category" : "food",
        "name" : "banana"
    }
}

$unwind 操作符返回了多条文档数据,并且改变了 items 字段的类型。

不过查询语句相对前一个例子来说要简洁和易于理解,在某些场景下可能更好用。

应用层过滤处理

如题,如果数组内容不多,取出整个文档后在应用层进行处理也不失为一个方法,可以说是分布式计算了……

结语

最近发现文章被盗链非常严重,甚至在百度的权重都超过了出处…在此插入简书地址:https://www.jianshu.com/u/11c0ebe856b8

总结一下目前的结论(当前 MongoDB 版本为 3.6):

  • 如果只需要获取 array 字段中的第一个满足条件的元素、并且一次查询中仅操作一个 array 类型的字段,使用 $ 或者 $elemMatch 映射操作符都可以满足需求;
  • 其他情况,优先考虑使用「聚合」;
  • 没有强迫症也可以在应用层做过滤处理。

这个结论让我也颇感意外,因为「内嵌式」建模方式是 MongoDB 官方宣传的亮点之一(官方文档,当年的宣传文档我暂时没找到)。如果你有更好的方案请在评论中指出。

参考资料



作者:该叶无法找到
链接:https://www.jianshu.com/p/b28a73ba9a16
來源:简书

猜你喜欢

转载自blog.csdn.net/qq_32439101/article/details/86589905