NoSQL—Memcached

NoSQL介绍

  1. 什么是NoSQL

  • 非关系型数据库就是NoSQL,关系型数据库代表MySQL

  • 对于关系型数据库来说,是需要把数据存储到库、表、行、字段里,查询的时候根据条件一行一行地去匹配,当量非常大的时候就很耗费时间和资源,因为数据存储在磁盘里,需要根据你的查询条件从磁盘里去检索

  • NoSQL数据库存储原理非常简单(典型的数据类型为k-v,一个键一个值),不存在繁杂的关系链,没有什么行啊字段啊这么复杂的数据结构,比如mysql查询的时候,需要找到对应的库、表(通常是多个表)以及字段。

  • NoSQL数据库不存表与表之间的关联

  • NoSQL数据可以存储在内存里,查询速度非常快

  • NoSQL在性能表现上虽然能优于关系型数据库,但是它并不能完全替代关系型数据库

  • NoSQL因为没有复杂的数据结构,扩展非常容易,支持分布式

  2. 常见NoSQL数据库

  • k-v形式的:memcached、redis 适合储存用户信息,比如会话(Session:用户信息)、配置文件、参数、购物车等等。这些信息一般都和ID(键)挂钩,这种情景下键值数据库是个很好的选择。

    扫描二维码关注公众号,回复: 12103794 查看本文章
  • 文档数据库:mongodb   将数据以文档的形式储存。每个文档都是一系列数据项的集合。每个数据项都有一个名称与对应的值,值既可以是简单的数据类型,如字符串、数字和日期等;也可以是复杂的类型,如有序列表和关联对象。数据存储的最小单位是文档,同一个表中存储的文档属性可以是不同的,数据可以使用XML、JSON或者JSONB等多种形式存储。

  • 列存储:Hbase

      图 :Neo4J、Infinite Graph、OrientDB

扩展:

列举常见的关系型数据库和非关系型都有那些?

关系型数据库:

Oracle、DB2、Microsoft SQL Server、Microsoft Access、MySQL

非关系型数据库:

NoSql、Cloudant、MongoDb、redis、HBase


两种数据库之间的区别:

关系型数据库

 关系型数据库的特性

  1、关系型数据库,是指采用了关系模型来组织数据的数据库;

  2、关系型数据库的最大特点就是事务的一致性;

  3、简单来说,关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。

 关系型数据库的优点

  1、容易理解:二维表结构是非常贴近逻辑世界一个概念,关系模型相对网状、层次等其他模型来说更容易理解;

  2、使用方便:通用的SQL语言使得操作关系型数据库非常方便;

  3、易于维护:丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大减低了数据冗余和数据不一致的概率;

  4、支持SQL,可用于复杂的查询。

 关系型数据库的缺点

  1、为了维护一致性所付出的巨大代价就是其读写性能比较差;

  2、固定的表结构;

  3、高并发读写需求;

  4、海量数据的高效率读写;


非关系型数据库

  非关系型数据库的特性

  1、使用键值对存储数据;

  2、分布式;

  3、一般不支持ACID特性;

  4、非关系型数据库严格上不是一种数据库,应该是一种数据结构化存储方法的集合。

 非关系型数据库的优点

  1、无需经过sql层的解析,读写性能很高;

  2、基于键值对,数据没有耦合性,容易扩展;

  3、存储数据的格式:nosql的存储格式是key,value形式、文档形式、图片形式等等,文档形式、图片形式等等,而关系型数据库则只支持基础类型。

 非关系型数据库的缺点

   1、不提供sql支持,学习和使用成本较高;

   2、无事务处理,附加功能bi和报表等支持也不好;


Memcached介绍

在lamp或者lamp架构中memcached用来缓存一些数据,如论坛帖子,访问量,在线人数...

Memcached是国外社区网站LiveJournal团队开发,目的是为了通过缓存数据库查询结果,减少数据库访问次数,从而提高动态web站点性能。 

官方站点 http://www.memcached.org/ 

特性 

  • 数据结构简单(k-v),数据存放在内存里

  • 多线程(当你的服务器cpu很多的时候,明显会发现memcached是很快的)

  • 基于c/s架构,协议简单(意味着你要启动一个服务端,客户端去链接这个服务端)

  • 基于libevent的事件处理(nginx也是基于libevent)

  • 自主内存存储处理(slab allowcation)

  • 数据过期方式有两种:Lazy Expiration 和 LRU

缺点:不支持落地,不支持持久化,一但重新启动服务器或者重启memcached服务,缓存的数据就会丢失

解决办法:重启之前先把数据落地保存到磁盘里,然后重启之后在把数据恢复回去

Memcached的数据流向

正常流向:比如现在有一个lnmp架构的论坛,正常来说php会跟数据库打交道,然后nginx调用php进行数据交互,比如去查一个帖子内容,首先用户发起请求给nginx,nginx把这个php的请求交给了php的脚本,也就是交给了php-fpm这个服务了,php-fpm这个服务解析完这个php脚本发现是要查询这个帖子的,然后到数据库去查询数据,查询完之后最后由nginx反馈给用户

image.png

 Slab Allocation的原理

 将分配的内存分割成各种尺寸的块(chunk), 并把尺寸相同的块分成组(chunk的集合),每个chunk集合被称为slab。

 Memcached的内存分配以Page为单位,Page默认值为1M,可以在启动时通过-I参数来指定。

 Slab是由多个Page组成的,Page按照指定大小切割成多个chunk。

Slab allocation

image.png

Growth factor

Memcached在启动时通过-f选项可以指定 Growth Factor因子。该值控制chunk大小的差异。默认值为1.25。

 通过memcached-tool命令查看指定Memcached实例的不同slab状态,可以看到各Item所占大小(chunk大小)差距为1.25 

 命令:# memcached-tool 127.0.0.1:11211 display

  • Memcached的数据过期方式

Lazy Expiration 

在创建一个k-v的时候,就需要指定一个过期时间(时间戳),是由用户来决定的

 Memcached 内部不会监视记录是否过期,而是在get时查看记录的时间戳,检查记录是否过期。这种技术被称为lazy(惰性)expiration。因此,Memcached不会在过期监视上耗费CPU时间。

 LRU

也就是说我们在memcache里边存储了很多数据,但是有的数据经常用而有些基本存进去就没用过,这些就会标记为危险的,当空间不够了这些经常不用的就会被覆盖掉

 Memcached会优先使用已超时的记录的空间,但即使如此,也会发生追加新记录时空间不足的情况,此时就要使用名为Least Recently Used(LRU)机制来分配空间。顾名思义,这是删除“最近最少使用”的记录的机制。因此,当内存空间不足时(无法从slab class获取到新的空间时),就从最近未被使用的记录中搜索,并将其空间分配给新的记录。从缓存的实用角度来看,该模型十分理想。


Memcached安装

  1. 安装:yum install -y memcached libmemcached libevent memcached是基于libevent,所以安装me之前要先安装libevent,rpm -qa libevent看看有没有安装没有安装,一般在安装memcached的时候他自动会安装上。

  2.  启动:systemctl start memcached

[root@awei-01 ~]# ps aux|grep memcached
memcach+  8484  0.0  0.0 326028  1204 ?        Ssl  18:07   0:00 /usr/bin/memcached -u memcached -p 11211 -m 64 -c 1024
root      8491  0.0  0.0 112656   996 pts/0    S+   18:07   0:00 grep --color=auto memcached

-u:指定系统用户 -p:监听端口 -m:分配内存大小(单位:M兆) -c:最大并发数 

这些参数都可以更改,但是它没有配置文件,更改他有两种方案,一种是在启动时在命令行加上参数,还有一种是更改这个文件

3. 配置文件:vim /etc/sysconfig/memcached 可以配置参数

PORT="11211"     端口
USER="memcached" 用户
MAXCONN="1024"   最大连接数
CACHESIZE="64"   内存
OPTIONS=""       其他

比如加上监听的ip,可以把OPTIONS="" 改为:OPTIONS="127.0.0.1"

  • -m指定memcached分配内存

  • -c指定最大并发数

  • -u指定运行memcached服务的用户

查看参数用法:memcached -h

查看Memcached运行状态

  • 方法1:自带的查看状态的工具:memcached-tool 

      格式:memcached-tool IP:端口 stats

      用法memcached-tool 127.0.0.1:11211  stats

      主要看:get_hits/curr_items=命中率 (就是说比如你有一些帖子缓存在me里边了,用户访问时是否通过me访问的)

   connection_structures          11
        curr_connections          10
              curr_items           0
               decr_hits           0
             decr_misses           0
             delete_hits           0
           delete_misses           0
       evicted_unfetched           0
               evictions           0
       expired_unfetched           0
                get_hits           0
              get_misses           0
              hash_bytes      524288
  • 方法2:命令nc,需要安装nc工具:yum install -y nc 

     查看这个命令是由哪个包安装的:rpm -qf `which nc`

[root@awei-01 ~]# rpm -qf `which nc`
nmap-ncat-6.40-19.el7.x86_64
  • 格式:echo stats |nc IP 端口

  • 命令用法:echo stats |nc 127.0.0.1 11211

[root@awei-01 ~]# echo stats |nc 127.0.0.1 11211
STAT pid 8484
STAT uptime 1327
STAT time 1599474551
STAT version 1.4.15
STAT libevent 2.0.21-stable
STAT pointer_size 64
STAT rusage_user 0.013403
STAT rusage_system 0.040211
STAT curr_connections 10
STAT total_connections 12
STAT connection_structures 11
  • 方法3:

      rpm -qa libmemcached用来查看一个包,若安装libmemcached后,可以使用命令

      格式:memstat --servers=IP:端口

      用法:memstat --servers=127.0.0.1:11211

[root@awei-01 ~]# memstat --servers=127.0.0.1:11211
Server: 127.0.0.1 (11211)
	 pid: 8484
	 uptime: 1406
	 time: 1599474630
	 version: 1.4.15
	 libevent: 2.0.21-stable
	 pointer_size: 64
	 rusage_user: 0.014232
	 rusage_system: 0.042697
	 curr_connections: 10
	 total_connections: 13
	 connection_structures: 11
	 reserved_fds: 20
	 cmd_get: 0
	 cmd_set: 0


Memcached命令行

  • 进入memcached命令:telnet

  • 用法:telnet 127.0.0.1 11211

[root@awei-01 ~]# telnet 127.0.0.1 11211
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.
##输入命令就可以了
  • 存数据命令:set

  • 用法:set key2 0 30 2

image.png

  • 查看存储数据命令:get

  • 用法:get key2

get key2     
VALUE key2 0 2
12
END


Memcached语法规则

<command name> <key> <flags> <exptime> <bytes>\r\n <data block>\r\n

 注:\r\n在windows下是Enter键 

  • <command name> 可以是set, add, replace

  • set:存储。表示按照相应的<key>存储该数据,没有的时候增加,有的时候覆盖

  •  add:添加。表示按照相应的<key>添加该数据,但是如果该<key>已经存在则会操作失败

  •  replace:替换。表示按照相应的<key>替换数据,但是如果该<key>不存在则操作失败。

  • <key> 客户端需要保存数据的key

  • <flags> 是一个16位的无符号的整数(以十进制的方式表示)。该标志将和需要存储的数据一起存储,并在客户端get数据时返回。客户端可以将此标志用做特殊用途,此标志对服务器来说是不透明的。

  • <exptime> 为过期的时间。若为0表示存储的数据永远不过期(但可被服务器算法:LRU 等替换)。如果非0(unix时间或者距离此时的秒数),当过期后,服务器可以保证用户得不到该数据(以服务器时间为标准)。

  • <bytes> 需要存储的字节数,当用户希望存储空数据时<bytes>可以为0

  • <data block>需要存储的内容,输入完成后,最后客户端需要加上\r\n(直接点击Enter)作为结束标志。


Memcached数据示例

  • 替换数据:replace

set key1 1 100 3
abc
STORED
get key1
VALUE key1 1 3
abc
END
replace key1 1 100 4
abde
STORED
get key1
VALUE key1 1 4
abde
END
  • 删除数据:delete

delete key1 
DELETED
get key1
END

Memcached数据导出和导入

  • 导出:

 memcached-tool 127.0.0.1:11211 dump > data.txt

 cat data.txt

  • 导入:

 nc 127.0.0.1 11211 < data.txt

 若nc命令不存在,yum install nc

 注意:导出的数据是带有一个时间戳的,这个时间戳就是该条数据过期的时间点,如果当前时间已经超过该时间戳,那么是导入不进去的


PHP连接Memcached

先安装php的memcache扩展

cd /usr/local/src/

下载扩展包:wget  http://www.apelearn.com/bbs/data/attachment/forum/memcache-2.2.3.tgz (这个是PHP的扩展,并不是memcached)

解压:tar zxf memcache-2.2.3.tgz 

进入:cd memcache-2.2.3

生成config文件:/usr/local/php-fpm/bin/phpize

编译:./configure --with-php-config=/usr/local/php-fpm/bin/php-config

安装:make && make install

安装完后会有类似这样的提示:Installing shared extensions: /usr/local/php-fpm/lib/php/extensions/no-debug-non-zts-20131226/

然后修改php.ini:vim /usr/local/php-fpm/etc/php.ini

添加一行extension=memcache.so

image.png

检查:/usr/local/php/bin/php-fpm -m   模板有没有加载成功

image.png

PHP连接Memcached

下载测试脚本 

curl www.apelearn.com/study_v2/.memcache.txt > 1.php 2>/dev/null

1.php内容也可以参考https://coding.net/u/aminglinux/p/yuanke_centos7/git/blob/master/21NOSQL/1.php

执行脚本,测试一下:

/usr/local/php-fpm/bin/php 1.php

image.png

或者将1.php放到某个虚拟主机根目录下面,在浏览器访问,即可看到效果

最终可以看到数据如下:

 [0] => aaa

 [1] => bbb

 [2] => ccc

 [3] => ddd


Memcached中存储session

本实例是在lamp/lnmp环境下实现

如何指定session存储在memcached服务里边去

编辑配置文件:/usr/local/php-fpm/etc/php.ini

编辑php.ini,找到session相关的添加两行,默认是files(存储在本地磁盘里)

默认存储的位置/tmp/目录下

image.png

要想把他存到memcache里就把它注释掉;,

重启php-fpm服务:/etc/init.d/php-fpm restart

如果是apache添加方法:

httpd.conf中对应的虚拟主机中添加

php_value session.save_handler "memcache" ##指定存储类型

php_value session.save_path "tcp://192.168.0.9:11211"  ##指定memcached的服务器IP端口

如果是nginx方法如下:

php-fpm.conf对应的pool中添加

php_value[session.save_handler] = memcache##指定存储类型

php_value[session.save_path] = " tcp://192.168.0.9:11211 "##指定memcached的服务器IP

image.png

配置成功访问完之后是由后边蓝色框里边的值,可以进入memchahed里边去get一下这个值

telnet 127.0.0.1 11211

get i44nunao0g3o7vf2su0hnc5440

spacer.gifimage.png

实验:

下载一个php文件,存session的一个脚本

wget http://study.lishiming.net/.mem_se.txt

把它放到默认虚拟主机目录下

mv .mem_se.txt  /usr/local/apache2/htdocs/session.php

其中session.php内容可以参考https://coding.net/u/aminglinux/p/yuanke_centos7/git/blob/master/21NOSQL/session.php

用命令访问一下:curl localhost/session.php 这样就会存储一个session

类似于1443702394<br><br>1443702394<br><br>i44nunao0g3o7vf2su0hnc5440默认存储到/tmp/下

image.png

 


猜你喜欢

转载自blog.51cto.com/12922638/2551323