NoSQL介绍
什么是NoSQL
非关系型数据库就是NoSQL,关系型数据库代表MySQL
对于关系型数据库来说,是需要把数据存储到库、表、行、字段里,查询的时候根据条件一行一行地去匹配,当量非常大的时候就很耗费时间和资源,因为数据存储在磁盘里,需要根据你的查询条件从磁盘里去检索
NoSQL数据库存储原理非常简单(典型的数据类型为k-v,一个键一个值),不存在繁杂的关系链,没有什么行啊字段啊这么复杂的数据结构,比如mysql查询的时候,需要找到对应的库、表(通常是多个表)以及字段。
NoSQL数据库不存表与表之间的关联
NoSQL数据可以存储在内存里,查询速度非常快
NoSQL在性能表现上虽然能优于关系型数据库,但是它并不能完全替代关系型数据库
NoSQL因为没有复杂的数据结构,扩展非常容易,支持分布式
2. 常见NoSQL数据库
k-v形式的:memcached、redis 适合储存用户信息,比如会话(Session:用户信息)、配置文件、参数、购物车等等。这些信息一般都和ID(键)挂钩,这种情景下键值数据库是个很好的选择。
文档数据库:mongodb 将数据以文档的形式储存。每个文档都是一系列数据项的集合。每个数据项都有一个名称与对应的值,值既可以是简单的数据类型,如字符串、数字和日期等;也可以是复杂的类型,如有序列表和关联对象。数据存储的最小单位是文档,同一个表中存储的文档属性可以是不同的,数据可以使用XML、JSON或者JSONB等多种形式存储。
列存储:Hbase
图 :Neo4J、Infinite Graph、OrientDB
扩展:
列举常见的关系型数据库和非关系型都有那些?
关系型数据库:
Oracle、DB2、Microsoft SQL Server、Microsoft Access、MySQL
非关系型数据库:
NoSql、Cloudant、MongoDb、redis、HBase
两种数据库之间的区别:
关系型数据库
关系型数据库的特性
1、关系型数据库,是指采用了关系模型来组织数据的数据库;
2、关系型数据库的最大特点就是事务的一致性;
3、简单来说,关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。
关系型数据库的优点
1、容易理解:二维表结构是非常贴近逻辑世界一个概念,关系模型相对网状、层次等其他模型来说更容易理解;
2、使用方便:通用的SQL语言使得操作关系型数据库非常方便;
3、易于维护:丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大减低了数据冗余和数据不一致的概率;
4、支持SQL,可用于复杂的查询。
关系型数据库的缺点
1、为了维护一致性所付出的巨大代价就是其读写性能比较差;
2、固定的表结构;
3、高并发读写需求;
4、海量数据的高效率读写;
非关系型数据库
非关系型数据库的特性
1、使用键值对存储数据;
2、分布式;
3、一般不支持ACID特性;
4、非关系型数据库严格上不是一种数据库,应该是一种数据结构化存储方法的集合。
非关系型数据库的优点
1、无需经过sql层的解析,读写性能很高;
2、基于键值对,数据没有耦合性,容易扩展;
3、存储数据的格式:nosql的存储格式是key,value形式、文档形式、图片形式等等,文档形式、图片形式等等,而关系型数据库则只支持基础类型。
非关系型数据库的缺点
1、不提供sql支持,学习和使用成本较高;
2、无事务处理,附加功能bi和报表等支持也不好;
Memcached介绍
在lamp或者lamp架构中memcached用来缓存一些数据,如论坛帖子,访问量,在线人数...
Memcached是国外社区网站LiveJournal团队开发,目的是为了通过缓存数据库查询结果,减少数据库访问次数,从而提高动态web站点性能。
官方站点 http://www.memcached.org/
特性
数据结构简单(k-v),数据存放在内存里
多线程(当你的服务器cpu很多的时候,明显会发现memcached是很快的)
基于c/s架构,协议简单(意味着你要启动一个服务端,客户端去链接这个服务端)
基于libevent的事件处理(nginx也是基于libevent)
自主内存存储处理(slab allowcation)
数据过期方式有两种:Lazy Expiration 和 LRU
缺点:不支持落地,不支持持久化,一但重新启动服务器或者重启memcached服务,缓存的数据就会丢失
解决办法:重启之前先把数据落地保存到磁盘里,然后重启之后在把数据恢复回去
Memcached的数据流向
正常流向:比如现在有一个lnmp架构的论坛,正常来说php会跟数据库打交道,然后nginx调用php进行数据交互,比如去查一个帖子内容,首先用户发起请求给nginx,nginx把这个php的请求交给了php的脚本,也就是交给了php-fpm这个服务了,php-fpm这个服务解析完这个php脚本发现是要查询这个帖子的,然后到数据库去查询数据,查询完之后最后由nginx反馈给用户
Slab Allocation的原理
将分配的内存分割成各种尺寸的块(chunk), 并把尺寸相同的块分成组(chunk的集合),每个chunk集合被称为slab。
Memcached的内存分配以Page为单位,Page默认值为1M,可以在启动时通过-I参数来指定。
Slab是由多个Page组成的,Page按照指定大小切割成多个chunk。
Slab allocation
Growth factor
Memcached在启动时通过-f选项可以指定 Growth Factor因子。该值控制chunk大小的差异。默认值为1.25。
通过memcached-tool命令查看指定Memcached实例的不同slab状态,可以看到各Item所占大小(chunk大小)差距为1.25
命令:# memcached-tool 127.0.0.1:11211 display
Memcached的数据过期方式
Lazy Expiration
在创建一个k-v的时候,就需要指定一个过期时间(时间戳),是由用户来决定的
Memcached 内部不会监视记录是否过期,而是在get时查看记录的时间戳,检查记录是否过期。这种技术被称为lazy(惰性)expiration。因此,Memcached不会在过期监视上耗费CPU时间。
LRU
也就是说我们在memcache里边存储了很多数据,但是有的数据经常用而有些基本存进去就没用过,这些就会标记为危险的,当空间不够了这些经常不用的就会被覆盖掉
Memcached会优先使用已超时的记录的空间,但即使如此,也会发生追加新记录时空间不足的情况,此时就要使用名为Least Recently Used(LRU)机制来分配空间。顾名思义,这是删除“最近最少使用”的记录的机制。因此,当内存空间不足时(无法从slab class获取到新的空间时),就从最近未被使用的记录中搜索,并将其空间分配给新的记录。从缓存的实用角度来看,该模型十分理想。
Memcached安装
安装:yum install -y memcached libmemcached libevent memcached是基于libevent,所以安装me之前要先安装libevent,rpm -qa libevent看看有没有安装没有安装,一般在安装memcached的时候他自动会安装上。
启动:systemctl start memcached
[root@awei-01 ~]# ps aux|grep memcached memcach+ 8484 0.0 0.0 326028 1204 ? Ssl 18:07 0:00 /usr/bin/memcached -u memcached -p 11211 -m 64 -c 1024 root 8491 0.0 0.0 112656 996 pts/0 S+ 18:07 0:00 grep --color=auto memcached
-u:指定系统用户 -p:监听端口 -m:分配内存大小(单位:M兆) -c:最大并发数
这些参数都可以更改,但是它没有配置文件,更改他有两种方案,一种是在启动时在命令行加上参数,还有一种是更改这个文件
3. 配置文件:vim /etc/sysconfig/memcached 可以配置参数
PORT="11211" 端口 USER="memcached" 用户 MAXCONN="1024" 最大连接数 CACHESIZE="64" 内存 OPTIONS="" 其他
比如加上监听的ip,可以把OPTIONS="" 改为:OPTIONS="127.0.0.1"
-m指定memcached分配内存
-c指定最大并发数
-u指定运行memcached服务的用户
查看参数用法:memcached -h
查看Memcached运行状态
方法1:自带的查看状态的工具:memcached-tool
格式:memcached-tool IP:端口 stats
用法memcached-tool 127.0.0.1:11211 stats
主要看:get_hits/curr_items=命中率 (就是说比如你有一些帖子缓存在me里边了,用户访问时是否通过me访问的)
connection_structures 11 curr_connections 10 curr_items 0 decr_hits 0 decr_misses 0 delete_hits 0 delete_misses 0 evicted_unfetched 0 evictions 0 expired_unfetched 0 get_hits 0 get_misses 0 hash_bytes 524288
方法2:命令nc,需要安装nc工具:yum install -y nc
查看这个命令是由哪个包安装的:rpm -qf `which nc`
[root@awei-01 ~]# rpm -qf `which nc` nmap-ncat-6.40-19.el7.x86_64
格式:echo stats |nc IP 端口
命令用法:echo stats |nc 127.0.0.1 11211
[root@awei-01 ~]# echo stats |nc 127.0.0.1 11211 STAT pid 8484 STAT uptime 1327 STAT time 1599474551 STAT version 1.4.15 STAT libevent 2.0.21-stable STAT pointer_size 64 STAT rusage_user 0.013403 STAT rusage_system 0.040211 STAT curr_connections 10 STAT total_connections 12 STAT connection_structures 11
方法3:
rpm -qa libmemcached用来查看一个包,若安装libmemcached后,可以使用命令
格式:memstat --servers=IP:端口
用法:memstat --servers=127.0.0.1:11211
[root@awei-01 ~]# memstat --servers=127.0.0.1:11211 Server: 127.0.0.1 (11211) pid: 8484 uptime: 1406 time: 1599474630 version: 1.4.15 libevent: 2.0.21-stable pointer_size: 64 rusage_user: 0.014232 rusage_system: 0.042697 curr_connections: 10 total_connections: 13 connection_structures: 11 reserved_fds: 20 cmd_get: 0 cmd_set: 0
Memcached命令行
进入memcached命令:telnet
用法:telnet 127.0.0.1 11211
[root@awei-01 ~]# telnet 127.0.0.1 11211 Trying 127.0.0.1... Connected to 127.0.0.1. Escape character is '^]'. ##输入命令就可以了
存数据命令:set
用法:set key2 0 30 2
查看存储数据命令:get
用法:get key2
get key2 VALUE key2 0 2 12 END
Memcached语法规则
<command name> <key> <flags> <exptime> <bytes>\r\n <data block>\r\n
注:\r\n在windows下是Enter键
<command name> 可以是set, add, replace
set:存储。表示按照相应的<key>存储该数据,没有的时候增加,有的时候覆盖
add:添加。表示按照相应的<key>添加该数据,但是如果该<key>已经存在则会操作失败
replace:替换。表示按照相应的<key>替换数据,但是如果该<key>不存在则操作失败。
<key> 客户端需要保存数据的key
<flags> 是一个16位的无符号的整数(以十进制的方式表示)。该标志将和需要存储的数据一起存储,并在客户端get数据时返回。客户端可以将此标志用做特殊用途,此标志对服务器来说是不透明的。
<exptime> 为过期的时间。若为0表示存储的数据永远不过期(但可被服务器算法:LRU 等替换)。如果非0(unix时间或者距离此时的秒数),当过期后,服务器可以保证用户得不到该数据(以服务器时间为标准)。
<bytes> 需要存储的字节数,当用户希望存储空数据时<bytes>可以为0
<data block>需要存储的内容,输入完成后,最后客户端需要加上\r\n(直接点击Enter)作为结束标志。
Memcached数据示例
替换数据:replace
set key1 1 100 3 abc STORED get key1 VALUE key1 1 3 abc END replace key1 1 100 4 abde STORED get key1 VALUE key1 1 4 abde END
删除数据:delete
delete key1 DELETED get key1 END
Memcached数据导出和导入
导出:
memcached-tool 127.0.0.1:11211 dump > data.txt
cat data.txt
导入:
nc 127.0.0.1 11211 < data.txt
若nc命令不存在,yum install nc
注意:导出的数据是带有一个时间戳的,这个时间戳就是该条数据过期的时间点,如果当前时间已经超过该时间戳,那么是导入不进去的
PHP连接Memcached
先安装php的memcache扩展
cd /usr/local/src/
下载扩展包:wget http://www.apelearn.com/bbs/data/attachment/forum/memcache-2.2.3.tgz (这个是PHP的扩展,并不是memcached)
解压:tar zxf memcache-2.2.3.tgz
进入:cd memcache-2.2.3
生成config文件:/usr/local/php-fpm/bin/phpize
编译:./configure --with-php-config=/usr/local/php-fpm/bin/php-config
安装:make && make install
安装完后会有类似这样的提示:Installing shared extensions: /usr/local/php-fpm/lib/php/extensions/no-debug-non-zts-20131226/
然后修改php.ini:vim /usr/local/php-fpm/etc/php.ini
添加一行extension=memcache.so
检查:/usr/local/php/bin/php-fpm -m 模板有没有加载成功
PHP连接Memcached
下载测试脚本
curl www.apelearn.com/study_v2/.memcache.txt > 1.php 2>/dev/null
1.php内容也可以参考https://coding.net/u/aminglinux/p/yuanke_centos7/git/blob/master/21NOSQL/1.php
执行脚本,测试一下:
/usr/local/php-fpm/bin/php 1.php
或者将1.php放到某个虚拟主机根目录下面,在浏览器访问,即可看到效果
最终可以看到数据如下:
[0] => aaa
[1] => bbb
[2] => ccc
[3] => ddd
Memcached中存储session
本实例是在lamp/lnmp环境下实现
如何指定session存储在memcached服务里边去
编辑配置文件:/usr/local/php-fpm/etc/php.ini
编辑php.ini,找到session相关的添加两行,默认是files(存储在本地磁盘里)
默认存储的位置/tmp/目录下
要想把他存到memcache里就把它注释掉;,
重启php-fpm服务:/etc/init.d/php-fpm restart
如果是apache添加方法:
httpd.conf中对应的虚拟主机中添加
php_value session.save_handler "memcache" ##指定存储类型
php_value session.save_path "tcp://192.168.0.9:11211" ##指定memcached的服务器IP端口
如果是nginx方法如下:
php-fpm.conf对应的pool中添加
php_value[session.save_handler] = memcache##指定存储类型
php_value[session.save_path] = " tcp://192.168.0.9:11211 "##指定memcached的服务器IP
配置成功访问完之后是由后边蓝色框里边的值,可以进入memchahed里边去get一下这个值
telnet 127.0.0.1 11211
get i44nunao0g3o7vf2su0hnc5440
实验:
下载一个php文件,存session的一个脚本
wget http://study.lishiming.net/.mem_se.txt
把它放到默认虚拟主机目录下
mv .mem_se.txt /usr/local/apache2/htdocs/session.php
其中session.php内容可以参考https://coding.net/u/aminglinux/p/yuanke_centos7/git/blob/master/21NOSQL/session.php
用命令访问一下:curl localhost/session.php 这样就会存储一个session
类似于1443702394<br><br>1443702394<br><br>i44nunao0g3o7vf2su0hnc5440默认存储到/tmp/下