1.NoSQL数据库简介
1.1 技术发展1.2 出现NOSQL的原因1.3 NoSQL介绍 2.Redis概述安装
2.1 应用场景2.2 Redis安装
2.2.1 下载Redis包2.2.2 安装gcc环境2.2.3 安装2.3.4 启动方式
2.3.4.1 前台启动2.3.4.2 后台启动(推荐) 2.3 Redis相关知识 3.常用五大数据结构
3.1 Redis键操作3.2 Redis字符串(String)
3.2.1 常用命令3.2.2 数据结构 3.3 Redis列表(List)
3.3.1 常用命令3.3.2 数据结构 3.4 Redis集合(Set)
3.4.1 常用命令3.4.2 数据结构 3.5 Redis哈希(Hash)
3.5.1 常用命令3.5.2 数据结构 3.6 Redis 有序集合(Zset)
3.6.1 常用命令3.6.2 数据结构
1.NoSQL数据库简介 1.1 技术发展技术的分类
- 解决功能性问题:Java、JSP、RDBMS、Tomcat、HTML、Linux、JDBC、SVN解决扩展性的问题:Struts、Spring、SpringMVC、Hibernate、Mybatis解决性能的问题:NoSQL、Java线程、Hadoop、Nginx、MQ、ElasticSearch
在之前的web1.0时代,一台web服务和一台数据库足以服务用户。但是到了web2.0时代,用户量急剧增加,一台服务器扛不住了,对网站的服务器进行优化,采用多服务器负载均衡来进行服务,但是负载均衡存在一个问题,他每次指向的可能不是同一台服务器,那么,当前服务器可能没有存放当前用户的session,造成后续操作失败。
那么session应该存在哪? 1.存在cookie里? 不安全且网络负担效率低 2.存在文件服务器或者数据库里 存在大量的IO效率问题 3. session复制 session数据冗余,节点越多浪费越大 4.缓存数据库 完全在内存中,速度块,数据结构简单(很香) 但有了NoSQL我们可以将Session存储在缓存数据库中 每次用户的请求过来 先到NoSQL数据库中查询 由于NoSQL数据库运行在内存中 因此查询速度快 且KV的结构简单易用
还有一个原因:
用户量激增,DB的压力也随之增大。以通过读写分离 分库分表等操作来 但这些操作都会在一定程度上破坏业务逻辑 当加入NoSQL数据库时 将访问频繁的数据存储其中 每次可以先访问NoSQL数据库 其运行在内存中的特性可以有效减轻IO压力
1.3 NoSQL介绍NoSQL(NoSQL = Not only SQL),意思是不仅仅是SQL,泛指非关系型数据库。
NoSQL 不依赖业务逻辑方式存储,而以简单的key-value模式存储。因此大大的增加了数据库的扩展能力。
不遵循SQL标准不支持ACID远超于SQL的性能
实用场景:
对数据高并发的读写海量数据的读写对数据高可扩展性的
NOSQL不适用的场景
需要事务支持基于sql的结构化查询存储用不着sql的和用了sql也不行的情况,请考虑用NoSql 2.Redis概述安装
2.1 应用场景Redis是一个开源的key-value存储系统。
Redis支持value类型丰富:String,list,set,hash,zset(有序集合)
都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,且这些操作都是原子性的。
Redis支持不同方式的排序
数据缓存在内存中
Redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件
实现了master-slave(主从)同步。
配合关系型数据库做高速缓存
高频次、热门访问的数据、降低数据库IO分布式架构,做session共享
多样的数据结构存储持久化数据
最新N个数据 — 通过List实现按自然时间排序的数据排行榜,TopN — 利用zset(有序集合)时效性的数据,例如手机验证码 — Expire过期计数器,秒杀 — 原子性,自增方法INCR、DECR去除大量重复数据 — set集合构建队列 — 利用list集合发布订阅消息系统 — pub/sub模式 2.2 Redis安装
准备一个linux系统,Redis是在linux上安装的
2.2.1 下载Redis包登录Redis官网 http://redis.io
点击下载。
2.2.2 安装gcc环境2.2.3 安装apt-get install gdb
进入超级用户模式 sudo gcc --version 出现版本号安装完成。
1.找到下载的redis-6.2.6.tar.gz 2.解压文件:tar -zxvf redis-6.2.6.tar.gz 3.解压完成进入目录:cd redis-6.2.6 4.执行make命令 5.跳过make test 继续执行: make install 6.redis 默认安装到: /usr/local/bin redis-benchmark:性能测试工具,可以在自己本子运行,看看自己本子性能如何 redis-check-aof:修复有问题的AOF文件 redis-check-dump:修复有问题的dump.rdb文件 redis-sentinel:Redis集群使用 redis-server:Redis服务器启动命令 redis-cli:客户端,操作入口2.3.4 启动方式 2.3.4.1 前台启动
cd到/usr/local/bin目录下
命令: cd /usr/local/bin
前台启动,命令行窗口不能关闭,否则服务器停止
2.3.4.2 后台启动(推荐)1.备份redis.conf cp 刚才解压redis的文件夹/redis.conf /etc 2.将复制到的redis.conf中的daemonize no改为yes 3.进入/usr/local/bin 执行 redis-server /etc/redis.conf 4.客户端连接: redis-cli 5.客户端关闭:redis-cli shutdown2.3 Redis相关知识
默认16个数据库,类似数组下标从0开始,初始默认使用0号库使用命令 select 来切换数据库。如: select 8统一密码管理,所有库同样密码dbsize查看当前数据库的key的数量flushdb清空当前库 flushall通杀全部库
Redis是单线程+多路IO复用技术,即单线程轮询处理任务处理完callback
多路复用是指使用一个线程来检查多个文件描述符(Socket)的就绪状态,比如调用select和poll函数,传入多个文件描述符,如果有一个文件描述符就绪,则返回,否则阻塞直到超时。得到就绪状态后进行真正的操作可以在同一个线程里执行,也可以启动线程执行(比如使用线程池)
3.常用五大数据结构 3.1 Redis键操作key * - 查看当前库中的所有key exist key - 判断某个key是否存在 type key - key的类型 del key - 删除指定key unlink key - 根据value选择非阻塞删除(仅将keys从keyspace元数据中删除,真正的删除会在后续异步操作。) expire key 10 - 设定key的过期时间,单位是秒 ttl key - 查看key还有多长时间过期 (-1表示永不过期,-2表示已过期) select 0~15 - 命令切换数据库 dbsize - 查看当前数据库的key数量 flushdb - 清空数据库 flushall - 通杀所有库3.2 Redis字符串(String)
String是Redis最基本的类型,一个key对应一个value。
String类型是二进制安全的。意味着Redis的string可以包含任何数据。比如jpg图片或者序列化的对象。一个Redis中字符串value最多可以是512M.
3.2.1 常用命令set3.2.2 数据结构添加键值对,重复覆盖 get 查询对应键值 append 将给定的 追加到原值的末尾 strlen 获得值的长度 setnx 只有在 key不存在时,设置 key 的值 incr 将 key中储存的数字值增1.只能对数字值操作,如果为空,新增值为1 decr 将key中储存的数字值减1,只能对数字值操作,如果为空,新增值为-1 incrby / decrby 将key中储存的数字值增减。自定义步长。 mset 同时设置一个或多个 key-value对 mget 同时获取一个或多个 value msetnx 同时设置一个或多个 key-value 对,当且仅当所有给定 key 都不存在。 getrange <起始位置><结束位置> 获得值的范围,类似java中的substring setrange <起始位置> 用 覆写 所储存的字符串值,从<起始位置>开始(索引从0开始)。 setex <过期时间> 设置键值的同时,设置过期时间,单位秒。 getset 以新换旧,设置了新值同时获得旧值。
String的数据结构为简单动态字符串(Simple Dynamic String,缩写SDS)。是可以修改的字符串,内部结构实现上类似于Java的ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配.
如图中所示,内部为当前字符串实际分配的空间capacity一般要高于实际字符串长度len。当字符串长度小于1M时,扩容都是加倍现有的空间,如果超过1M,扩容时一次只会多扩1M的空间。需要注意的是字符串最大长度为512M。
3.3 Redis列表(List)单键多值,Redis 列表是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)。它的底层实际是个双向链表,对两端的操作性能很高,通过索引下标的操作中间的节点性能会较差
3.3.1 常用命令1,lpush/rpush k1 v1 v2 v3 从左边/右边插入K及一个或多个V 2,lpop/rpop key 从key对应的列表左边/右边弹出一个值 值在键在 值空键亡 3,rpoplpush k1 k2 从k1列表右边弹出一个值 插到k2列表左边 4,lrange key start end 按照索引下标从key对应的列表从左到右取出元素 0 -1代表所有元素 0作为下标表示左1 -1作为下标表示右1 5,lindex key index 按照索引下标获取元素(从左到右) 6,llen key 获得列表长度 7. linsert3.3.2 数据结构before 在 的后面插入 插入值 8. lrem 从左边删除n个value(从左到右) 9. lset 将列表key下标为index的值替换成value
List的数据结构为快速链表quickList。
首先在列表元素较少的情况下会使用一块连续的内存存储,这个结构是ziplist,也即是压缩列表。它将所有的元素紧挨着一起存储,分配的是一块连续的内存。
当数据量比较多的时候才会改成quicklist。因为普通的链表需要的附加指针空间太大,会比较浪费空间。比如这个列表里存的只是int类型的数据,结构上还需要两个额外的指针prev和next。
Redis将链表和ziplist结合起来组成了quicklist。也就是将多个ziplist使用双向指针串起来使用。这样既满足了快速的插入删除性能,又不会出现太大的空间冗余。
3.4 Redis集合(Set)Redis set对外提供的功能与list类似是一个列表的功能,特殊之处在于set是可以自动排重的,当你需要存储一个列表数据,又不希望出现重复数据时,set是一个很好的选择,并且set提供了判断某个成员是否在一个set集合内的重要接口,这个也是list所不能提供的。
Redis的Set是string类型的无序集合。它底层其实是一个value为null的hash表,所以添加,删除,查找的复杂度都是O(1)。
3.4.1 常用命令sadd3.4.2 数据结构将一个或多个 member 元素加入到集合 key 中,已经存在的 member 元素将被忽略 smembers 取出该集合的所有值。 sismember 判断集合 是否为含有该 值,有1,没有0 scard 返回该集合的元素个数。 srem 删除集合中的某个元素。 spop 随机从该集合中吐出一个值。 srandmember 随机从该集合中取出n个值。不会从集合中删除 smove value 把集合中一个值从一个集合移动到另一个集合 sinter 返回两个集合的交集元素。 sunion 返回两个集合的并集元素。 sdiff 返回两个集合的差集元素(key1中的,不包含key2中的)
Set数据结构是dict字典,字典是用哈希表实现的。
Java中HashSet的内部实现使用的是HashMap,只不过所有的value都指向同一个对象。Redis的set结构也是一样,它的内部也使用hash结构,所有的value都指向同一个内部值。
3.5 Redis哈希(Hash)Redis hash是一个 string类型的field和value的映射表,hash特别适合用于存储对象。类似Java里面的Map
hset3.5.2 数据结构给 集合中的 键赋值 hget 从 集合 取出 value hmset ... 批量设置hash的值 hexists 查看哈希表key中,给定域 field 是否存在。 hkeys 列出该hash集合的所有field hvals 列出该hash集合的所有value hincrby 为哈希表 key 中的域 field 的值加上增量 1 -1 hsetnx 将哈希表 key 中的域 field 的值设置为 value ,当且仅当域 field 不存在 .
Hash类型对应的数据结构是两种:ziplist(压缩列表),hashtable(哈希表)。当field-value长度较短且个数较少时,使用ziplist,否则使用hashtable。
3.6 Redis 有序集合(Zset)Redis有序集合zset与普通集合set非常相似,是一个没有重复元素的字符串集合。
不同之处是有序集合的每个成员都关联了一个评分(score),这个评分(score)被用来按照从最低分到最高分的方式排序集合中的成员。集合的成员是唯一的,但是评分可以是重复了 。
因为元素是有序的, 所以你也可以很快的根据评分(score)或者次序(position)来获取一个范围的元素。
3.6.1 常用命令zadd3.6.2 数据结构将一个或多个 member 元素及其 score 值加入到有序集 key 当中。例如: zadd k1 100 java 200 c++ zrange [WITHSCORES] 返回有序集 key 中,下标在 之间的元素带WITHSCORES,可以让分数一起和值返回到结果集。 zrangebyscore key minmax [withscores] [limit offset count] 返回有序集 key 中,所有 score 值介于 min 和 max 之间(包括等于 min 或 max )的成员。有序集成员按 score 值递增(从小到大)次序排列。 zrevrangebyscore key maxmin [withscores] [limit offset count] 同上,改为从大到小排列。 zincrby 为元素的score加上增量 zrem 删除该集合下,指定值的元素 zcount 统计该集合,分数区间内的元素个数 zrank 返回该值在集合中的排名,从0开始。
zset为有序(有限score排序,score相同则元素字典序),自动去重的集合数据类型,其底层实现为 字典(dict) + 跳表(skiplist),当数据比较少的时候用ziplist编码结构存储。
同时满足以下两个条件采用ziplist存储:
有序集合保存的元素数量小于默认值128个有序集合保存的所有元素的长度小于默认值64字节
ziplist存储方式
当ziplist作为zset的底层存储结构时候,每个集合元素使用两个紧挨在一起的压缩列表节点来保存,第一个节点保存元素的成员,第二个元素保存元素的分值
字典(dict) + 跳表(skiplist)的存储方式
zset底层的存储结构包括ziplist或skiplist,在同时满足以下两个条件的时候使用ziplist,其他时候使用skiplist,两个条件如下:
有序集合保存的元素数量小于默认值128个有序集合保存的所有元素的长度小于默认值64字节
跳表的数据结构
从第2层开始,1节点比51节点小,向后比较。21节点比51节点小,继续向后比较,后面就是NULL了,所以从21节点向下到第1层。
在第1层,41节点比51节点小,继续向后,61节点比51节点大,所以从41向下
在第0层,51节点为要查找的节点,节点被找到,共查找4次。
而如果是链表,需要查询6次
跳表查询效率较高且结构更简单



