分布式session的几个问题

lee1473336489 2013-07-20 10:59:57
1. 如何保证一个sessionID是唯一的,用uuid已经被否定了。

2.把session的信息保存在缓存里面,如何准时的清楚过期的session信息。
...全文
991 22 打赏 收藏 转发到动态 举报
写回复
用AI写文章
22 条回复
切换为时间正序
请发表友善的回复…
发表回复
闲云之然 2013-08-16
  • 打赏
  • 举报
回复
引用
把session信息保存在cookie里面,安全吗?
cookie中只保存session ID。这个session ID可以用算法产生,比如GUID就够用了,不放心的话,可以用自己的算法算出一个具长的Base64字符串(比如256个字符),不过也别太长,超过cookie的长度限制就挂了。 在TLS算法的HTTPS的支持下,cookie是安全的。 服务器端,可以把session ID和其他session数据保存在数据库中或者分布式缓存如memcached中。如果保存在数据库中,自己可以做一个background进程来监控session是否过期,如果过期,就从数据库中删除。如果保存在memcached中就简单了,直接给session记录设置一个过期时间。当然,用户如果在session过期之前有动作,就重置过期时间。
MiceRice 2013-08-16
  • 打赏
  • 举报
回复
引用 楼主 lee1473336489 的回复:
1. 如何保证一个sessionID是唯一的,用uuid已经被否定了。 2.把session的信息保存在缓存里面,如何准时的清楚过期的session信息。
这两个问题如果你使用支持集群的应用中间件,比如Tomcat或Weblogic等,只要正确配置了集群,都会被自动解决掉。所以,楼主先简单说说为啥要需要这么干?有什么特殊场景?这样才好针对性给出建议。
lee1473336489 2013-08-16
  • 打赏
  • 举报
回复
引用 21 楼 ldh911 的回复:
一致性Hash算法,只能尽量减少cache集群中的机器数量增减的时候,cache的数据能进行最少重建。 但其实只要cache集群的server数量有变化,必然产生数据命中的问题(也就是部分缓存访问不到了) 这里: http://www.gosoa.com.cn/%E5%85%B3%E4%BA%8Ememcache%E5%88%86%E5%B8%83%E5%BC%8F%E4%B8%80%E8%87%B4%E6%80%A7hash 公司有项目做过,但我没有实际去配置。 “每次向缓存里丢东西,都会做持久化,也算是重新初始化Session吧。” —— 这个看起来不合理,每次写缓存都做持久化,降低了性能。不过如果更新频度极低的话,倒也可以接受。
差不多,命中率最高达百分之92。。真的达不到百分之百。 因为是做钱支付的,所以信息丢不得。
MiceRice 2013-08-16
  • 打赏
  • 举报
回复
一致性Hash算法,只能尽量减少cache集群中的机器数量增减的时候,cache的数据能进行最少重建。 但其实只要cache集群的server数量有变化,必然产生数据命中的问题(也就是部分缓存访问不到了) 这里: http://www.gosoa.com.cn/%E5%85%B3%E4%BA%8Ememcache%E5%88%86%E5%B8%83%E5%BC%8F%E4%B8%80%E8%87%B4%E6%80%A7hash 公司有项目做过,但我没有实际去配置。 “每次向缓存里丢东西,都会做持久化,也算是重新初始化Session吧。” —— 这个看起来不合理,每次写缓存都做持久化,降低了性能。不过如果更新频度极低的话,倒也可以接受。
lee1473336489 2013-08-16
  • 打赏
  • 举报
回复
引用 19 楼 ldh911 的回复:
单点登录自身只是解决身份验证,但使用了单点登录服务的应用服务器,要能自动初始化所有Session信息。 MemCache本身是支持动态增删点的,但是显然一般不会选择业务高峰期来动态增删节点(除非是宕机了),否则会面临缓存失效问题。 不知道你说的去数据库查是指什么意思,如果是指重新初始化Session的话,基本上这个是标准做法了。比如Session中原来存储了 用户姓名、权限之类的数据,如果Cache中没有,就重新执行登录过程中初始化Session的那个函数以重建这个Cache。
单点登录还没开始做,马上会做的吧。。 MemCache集群使用的一致性hash算法,如何支持呢?你以前做过吗?现在这个问题很头痛。。 每次向缓存里丢东西,都会做持久化,也算是重新初始化Session吧。
MiceRice 2013-08-16
  • 打赏
  • 举报
回复
单点登录自身只是解决身份验证,但使用了单点登录服务的应用服务器,要能自动初始化所有Session信息。 MemCache本身是支持动态增删点的,但是显然一般不会选择业务高峰期来动态增删节点(除非是宕机了),否则会面临缓存失效问题。 不知道你说的去数据库查是指什么意思,如果是指重新初始化Session的话,基本上这个是标准做法了。比如Session中原来存储了 用户姓名、权限之类的数据,如果Cache中没有,就重新执行登录过程中初始化Session的那个函数以重建这个Cache。
lee1473336489 2013-08-16
  • 打赏
  • 举报
回复
引用 17 楼 ldh911 的回复:
[quote=引用 16 楼 lee1473336489 的回复:] 访问服务器是非阻塞的,所以每次访问的服务器可能不一样,需要把session的信息存到缓存里面,所有需要一个sessionId来标识
那么我理解你的意思是:基于某种考虑,不想使用中间件自身所支持的集群能力。 那么另一个问题是负载均衡分发是否打算做“会话粘着”,不过看你的意思似乎也不打算做。 也就是总的来说,整个集群环境希望能做到彻底的云化。 那么刨开SessionID不说,因为这个总归有策略生成,无非是你是否打算在SessionID中包含一些语义。 你主要需要解决的问题是会话信息怎么管理,几个建议: 1、尽量减少会话信息规模,最精简的就是只剩 SessionID + UserID; 2、会话信息严禁存储业务过程状态,也就是仅仅是为了两个界面之间的数据衔接就用Sesion去存; 3、支持集群的缓存用于存储SessionID,这个成熟组件也不少,可以用MemCache或者有钱直接用内存数据库。 4、容错,缓存之所以叫做缓存,就是它可能把信息丢掉(甚至因为其中某节点故障);所以要有机制可以只凭借SessionID,就能把会话中的状态信息恢复过来;如果还觉得蒙的话,想想单点登录中的自动登录过程。[/quote] 单点登录是用验证服务器吧,和我这不一样。。。。 是用的MemCache,但是问题不少,容错是这样的,MemCache+数据库,如何MemCache节点宕机了,就去数据库里面查。。不过还是问题很多的,做不到动态增删MemCache节点。
MiceRice 2013-08-16
  • 打赏
  • 举报
回复
引用 16 楼 lee1473336489 的回复:
访问服务器是非阻塞的,所以每次访问的服务器可能不一样,需要把session的信息存到缓存里面,所有需要一个sessionId来标识
那么我理解你的意思是:基于某种考虑,不想使用中间件自身所支持的集群能力。 那么另一个问题是负载均衡分发是否打算做“会话粘着”,不过看你的意思似乎也不打算做。 也就是总的来说,整个集群环境希望能做到彻底的云化。 那么刨开SessionID不说,因为这个总归有策略生成,无非是你是否打算在SessionID中包含一些语义。 你主要需要解决的问题是会话信息怎么管理,几个建议: 1、尽量减少会话信息规模,最精简的就是只剩 SessionID + UserID; 2、会话信息严禁存储业务过程状态,也就是仅仅是为了两个界面之间的数据衔接就用Sesion去存; 3、支持集群的缓存用于存储SessionID,这个成熟组件也不少,可以用MemCache或者有钱直接用内存数据库。 4、容错,缓存之所以叫做缓存,就是它可能把信息丢掉(甚至因为其中某节点故障);所以要有机制可以只凭借SessionID,就能把会话中的状态信息恢复过来;如果还觉得蒙的话,想想单点登录中的自动登录过程。
lee1473336489 2013-08-16
  • 打赏
  • 举报
回复
引用 14 楼 ldh911 的回复:
[quote=引用 楼主 lee1473336489 的回复:] 1. 如何保证一个sessionID是唯一的,用uuid已经被否定了。 2.把session的信息保存在缓存里面,如何准时的清楚过期的session信息。
这两个问题如果你使用支持集群的应用中间件,比如Tomcat或Weblogic等,只要正确配置了集群,都会被自动解决掉。所以,楼主先简单说说为啥要需要这么干?有什么特殊场景?这样才好针对性给出建议。[/quote] 访问服务器是非阻塞的,所以每次访问的服务器可能不一样,需要把session的信息存到缓存里面,所有需要一个sessionId来标识
lee1473336489 2013-08-16
  • 打赏
  • 举报
回复
引用 13 楼 pkudzy 的回复:
引用
把session信息保存在cookie里面,安全吗?
cookie中只保存session ID。这个session ID可以用算法产生,比如GUID就够用了,不放心的话,可以用自己的算法算出一个具长的Base64字符串(比如256个字符),不过也别太长,超过cookie的长度限制就挂了。 在TLS算法的HTTPS的支持下,cookie是安全的。 服务器端,可以把session ID和其他session数据保存在数据库中或者分布式缓存如memcached中。如果保存在数据库中,自己可以做一个background进程来监控session是否过期,如果过期,就从数据库中删除。如果保存在memcached中就简单了,直接给session记录设置一个过期时间。当然,用户如果在session过期之前有动作,就重置过期时间。
高,你说的和支付宝的分布式session一模一样。session是解决了,但是memcached还有很多问题,你知道如何保证在动态添加缓存节点的情况下,命中率达到百分之百吗?
jakey188 2013-07-25
  • 打赏
  • 举报
回复
引用 10 楼 lee1473336489 的回复:
[quote=引用 9 楼 kittying 的回复:] 楼主可以试试MemcachedProviders
对,就是用的memcache。。。它的客户端提供了控制过期的API。。[/quote] memcache客户端的实现有好几种,memcacheddotnet这个太久没更新不过提供的api是最全的,EnyimMemcached是memcacheddotnet的强化版本优化了算法,建议分布式缓存采用这个,共享session就用MemcachedProviders 用起来都比较简单
翱翔的苍鹰 2013-07-24
  • 打赏
  • 举报
回复
我觉还是用cookie吧,通过cookie可以保存session,你可以设置cookie的时间。
lee1473336489 2013-07-24
  • 打赏
  • 举报
回复
引用 9 楼 kittying 的回复:
楼主可以试试MemcachedProviders
对,就是用的memcache。。。它的客户端提供了控制过期的API。。
jakey188 2013-07-24
  • 打赏
  • 举报
回复
楼主可以试试MemcachedProviders
lee1473336489 2013-07-23
  • 打赏
  • 举报
回复
引用 7 楼 lasereyes 的回复:
用数据库来存session, 将自增ID做session id
读硬盘太慢了,高并发有瓶颈... 自增的id不安全,容易被session攻击
secondfirstlife 2013-07-23
  • 打赏
  • 举报
回复
只保存sessionID
lasereyes 2013-07-23
  • 打赏
  • 举报
回复
用数据库来存session, 将自增ID做session id
lee1473336489 2013-07-22
  • 打赏
  • 举报
回复
引用 4 楼 secondfirstlife 的回复:
session不是有时间的么,一般默认是半小时,不过可以配置,不管你放在哪里,session过期了,就会删除的,再访问的话就会创建新的session,除非你把session在用户登录的时候保存在数据库里边,然后再获取session,当然也是在session还存活的状态下,你说可能是你把创建的session保存下来,但怎么保证他不过期,还有一种方式吧session保存在cookie里边,我只是知道关闭浏览器,在此打开网页就不能获取到原来的session了,除非用上边的两种方式保存过sessionId
把session信息保存在cookie里面,安全吗?
secondfirstlife 2013-07-22
  • 打赏
  • 举报
回复
session不是有时间的么,一般默认是半小时,不过可以配置,不管你放在哪里,session过期了,就会删除的,再访问的话就会创建新的session,除非你把session在用户登录的时候保存在数据库里边,然后再获取session,当然也是在session还存活的状态下,你说可能是你把创建的session保存下来,但怎么保证他不过期,还有一种方式吧session保存在cookie里边,我只是知道关闭浏览器,在此打开网页就不能获取到原来的session了,除非用上边的两种方式保存过sessionId
道秋adol 2013-07-20
  • 打赏
  • 举报
回复
加载更多回复(2)
FourInOne(中文名字“四不像”)是一个四合一分布式计算框架,在写这个框架之前,我也看了老外写的其他开源框架,也对分布式计算进行了长时间的思考,当我们把复杂的hadoop当作一门学科学习时,似乎忘记了我们想解决问题的初衷:我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算,把更多的cpu和内存利用上,来解决我们数量大和计算复杂的问题,当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷,为什么一切会那么复杂,我觉的自己可以写一个更简单的东西,它不需要过度设计,只需要看上去更酷一点,更小巧一点,功能更强一点。于是我将自己对分布式的理解融入到这个框架中,考虑到底层实现技术的相似性,我将Hadoop,Zookeeper,MQ,分布式缓存四大主要的分布式计算功能合为一个框架内,对复杂的分布式计算应用进行了大量简化和归纳。 首先,对分布式协同方面,它实现了Zookeeper所有的功能,并且做了很多改进,包括简化Zookeeper的树型结构,用domain/node两层结构取代,简化Watch回调多线程等待编程模型,用更直观的容易保证业务逻辑完整性的内容变化事件以及状态轮循取代,Zookeeper只能存储信息不大于1M的内容,FourInOne超过1M的内容会以内存隐射文件存储,增强了它的存储功能,简化了Zookeeper的ACL权限功能,用更为程序员熟悉rw风格取代,简化了Zookeeper的临时节点和序列节点等类型,取代为在创建节点时是否指定保持心跳,心跳断掉时节点会自动删除。FourInOne是高可用的,没有单点问题,可以有任意多个复本,它的复制不是定时而是基于内容变更复制,有更高的性能,FourInOne实现了领导者选举算法(但不是Paxos),在领导者服务器宕机情况下,会自动不延时的将请求切换到备份服务器上,选举出新的领导者进行服务,这个过程中,心跳节点仍然能保持健壮的稳定性,迅速跟新的领导者保持心跳连接。基于FourInOne可以轻松实现分布式配置信息,集群管理,故障节点检测,分布式锁,以及淘宝configserver等等协同功能。 其次, FourInOne可以提供完整的分布式缓存功能。如果对一个中小型的互联网或者企业应用,仅仅利用domain/node进行k/v的存储即可,因为domain/node都是内存操作而且读写锁分离,同时拥有复制备份,完全满足缓存的高性能与可靠性。对于大型互联网应用,高峰访问量上百万的并发读写吞吐量,会超出单台服务器的承受力,FourInOne提供了fa?ade的解决方案去解决大集群的分布式缓存,利用硬件负载均衡路由到一组fa?ade服务器上,fa?ade可以自动为缓存内容生成key,并根据key准确找到散落在背后的缓存集群的具体哪台服务器,当缓存服务器的容量到达限制时,可以自由扩容,不需要成倍扩容,因为fa?ade的算法会登记服务器扩容时间版本,并将key智能的跟这个时间匹配,这样在扩容后还能准确找到之前分配到的服务器。另外,基于FourInOne可以轻松实现web应用的session功能,只需要将生成的key写入客户端cookie即可。 FourInOne对于分布式大数据量并行计算的解决方案不同于复杂的hadoop,它不像hadoop的中间计算结果依赖于hdfs,它使用不同于map/reduce的全新设计模式解决问题。FourInOne有“包工头”,“农民工”,“手工仓库”的几个核心概念。“农民工”为一个计算节点,可以部署在多个机器,它由开发者自由实现,计算时,“农民工”到“手工仓库”获取输入资源,再将计算结果放回“手工仓库”返回给“包工头”。“包工头”负责承包一个复杂项目的一部分,可以理解为一个分配任务和调度程序,它由开发者自己实现,开发者可以自由控制调度过程,比如按照“农民工”的数量将源数据切分成多少份,然后远程分配给“农民工”节点进行计算处理,它处理完的中间结果数据不限制保存在hdfs里,而可以自由控制保存在分布式缓存、数据库、分布式文件里。如果需要结果数据的合并,可以新建立一个“包工头”的任务分配进行完成。多个“包工头”之间进行责任链式处理。总的来说,是将大数据的复杂分布式计算,设计为一个链式的多“包工头”环节去处理,每个环节包括利用多台“农民工”机器进行并行计算,无论是拆分计算任务还是合并结果,都可以设计为一个单独的“包工头”环节。这样做的好处是,开发者有更大能力去深入控制并行计算的过程,去保持使用并行计算实现业务逻辑的完整性,而且对各种不同类型的并行计算场景也能灵活处理,不会因为某些特殊场景被map/reduce的框架限制住思维,并且链式的每个环节也方便进行监控过程。 FourInOne也可以当成简单的mq来使用,将domain视为mq队

25,985

社区成员

发帖
与我相关
我的任务
社区描述
高性能WEB开发
社区管理员
  • 高性能WEB开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧