Zookeeper这玩意儿真的挺神的,它就像是分布式系统里的“大管家”,专门处理那些复杂又容易出错的协调工作。我看了它的介绍,觉得它不仅帮Hadoop和Hbase这些大佬级软件撑场面,还能搞定配置维护和分布式同步,对咱们开发者来说简直是省心神器。它把难搞的服务封装得简单易用,性能还稳,虽然目前主要支持Java和C语言,但这也够用了。
安装过程其实不难,下载最新版解压后,关键是把配置文件改对名,还得新建data和log文件夹来存数据和日志,不然容易出问题。启动的时候双击那两个脚本就行,看到控制台有反应就说明成了,整个流程挺顺畅的。
原理部分我最感兴趣的是选举Leader和数据同步,它用zxid来选老大,确保大多数机器都服气,这机制挺靠谱的。软件特点里,znode像文件系统一样能存数据,还能设置临时节点,断连就消失,配合Watcher监听事件,处理起来很灵活。举个搜索引擎的例子,它能自动感知服务器状态,主备切换无缝衔接,这在实际项目里太实用了,感觉用它能避免很多分布式里的坑,真心推荐试试!
zookeeper是一个开源的分布式应用程序协调服务,是Google的chubby一个开源的实现,是Hadoop和Hbase的重要组成部件。除了能够为用户的分布式应用提供一致性的服务,还能够进行配置维护、域名服务、分布式同步等等功能,对于开发人员来说,这款软件是一个非常高效可靠的服务软件。zookeeper的目标是为了封装好复杂易出错的关键服务,将简单易用的借口和性能高效、功能稳定的系统提供给用户,软件拥有两个接口,Java和C语言,也就是说目前还是只有这两个开发语言的用户使用的较多。
zookeeper安装
1、下载完最新zookeeper 3.9.1稳定版本后,解压下载的压缩包。
如下图所示:

2、解压后进入conf文件夹下面,把zoo_sample.cfg复制一份并改名为zoo.cfg。
如下图所示:

备注:zoo.cfg是zookeeper配置文件入口,必须修改为zoo.cfg.
3、在根目录下新建一个data文件夹和一个log文件夹,分别存储数据和日志。

4、进入conf文件夹下面,修改zoo.cfg配置文件,把dataDir=/tmp/zookeeper修改成zookeeper安装目录所在的data文件夹,以及dataLogDir修改为log文件夹。
如下图所示:
zookeeper启动流程
启动zookeeper服务端
进入bin文件夹,双击点击zkServer.cmd启动zookeeper。
如下图所示:

控制台显示:

启动zookeeper客户端
双击zkCli.cmd启动客户端,出现:

表示启动成功了。
zookeeper原理
1、选举Leader。
2、同步数据。
3、选举Leader过程中算法有很多,但要达到的选举标准是一致的。
4、Leader要具有最高的zxid。
5、集群中大多数的机器得到响应并follow选出的Leader。
软件特点
在Zookeeper中,znode是一个跟Unix文件系统路径相似的节点,可以往这个节点存储或获取数据。如果在创建znode时Flag设置为EPHEMERAL,那么当创建这个znode的节点和Zookeeper失去连接后,这个znode将不再存在在Zookeeper里,Zookeeper使用Watcher察觉事件信息。当客户端接收到事件信息,比如连接超时、节点数据改变、子节点改变,可以调用相应的行为来处理数据。Zookeeper的Wiki页面展示了如何使用Zookeeper来处理事件通知,队列,优先队列,锁,共享锁,可撤销的共享锁,两阶段提交。
那么Zookeeper能做什么事情呢,简单的例子:假设我们有20个搜索引擎的服务器(每个负责总索引中的一部分的搜索任务)和一个总服务器(负责向这20个搜索引擎的服务器发出搜索请求并合并结果集),一个备用的总服务器(负责当总服务器宕机时替换总服务器),一个web的cgi(向总服务器发出搜索请求)。搜索引擎的服务器中的15个服务器提供搜索服务,5个服务器正在生成索引。这20个搜索引擎的服务器经常要让正在提供搜索服务的服务器停止提供服务开始生成索引,或生成索引的服务器已经把索引生成完成可以提供搜索服务了。使用Zookeeper可以保证总服务器自动感知有多少提供搜索引擎的服务器并向这些服务器发出搜索请求,当总服务器宕机时自动启用备用的总服务器。
点击星星用来评分