Kafka入门（一）

简介

Kafka是最初由Linkedin公司开发，Kafka是一个高吞吐的分布式消息队列，也是一个订阅/发布系统。常见可以用于web/nginx日志、访问日志，消息服务等等。

Kafka集群中每个节点都有一个被称为broker的实例，负责缓存数据。Kafka有两类客户端，Producer（消息生产者的）和Consumer（消息消费者）。Kafka中不同业务系统的消息可通过topic进行区分，每个消息都会被分区，用以分担消息读写负载，每个分区又可以有多个副本来防止数据丢失。消费者在具体消费某个topic消息时，指定起始偏移量。Kafka通过Zero-Copy、Exactly Once等技术语义保证了消息传输的实时、高效、可靠以及容错性。

安装配置

安装前准备：

准备3个节点。
3个节点安装好Zookeeper，见前面安装HBase文章。

1、下载安装包

Kafka官网下载安装包 http://kafka.apache.org/downloads.html，我们下载第二种（已经被编译过的），版本为：kafka_2.12-2.2.0

2、解压安装包

tar -zxvf kafka_2.12-2.2.0.tgz

3、修改配置文件

配置文件在/kafka_2.12-2.2.0/config/server.properties

broker.id=0 # broker的全局唯一编号，不能重复
zookeeper.connect=hadoop-master:2181,hadoop-slave:2181,hadoop-slave2:2181 # broker需要使用zookeeper保存meta数据

4、复制kafka_2.12-2.2.0到其它两个节点

scp -r kafka_2.12-2.2.0 fwj@hadoop-slave:~/
scp -r kafka_2.12-2.2.0 fwj@hadoop-slave2:~/

到这里基本就完成配置。

启动关闭

后台启动kafka：

nohup bin/kafka-server-start.sh config/server.properties &

启动提示Cannot allocate memory：修改bin/kafka-server-start.sh，改成KAFKA_HEAP_OPTS="-Xmx256M -Xms128M"
输入jps可以看到Kafka

关闭：

bin/kafka-server-stop.sh

测试

1、创建Topic

bin/kafka-topics.sh --create --topic topic_1 --zookeeper localhost:2
181 --partitions 1 --replication-factor 3

partitions：表示分区数
replication-factor：表示副本数

2、查看Topic

bin/kafka-topics.sh --list --zookeeper localhost:2181

3、模拟客户端发送消息

bin/kafka-console-producer.sh --topic topic_1 --broker-list hadoop-ma
ster:9092,hadoop-slave:9092,hadoop-slave2:9092

之后可以输入消息。

4、启动一个消费者

bin/kafka-console-consumer.sh --topic topic_1 --bootstrap-server loc
alhost:2181 --from-beginning

如果你上面的命令是在不同的终端运行，那么你可以在生产者终端输入消息然后在消费者终端看到。

kafka集群管理工具

为了简化开发者和服务工程师维护Kafka集群的工作，yahoo构建了一个叫做Kafka管理器的基于Web工具，叫做 Kafka Manager。这个管理工具可以很容易地发现分布在集群中的哪些topic分布不均匀，或者是分区在整个集群分布不均匀的的情况。它支持管理多个集群、选择副本、副本重新分配以及创建Topic。

1、下载kafka-manager

下载地址：https://github.com/yahoo/kafka-manager/releases

2、解压

3、修改配置

编辑配置文件application.conf

kafka-manager.zkhosts="hadoop-master:2181,hadoop-slave:2181,hadoop-slave2:2181"

4、编译

./sbt clean dist

sbt 默认下载库文件很慢, 还时不时被打断，我们可以在用户目录下创建 touch ~/.sbt/repositories, 填上阿里云的镜像 # vi ~/.sbt/repositories

[repositories]
#local
public: http://maven.aliyun.com/nexus/content/groups/public/#这个maven
typesafe:http://dl.bintray.com/typesafe/ivy-releases/ , [organization]/[module]/(scala_[scalaVersion]/)(sb
t_[sbtVersion]/)[revision]/[type]s/[artifact](-[classifier]).[ext], bootOnly#这个ivyivy-sbt-plugin:http://dl.bintray.com/sbt/sbt-plugin-releases/, [organization]/[module]/(scala_[scalaVersio
n]/)(sbt_[sbtVersion]/)[revision]/[type]s/[artifact](-[classifier]).[ext]#这个ivysonatype-oss-releases

sonatype-oss-snapshots

注意：后面不能有空格。

看到打印这个消息 Getting org.scala-sbt sbt 0.13.9 (this may take some time)... 就慢慢等吧。

命令执行完成后，在 target/universal 目录中会生产一个zip压缩包kafka-manager-1.3.3.7.zip。将压缩包拷贝到要部署的目录下解压。

编译失败的话可以下载已经编译好的kafka-manager，百度网盘地址: https://pan.baidu.com/s/1VIcqou8e8P55s65RCG_bCg

提取码: 8vvj

5、启动

bin/kafka-manager
kafka-manager 默认的端口是9000，可通过 -Dhttp.port，指定端口; -Dconfig.file=conf/application.conf指定配置文件:

nohup bin/kafka-manager -Dconfig.file=conf/application.conf -Dhttp.port=8080 &

6、查看Web UI

访问：http://192.168.241.140:8080，出现下面界面则启动成功。

简介

相关角色

Broker

Topic

Partition

Producer

Consumer

Consumer Group

Leader

Follower

安装配置

启动关闭

测试

kafka集群管理工具

参考

目录

友情链接