首页
技术小册
AIGC
面试刷题
技术文章
MAGENTO
云计算
视频课程
源码下载
PDF书籍
「涨薪秘籍」
登录
注册
Kafka简介
Kafka工作流程
Kafka存储机制
Kafka分区机制
Kafka生产者与消费者
Kafka ack机制
安装Kafka
Producer消息缓存模型
指定副本作为Leader
Kafka的ISR伸缩机制
acks和mir配置详解
Kafka主动修改分区Leader
Kafka向Server发起请求
当前位置:
首页>>
技术小册>>
kafka入门到实战
小册名称:kafka入门到实战
由于⽣产者⽣产的消息会不断追加到 log ⽂件末尾,为防⽌ log ⽂件过⼤导致数据定位效率低下,Kafka 采取了分⽚和索引机制。它将每个 Partition 分为多个 Segment,每个 Segment 对应两个⽂件:“.index” 索引⽂件和“.log” 数据⽂件。这种索引思想值得我们学习应用到平时的开发中。 ![](/uploads/images/20230710/68621337dd97dacfe2038878bedc391c.jpg) 这些⽂件位于同⼀⽂件下,该⽂件夹的命名规则为:topic 名-分区号。例如,test这个 topic 有三个分区,则其对应的⽂件夹为 test-0,test-1,test-2。 ```bash $ ls /tmp/kafka-logs/test-1 00000000000000009014.index 00000000000000009014.log 00000000000000009014.timeindex leader-epoch-checkpoint ``` index 和 log ⽂件以当前 Segment 的第⼀条消息的 Offset 命名。下图为 index ⽂件和 log ⽂件的结构示意图 ![](/uploads/images/20230710/e1adfb6dffdc3910913a45315d41d36f.jpg) “.index” ⽂件存储⼤量的索引信息,“.log” ⽂件存储⼤量的数据,索引⽂件中的元数据指向对应数据⽂件中 Message 的物理偏移量。 使用shell命令查看索引 ```bash ./kafka-dump-log.sh --files /tmp/kafka-logs/test-1/00000000000000000000.index ```
上一篇:
Kafka工作流程
下一篇:
Kafka分区机制
该分类下的相关小册推荐:
Kafka面试指南
Kafka核心技术与实战
Kafka核心源码解读
Kafka 原理与源码精讲
消息队列入门与进阶