카프카는 파티션 갯수를 늘리고 다시 줄일수 없다고 해서
토픽을 삭제 후 다시 생성하기 위해
kafka-topics.sh 를 통해(window에서 테스트를 해서 실제로는 .bat)
topic을 삭제 했습니다.
그런데. . kafka 브로커가 다운되더니.. 부팅되지 않는 문제가 발생하기 시작했습니다.
(부팅시 에러는 삭제한 토픽 파일을 읽는데 파일 권한에러..인데.. 전혀 접근 권한 문제 일으킬만한건 없습니다)
그래서 이런저런 글들을 살펴보며 겪은 부분들을 남깁니다...
먼저 delete.topic.enable=true
를 설정 하지 않아서 kafka-topics로 삭제했을때 마크만 된 상태였습니다.
그래서 위 설정을 해줬지만 마찬가지로 정상 부팅은 되지 않았습니다
(지금 생각해보니 설정을 하고 kafka-topics로 다시 삭제를 해볼껄 그랬나봅니다..)
(그런데.. 생각해보니 kafka-topics로 삭제할때 IP:PORT는 zookeeper쪽을 입력해줬는데.. 의미가 있나.. 싶네요)
두번째로 시도한건 recovery-point-offset-checkpoint, replication-offset-checkpoint 수정 입니다.
글을 보니 다른 브로커로 파티션 옮길때 수정하는 것으로 보이던데
이 방법을 시도해본 이유는
"나는 토픽을 삭제했는데 왜 해당 토픽 관련 에러가 나는것인가?, 해당 토픽 내용들을 다 삭제해야 겠다"
였습니다.
파일 구조는 recovery~~~나 replication~~ 이나 거의 유사 했고
0
59
__consumer_offsets 22 0
__consumer_offsets 30 0
__consumer_offsets 8 0
__consumer_offsets 21 0
__consumer_offsets 4 0
__consumer_offsets 27 0
__consumer_offsets 7 0
__consumer_offsets 9 0
__consumer_offsets 46 0
topic3 0 0
__consumer_offsets 25 0
__consumer_offsets 35 0
__consumer_offsets 41 0
__consumer_offsets 33 0
__consumer_offsets 23 0
__consumer_offsets 49 0
topic2 0 0
__consumer_offsets 47 0
__consumer_offsets 16 0
__consumer_offsets 28 0
__consumer_offsets 31 0
__consumer_offsets 36 0
__consumer_offsets 42 28
__consumer_offsets 3 0
__consumer_offsets 18 0
__consumer_offsets 37 0
bars 0 0
__consumer_offsets 15 0
이런식이였습니다, 자세한 정보를 추가로 찾아봐야겠지만
두번째 줄에 59는
두줄을 빼고 데이터부가 59라인이 있다는것을 말합니다.
(결국 마지막 데이터 줄은 61라인)
그래서 삭제할 토픽의 데이터의 offsets 디렉토리 정보와 토픽 정보를 라인을 삭제하고 두번째 라인에서 값을 빼줬습니다.
그후, 부팅해보니 수정했던 replication-offset-checkpoint 가 다시 삭제했던 내용들을 복원해놓고 있었습니다
(대체 토픽정보를 어디서 복원을 하는거지.. 레플리카 구성한것도 아니고..)
마지막 세번째, 파일들은 대략 다 열어 봤고 마지막 의심가는건 zookeeper밖에 없었습니다
zookeeper 데이터를 찾아보니 /brokers/topics 에 삭제했던 topic 정보가 남아있었습니다
rmr /brokers/topics/대상토픽
으로 삭제하고
replication-offset-checkpoint를 수정 후
broker를 띄우니 잘 뜨는것을 확인했습니다.
지금은 토픽을 그냥 삭제하는데 발생한 이슈였지만.. 운영중에 갑작이 이렇게 부팅이 안되는 문제가 발생하면.....;;;;
kafka를 사용하는 방법도 더 해봐야겠지만
내부 파일 구조 체계들을 알아둬야 이런 난감한 상황에 잘 대처 할 수 있을것 같습니다