본문 바로가기 메뉴 바로가기

승밈

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

승밈

검색하기 폼
  • 분류 전체보기 (64)
    • Server (12)
    • Web (16)
    • Js (1)
    • Algorithm (14)
    • SQL (5)
    • 일상 (2)
    • AI (1)
    • CryptoBot (10)
    • 데이터 엔지니어링 (3)
  • 방명록

CDC (2)
Kafka Connect JDBC Source Connector, 스키마 변경 때마다 부서지는 이야기

지난 글에서 우리가 CDC 파이프라인을 JDBC source connector로 구축한 얘기를 했다. 동기화하면서 비정규화 변환까지 함께 처리할 수 있어서 우리 요구사항에 잘 맞는 도구였다.근데 솔직히 그 글에서 못 한 얘기가 있다. 이 도구의 가장 큰 약점은 스키마 변경에 약하다는 거다. 운영하면서 이거 때문에 진짜 자주 깨졌다. 오늘은 그 얘기를 좀 해보려고 한다.평일 오후 3시, 슬랙에 빨간 알림상황은 대충 이렇다. 평화롭게 동기화 잘 되던 평일 오후, 슬랙에 알림이 뜬다.🚨 connector user_activity_mart FAILED. config 백업 후 재시작 시도.뭐 알아서 재시작되겠지 싶다. 10분 주기로 FAILED 감지하면 자동 재시작하는 로직을 돌리고 있으니까.10분 뒤. 다시 ..

데이터 엔지니어링 2026. 5. 13. 23:01
JDBC Source Connector로 CDC 파이프라인을 구축한 이야기

서비스가 어느 정도 자리 잡고 나면 한 번씩 겪는 순간이 있다. 누가 분석 쿼리 하나 던지면 운영 DB가 픽픽 쓰러지기 시작하는 순간.우리도 그랬다. 비개발 직군에서 "이번 달 액티브 유저 수가 얼마야?", "이 콘텐츠 통계 좀 뽑아줘" 같은 요청이 늘어나면서 운영 DB CPU가 점점 천장을 찍기 시작했다. 처음엔 슬로우 쿼리만 잡으면 됐는데 어느 순간부터는 그것만으론 부족했다. 분석용 데이터를 따로 떼어내야 할 시점이 온 거다.그래서 CDC(Change Data Capture) 파이프라인을 구축하게 됐다. 보통 CDC 하면 Debezium을 떠올리는데, 우리는 Kafka Connect의 JDBC source connector로 갔다. 오늘은 왜 그렇게 골랐는지에 대한 얘기다.우리가 풀어야 했던 진짜 문..

데이터 엔지니어링 2026. 5. 13. 22:12
이전 1 다음
이전 다음
공지사항
  • GITHUB
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • GitHub
TAG
  • LLM비용오차
  • Kafka
  • CDC
  • AnthropicCaching
  • DataFramebool
  • 코인별전략배정
  • jdbc
  • 수수료슬리피지
  • P0P4우선순위
  • LLM비활성결정
  • 코인별손익분석
  • SlidingWindowTTL
  • 비용80%절감
  • LLM파라미터머지
  • 일경계처리
  • 데이터엔지니어링
  • 5중검증
  • Haiku4096토큰
  • Telegram알림
  • LLM동적호출
  • 트레일링스탑버그
  • 한달운영진단
  • BOJ #JS
  • CryptoBot
  • 일일주간월간스케줄러
  • 메이저화이트리스트
  • 데모모드
  • kafka connect
  • Page_DownPage_DownPage_Down
  • 코드자체감사
more
«   2026/05   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바