서비스 중단을 최소화하려면 로드밸런서 이중화는 필수입니다. 단일 장비가 고장 나더라도 트래픽은 정상 장비로 즉시 전환되어야 하며 사용자는 장애를 체감하면 안 됩니다. 이 글에서는 L4 로드밸런서의 대표적 이중화 방식인 액티브 스탠바이와 액티브 액티브 구성을 비교하고 설계 기준과 실제 구성 절차를 정리합니다. 세션 유지와 상태 동기화 같은 핵심 포인트도 함께 다룹니다. 실무에서 바로 적용 가능한 예시와 점검 목록을 포함했습니다.
1. 이중화 목적과 기본 원리
이중화의 목적은 단일 장애 지점을 없애고 가용성을 높이는 것입니다. 두 대 이상 장비를 하나의 논리 장비처럼 동작시키고 장애가 발생하면 역할을 교체합니다. 전환은 자동으로 이루어져야 하며 전환 시간은 서비스에 영향을 주지 않을 정도로 짧아야 합니다. VIP는 항상 하나 이상 장비에서 활성 상태를 유지해야 합니다. 세션 정보와 상태 체크 결과는 필요 시 동기화하여 전환 시 세션 손실을 줄입니다.
2. 이중화 방식 비교
구분 | Active Standby | Active Active |
---|---|---|
자원 활용 | 주 장비에 집중 예비 장비는 대기 | 두 장비 모두 분산 처리 |
구성 난이도 | 낮음 | 높음 |
전환 복잡도 | 단순 VIP 이동 | 세션 공유 경로 일치 필요 |
세션 지속성 | 세션 동기화 없으면 일부 손실 가능 | 세션 분산 구조에 따라 조정 필요 |
적합 환경 | 중소 규모 와 단순 정책 | 대규모 와 높은 처리량 |
3. 설계 체크리스트
- VIP 운영 방식 단일 VIP 이동 또는 VIP 분할
- 세션 유지 필요 여부와 방식 IP 해시 또는 쿠키 기반은 상위 계층 고려
- 상태 체크 주기와 전환 임계치
- 상태 동기화 채널 전용 링크 필요
- 업스트림 라우팅 정합 ECMP 또는 정적 경로
- 다운스트림 서버 게이트웨이 정합 ARP 캐시 갱신 지연 고려
4. Active Standby 구성 절차 예시
액티브 스탠바이는 한 대가 모든 VIP를 운영하고 다른 한 대는 대기합니다. 전환은 HSRP 계열 또는 장비 고유의 가상 MAC 이동으로 수행합니다. 아래 예시는 HSRP 방식으로 VIP를 이동시키는 흐름입니다.
Switch# configure terminal
!
! 업링크와 헬스 의존 경로 추적
Switch(config)# track 1 interface gig0/1 line-protocol
!
! 액티브 장비에서 HSRP 설정
Switch(config)# interface vlan 30
Switch(config-if)# ip address 203.0.113.2 255.255.255.0
Switch(config-if)# standby 10 ip 203.0.113.10
Switch(config-if)# standby 10 priority 120
Switch(config-if)# standby 10 preempt
Switch(config-if)# standby 10 track 1 decrement 30
!
! 스탠바이 장비에서 HSRP 설정
Switch(config)# interface vlan 30
Switch(config-if)# ip address 203.0.113.3 255.255.255.0
Switch(config-if)# standby 10 ip 203.0.113.10
Switch(config-if)# standby 10 priority 100
Switch(config-if)# standby 10 preempt
!
! 서버팜과 프로브는 두 장비에 동일 구성
Switch(config)# ip slb serverfarm SF-WEB
Switch(config-slb-sfarm)# predictor roundrobin
Switch(config)# ip slb probe PROBE-TCP80 tcp
Switch(config-slb-probe)# port 80
Switch(config-slb-probe)# interval 5
Switch(config-slb-probe)# timeout 3
Switch(config-slb-probe)# faildetect 3
Switch(config)# ip slb real 192.168.10.11
Switch(config-slb-real)# inservice
Switch(config-slb-real)# bind PROBE-TCP80
Switch(config)# ip slb real 192.168.10.12
Switch(config-slb-real)# inservice
Switch(config-slb-real)# bind PROBE-TCP80
Switch(config)# ip slb vserver VS-WEB
Switch(config-slb-vserver)# vip address 203.0.113.10
Switch(config-slb-vserver)# tcp port 80
Switch(config-slb-vserver)# serverfarm SF-WEB
이 구성은 액티브 장비가 우선순위가 높아 VIP를 보유합니다. 업링크 추적이 실패하면 우선순위가 감소되어 스탠바이 장비로 VIP가 이동합니다. 두 장비의 서버팜과 프로브 구성은 동일하게 유지합니다.
5. Active Active 구성 절차 예시
액티브 액티브는 두 장비가 동시에 트래픽을 처리합니다. 방법은 VIP를 나누거나 동일 VIP를 두 경로로 노출하는 방식이 있습니다. 동일 VIP를 운영하는 경우 업스트림 라우팅에서 ECMP를 사용합니다. 아래는 VIP 분할 예시입니다.
Switch# configure terminal
!
! 장비 A
Switch(config)# ip slb vserver VS-WEB-A
Switch(config-slb-vserver)# vip address 203.0.113.10
Switch(config-slb-vserver)# tcp port 80
Switch(config-slb-vserver)# serverfarm SF-WEB-A
!
! 장비 B
Switch(config)# ip slb vserver VS-WEB-B
Switch(config-slb-vserver)# vip address 203.0.113.11
Switch(config-slb-vserver)# tcp port 80
Switch(config-slb-vserver)# serverfarm SF-WEB-B
VIP 분할은 각 VIP를 DNS 또는 상위 라우팅에서 균등하게 노출합니다. 동일 VIP를 두 장비에서 운영하려면 업스트림 라우터에 정적 경로 두 개를 같은 비용으로 설정하거나 라우팅 프로토콜을 사용해 경로를 광고합니다. 상태 불량 시 경로를 철회하도록 연동하면 전환 품질이 향상됩니다.
6. 세션 유지와 상태 동기화
세션 유지가 필요한 서비스에서는 상태 동기화가 중요합니다. 액티브 스탠바이에서는 활성 장비의 세션 테이블을 대기 장비로 동기화하여 전환 시 세션 손실을 줄입니다. 액티브 액티브에서는 각 장비의 세션이 분산되므로 동기화 채널의 성능과 지연을 반드시 고려합니다. 전용 인터페이스를 사용하고 전송 간격과 큐 크기를 점검합니다.
Switch# configure terminal
Switch(config)# slb state-sync enable
Switch(config)# slb state-sync peer 10.0.0.2
Switch(config)# slb state-sync interval 100
장비에 따라 명령은 다를 수 있으나 개념은 동일합니다. 동기화 대상은 세션 정보와 상태 체크 결과가 기본이며 필요 시 카운터와 통계도 포함합니다.
7. 장애 시나리오와 전환 정책
- 장비 전체 장애 전환 즉시 수행
- 업링크 장애 추적 기반 전환
- 서버팜 전부 비정상 시 VIP 유지 여부 선택
- 전환 이후 ARP 갱신 지연 처리 그라티투어스 ARP 전송
Switch# configure terminal
Switch(config)# interface vlan 30
Switch(config-if)# standby 10 redirect 203.0.113.10
Switch# clear arp
Switch# ping 203.0.113.10
8. 모니터링과 점검 명령어
Switch# show standby brief
Switch# show ip slb vserver
Switch# show ip slb serverfarm
Switch# show ip slb probe
Switch# show logging | include standby
Switch# show interfaces status
전환 전후로 VIP 응답과 서버팜 상태를 확인합니다. 로그에는 전환 이유와 타임스탬프가 남아야 합니다.
9. 테스트 계획 수립
- 계획된 점검 창 내 전환 리허설
- 업링크 케이블 분리 테스트
- 프로세스 강제 중단 테스트
- ARP 갱신 시간 확인과 사용자 영향 측정
- 세션 유지 서비스의 로그인 유지 여부 점검
10. 트러블슈팅 체크리스트
증상 | 가능 원인 | 확인 포인트 | 조치 |
---|---|---|---|
전환 지연 발생 | 추적 조건 완화 전환 임계 과대 | track 상태와 임계값 | 감지 간격 단축 임계 조정 |
전환 후 연결 불가 | ARP 캐시 갱신 지연 상위 라우팅 미정합 | 상위 라우터 ARP 테이블 경로 광고 상태 | 그라티투어스 ARP 전송 경로 동기화 점검 |
세션 손실 과다 | 상태 동기화 미구성 또는 대역폭 부족 | 동기화 통계와 지연 | 전용 링크 확보 간격 조정 |
양측 활성 충돌 | 우선순위 설정 오류 프리엠프트 미설정 | 우선순위 값과 프리엠프트 | 우선순위 재설정 프리엠프트 활성화 |
11. 운영 팁
- 서버팜 구성과 프로브는 두 장비에서 항상 동일하게 유지
- 상태 동기화는 전용 포트 사용과 접근 제어 적용
- 전환 이력과 평균 전환 시간 기록과 보고 자동화
- 배포 시간대에는 전환 임계치를 일시 강화하여 불필요한 변동 억제
- 정기 리허설을 통해 문서와 설정의 실제 동작을 검증
이중화의 핵심은 단순성과 일관성입니다. 액티브 스탠바이는 구성과 운영이 단순하여 범용 환경에 적합합니다. 액티브 액티브는 자원 활용이 우수하나 라우팅 정합과 세션 설계를 선행해야 합니다. 세션 유지 요구와 트래픽 패턴을 기준으로 방식을 선택하시기 바랍니다. 본문 예시와 점검표를 기준으로 환경에 맞는 이중화 설계를 완성하시길 바랍니다.