장애 복구

본 장에서는 ZetaData의 각 구성 요소에 대한 장애 복구 방법을 설명합니다.

SSVR 인스턴스 장애

SSVR 인스턴스에 장애가 발생하면 TAS 인스턴스는 해당 디스크의 상태를 자동으로 감지해 I/O Fail-over를 수행합니다. 각 SSVR 인스턴스를 1:1로 FAILGROUP을 구성했고, 디스크 스페이스의 중복 레벨이 NORMAL 이상이라면 DB에서 수행되는 모든 부하는 하나의 SSVR 인스턴스의 장애와 관계 없이 정상적으로 동작합니다.

SSVR 인스턴스가 장애 상황으로부터 복구되면 TAS 인스턴스는 SSVR 인스턴스의 상태를 자동으로 감지해 해당 SSVR 인스턴스에 속한 모든 디스크들에 대해 동기화를 수행합니다. SSVR 인스턴스의 장애가 복구 불가능한 경우라면 디스크 스페이스로부터 해당 SSVR 인스턴스를 제거할 수 있습니다. 이는 TAS 인스턴스에 접속해 제거 대상 SSVR 인스턴스에 해당하는 FAILGROUP을 삭제함으로써 가능합니다.

아래는 장애가 발생한 SSVR 인스턴스가 FG0이라는 FAILGROUP일 때 TAS 디스크 스페이스로부터 제거하는 예입니다.

$ tbsql sys/tibero@tas0
SQL> alter diskspace DS0 drop disks in failgroup FG0 rebalance wait;

제거하려는 모든 디스크의 데이터를 저장할 만큼 남은 디스크 스페이스에 충분한 여유 공간이 있어야 합니다.

새로 구성한 SSVR 인스턴스를 추가하려면 TAS의 ALTER DISKSPACE 구문을 이용해 FAILGROUP을 추가합니다.

아래는 새로 구성한 SSVR 인스턴스의 그리드 디스크를 디스크 스페이스의 FG0이라는 FAILGROUP에 추가하는 예입니다.

$ tbsql sys/tibero@tas0
SQL> alter diskspace DS0 add failgroup FG0
          disk '-10.10.10.11/GD0' name DISK0 size 64G, 
               '-10.10.10.11/GD1' name DISK1 size 64G
          rebalance wait;

참고

플래시 디바이스의 장애는 복구 불가능한 장애로 처리해야 합니다.

TAC 인스턴스 장애

TAC 인스턴스에 장애가 발생한 경우에는 Tibero Active Cluster의 Fail-over 기능을 통해 세션이 복구됩니다. 자세한 내용은 "Tibero 관리자 안내서"를 참고합니다.

Last updated 1 month ago