Consul 설정 방법

Tier: Premium, Ultimate
Offering: Self-Managed

Consul 클러스터에는 서버 및 클라이언트 에이전트가 포함됩니다. 서버는 자체 노드에서 실행되고 클라이언트는 서버와 통신하는 다른 노드에서 실행됩니다.

GitLab Premium에는 관리할 수 있는 Consul 서비스 네트워킹 솔루션이 번들로 포함되어 있습니다.

전제 조건

Consul을 구성하기 전에:

  1. 참고 아키텍처 문서를 검토하여 가져야 할 Consul 서버 노드 수를 결정합니다.
  2. 필요한 경우, 방화벽에서 적절한 포트가 열려 있는지 확인합니다.

Consul 노드 구성

각 Consul 서버 노드에서:

  1. 기본 플랫폼을 선택하여 GitLab을 설치하는 지침을 따릅니다. 그러나 EXTERNAL_URL 값을 제공하지 않습니다.
  2. /etc/gitlab/gitlab.rb를 편집하고 다음을 추가합니다. retry_join 섹션에 표시된 값을 대체합니다. 아래 예시에서는 IP로 표시된 두 노드와 FQDN으로 표시된 하나의 노드를 사용할 수 있습니다.

    # Consul 이외의 모든 컴포넌트 비활성화
    roles ['consul_role']
       
    # Consul 노드: FQDN 또는 IP, 공백으로 구분
    consul['configuration'] = {
      server: true,
      retry_join: %w(10.10.10.1 consul1.gitlab.example.com 10.10.10.2)
    }
       
    # 자동 마이그레이션 비활성화
    gitlab_rails['auto_migrate'] = false
    
  3. 변경 사항이 적용되도록 GitLab을 다시 구성합니다.
  4. 다음 명령을 실행하여 Consul이 올바르게 구성되었는지 확인하고 모든 서버 노드가 통신하는 지 확인합니다.

    sudo /opt/gitlab/embedded/bin/consul members
    

    출력은 다음과 유사해야 합니다.

    Node                 Address               Status  Type    Build  Protocol  DC
    CONSUL_NODE_ONE      XXX.XXX.XXX.YYY:8301  alive   server  0.9.2  2         gitlab_consul
    CONSUL_NODE_TWO      XXX.XXX.XXX.YYY:8301  alive   server  0.9.2  2         gitlab_consul
    CONSUL_NODE_THREE    XXX.XXX.XXX.YYY:8301  alive   server  0.9.2  2         gitlab_consul
    

    결과에 alive가 아닌 상태의 노드가 표시되거나 세 노드 중 하나라도 누락된 경우 문제 해결 섹션을 참조하세요.

Consul 노드 업그레이드

Consul 노드를 업그레이드하려면 GitLab 패키지를 업그레이드합니다.

노드는:

  • Linux 패키지를 업그레이드하기 전에 건강한 클러스터의 멤버여야 합니다.
  • 한 번에 한 노드씩 업그레이드되어야 합니다.

각 노드에서 다음 명령을 실행하여 클러스터의 기존 건강 상태를 확인합니다. 클러스터가 건강한 경우 빈 배열이 반환됩니다.

curl "http://127.0.0.1:8500/v1/health/state/critical"

Consul 버전이 변경되면 gitlab-ctl reconfigure의 끝에 Consul을 새 버전으로 사용하려면 Consul을 다시 시작해야 한다는 알림이 표시됩니다.

Consul을 한 번에 한 노드씩 다시 시작합니다.

sudo gitlab-ctl restart consul

Consul 노드는 회로 프로토콜을 사용하여 통신합니다. 현재 리더 노드가 오프라인 상태인 경우 리더 선출이 이루어져야 합니다. 동시에 많은 수의 노드가 오프라인 상태인 경우 클러스터가 쿼럼을 잃고 보증된 합의 실패로 인해 리더를 선출하지 못할 수 있습니다.

업그레이드 후 클러스터가 회복되지 않는 경우 문제 해결을 참조하세요. 장애 복구가 특히 유용할 수 있습니다.

GitLab은 Consul을 통해 다시 생성 가능한 일시적 데이터만 저장합니다. 번들로 제공된 Consul이 GitLab 외에 다른 프로세스에서 사용되지 않았다면 바닥부터 클러스터를 다시 생성할 수 있습니다.

Consul 문제 해결

다음은 문제 해결 시 수행해야 할 일부 작업입니다. 오류 로그를 보려면 다음 명령을 실행합니다.

sudo gitlab-ctl tail consul

클러스터 멤버십 확인

클러스터에 속한 노드를 확인하려면 클러스터의 멤버 중 하나에서 다음을 실행합니다.

sudo /opt/gitlab/embedded/bin/consul members

출력은 다음과 유사해야 합니다.

Node            Address               Status  Type    Build  Protocol  DC
consul-b        XX.XX.X.Y:8301        alive   server  0.9.0  2         gitlab_consul
consul-c        XX.XX.X.Y:8301        alive   server  0.9.0  2         gitlab_consul
consul-c        XX.XX.X.Y:8301        alive   server  0.9.0  2         gitlab_consul
db-a            XX.XX.X.Y:8301        alive   client  0.9.0  2         gitlab_consul
db-b            XX.XX.X.Y:8301        alive   client  0.9.0  2         gitlab_consul

이상적으로 모든 노드의 상태alive여야 합니다.

Consul 재시작

Consul을 재시작해야 하는 경우 쿼럼을 유지하기 위해 제어된 방식으로 수행해야 합니다. 쿼럼이 손실된 경우 클러스터를 회복하려면 Consul 장애 복구 프로세스를 따릅니다.

안전을 위해 클러스터가 손상되지 않도록 단일 노드에서 Consul을 다시 시작하는 것이 좋습니다. 대규모 클러스터의 경우 여러 노드를 동시에 다시 시작할 수도 있습니다. 동시에 재시작할 수 있는 오류 수에 대한 정보는 Consul 합의 문서를 참조하세요.

Consul을 다시 시작하려면:

sudo gitlab-ctl restart consul

Consul 노드간 통신 불가능

기본적으로 Consul은 0.0.0.0바인드를 시도하지만 다른 Consul 노드가 해당 주소를 통해이 노드에 통신할 수 있도록 첫 번째 사설 IP 주소를 광고합니다. 다른 노드가 이 주소에서 이 노드와 통신할 수 없는 경우 클러스터에 실패한 상태가 됩니다.

이 문제에 직면하면 gitlab-ctl tail consul에서 다음과 유사한 메시지가 출력됩니다.

2017-09-25_19:53:39.90821     2017/09/25 19:53:39 [WARN] raft: no known peers, aborting election
2017-09-25_19:53:41.74356     2017/09/25 19:53:41 [ERR] agent: failed to sync remote state: No cluster leader

이를 해결하려면:

  1. 각 노드에서 다른 모든 노드가이 노드에 도달할 수있는 주소를 선택합니다.
  2. /etc/gitlab/gitlab.rb를 업데이트합니다.

    consul['configuration'] = {
      ...
      bind_addr: 'IP 주소'
    }
    
  3. GitLab을 다시 구성합니다.

    gitlab-ctl reconfigure
    

에러가 계속되면 영향을 받는 노드에서 Consul 데이터베이스를 지우고 다시 초기화해야 할 수 있습니다.

Consul이 시작되지 않음 - 여러 개의 사설 IP

노드에 여러 개의 사설 IP가 있는 경우 Consul은 광고할 사설 주소를 알 수 없으며, 그 후 즉시 시작을 종료합니다.

gitlab-ctl tail consul에서 다음과 같은 메시지가 출력됩니다.

2017-11-09_17:41:45.52876 ==> Consul 에이전트 시작...
2017-11-09_17:41:45.53057 ==> 에이전트 생성 오류: 광고 주소 가져오기 실패: 여러 개의 사설 IP를 찾았습니다. 하나를 구성해주세요.

이를 해결하려면:

  1. 노드에서 모든 다른 노드가 이 노드에 도달할 수 있는 주소를 선택합니다.
  2. /etc/gitlab/gitlab.rb을 업데이트합니다.

    consul['configuration'] = {
      ...
      bind_addr: 'IP 주소'
    }
    
  3. GitLab을 다시 구성합니다.

    gitlab-ctl reconfigure
    

중단 복구

Consul 노드에서 충분한 수의 노드가 손실되어 과반수를 깨뜨리면 클러스터는 실패로 간주되며 매뉴얼 개입 없이는 작동할 수 없습니다. 이 경우, 노드를 처음부터 다시 만들거나 복구를 시도할 수 있습니다.

처음부터 다시 만들기

기본적으로 GitLab은 다시 만들 수 없는 Consul 노드에 아무 것도 저장하지 않습니다. Consul 데이터베이스를 지우고 다시 초기화하려면:

sudo gitlab-ctl stop consul
sudo rm -rf /var/opt/gitlab/consul/data
sudo gitlab-ctl start consul

이후에 노드가 다시 시작하고 나머지 서버 에이전트가 다시 참여해야 합니다. 그 후에 클라이언트 에이전트도 참여해야 합니다.

참여하지 않으면 클라이언트에서도 Consul 데이터를 지우어야 할 수 있습니다.

sudo rm -rf /var/opt/gitlab/consul/data

실패한 노드 복구

Consul을 사용하여 다른 데이터를 저장하고 손상된 노드를 복구하려는 경우, 실패한 클러스터를 복구하려면 Consul 가이드 에 따릅니다.