Consul 설정 방법

Tier: Premium, Ultimate Offering: Self-Managed

Consul 클러스터에는 서버 및 클라이언트 에이전트가 모두 포함됩니다. 서버는 자체 노드에서 실행되고 클라이언트는 다른 노드에서 실행되며 다시 서버와 통신합니다.

GitLab Premium에는 /etc/gitlab/gitlab.rb를 사용하여 관리할 수 있는 서비스 네트워킹 솔루션인 Consul의 번들 된 버전이 포함되어 있습니다.

전제 조건

Consul을 구성하기 전에:

  1. 참조 아키텍처 문서를 검토하여 가져야 할 Consul 서버 노드의 수를 결정합니다.
  2. 필요한 경우 방화벽에서 적절한 포트가 열려 있는지 확인합니다.

Consul 노드 구성

Consul 서버 노드에서:

  1. 선호하는 플랫폼을 선택하여 설치하는 지침을 따르되 EXTERNAL_URL 값을 제공하지 마십시오.
  2. /etc/gitlab/gitlab.rb를 편집하고 다음을 추가하십시오. retry_join 섹션에 표시된 값으로 교체합니다. 아래 예시에서는 세 개의 노드가 있으며, 두 개는 IP로 표시되고 한 개는 FQDN으로 표시됩니다.

    # Consul 이외의 모든 구성 요소를 비활성화합니다.
    roles ['consul_role']
    
    # Consul 노드: FQDN 또는 IP, 공백으로 구분됩니다.
    consul['configuration'] = {
      server: true,
      retry_join: %w(10.10.10.1 consul1.gitlab.example.com 10.10.10.2)
    }
    
    # 자동 마이그레이션 비활성화
    gitlab_rails['auto_migrate'] = false
    
  3. 변경 사항이 적용되려면 GitLab을 다시 구성하십시오.
  4. 다음 명령을 실행하여 Consul이 올바르게 구성되었는지 확인하고 모든 서버 노드가 통신하는지 확인하십시오.

    sudo /opt/gitlab/embedded/bin/consul members
    

    결과는 다음과 유사해야 합니다:

    Node                 Address               Status  Type    Build  Protocol  DC
    CONSUL_NODE_ONE      XXX.XXX.XXX.YYY:8301  alive   server  0.9.2  2         gitlab_consul
    CONSUL_NODE_TWO      XXX.XXX.XXX.YYY:8301  alive   server  0.9.2  2         gitlab_consul
    CONSUL_NODE_THREE    XXX.XXX.XXX.YYY:8301  alive   server  0.9.2  2         gitlab_consul
    

    결과에 상태가 alive가 아닌 노드가 표시되거나 세 개의 노드 중 어느 것이 누락된 경우 문제 해결 섹션을 참조하십시오.

Consul 노드 업그레이드

Consul 노드를 업그레이드하려면 GitLab 패키지를 업그레이드하십시오.

노드는 다음과 같아야 합니다:

  • 리눅스 패키지를 업그레이드하기 전에 건전한 클러스터의 구성원이어야 합니다.
  • 한 번에 한 노드씩 업그레이드되어야 합니다.

각 노드에서 다음 명령을 실행하여 클러스터의 기존 건강 문제를 식별하십시오. 클러스터가 건강한 경우 빈 배열이 반환됩니다:

curl "http://127.0.0.1:8500/v1/health/state/critical"

Consul 버전이 변경된 경우 gitlab-ctl reconfigure의 끝에 Consul을 새 버전으로 사용하도록 새로 고침해야 한다는 알림이 표시됩니다.

한 번에 한 노드씩 Consul을 다시 시작하십시오:

sudo gitlab-ctl restart consul

Consul 노드는 raft 프로토콜을 사용하여 통신합니다. 현재 리더가 오프라인 상태인 경우 리더 선출이 이루어져야 합니다. 클러스터 전체에서 동기화를 용이하게 하는 리더 노드가 존재해야 합니다. 너무 많은 노드가 동시에 오프라인 상태가 되면 클러스터는 쿼럼을 상실하고 오작동한 합의 때문에 리더를 선출하지 않게 됩니다.

업그레이드 후 클러스터가 회복되지 않는 경우 문제 해결 섹션을 참조하십시오. 장애 복구가 특별히 유용할 수 있습니다.

GitLab은 Consul을 사용하여 재생성 가능하고 일시적인 데이터만 저장합니다. 번들 된 Consul이 GitLab 자체를 포함한 다른 프로세스에서 사용되지 않았다면 0부터 클러스터를 다시 작성할 수 있습니다.

Consul 문제 해결

다음은 문제 해결 시 수행해야 하는 몇 가지 작업입니다. 다음 명령을 실행하여 오류 로그를 확인할 수 있습니다:

sudo gitlab-ctl tail consul

클러스터 멤버십 확인

클러스터에 속한 노드를 확인하려면 클러스터의 어떤 멤버에서든 다음을 실행하세요:

sudo /opt/gitlab/embedded/bin/consul members

출력은 다음과 유사해야 합니다:

Node            Address               Status  Type    Build  Protocol  DC
consul-b        XX.XX.X.Y:8301        alive   server  0.9.0  2         gitlab_consul
consul-c        XX.XX.X.Y:8301        alive   server  0.9.0  2         gitlab_consul
consul-c        XX.XX.X.Y:8301        alive   server  0.9.0  2         gitlab_consul
db-a            XX.XX.X.Y:8301        alive   client  0.9.0  2         gitlab_consul
db-b            XX.XX.X.Y:8301        alive   client  0.9.0  2         gitlab_consul

이상적으로 모든 노드는 Statusalive여야 합니다.

Consul 재시작

Consul을 재시작해야 할 경우, 쿼럼을 유지하기 위해 이를 통제된 방식으로 수행하는 것이 중요합니다. 쿼럼이 손실되면 클러스터를 복구하기 위해 Consul 장애 복구 프로세스를 따릅니다.

안전을 위해 권장하는 바는 클러스터가 손상되지 않도록 한 번에 하나의 노드에서만 Consul을 재시작하는 것입니다. 대규모 클러스터의 경우, 여러 노드를 동시에 재시작할 수도 있습니다. 동시에 재시작할 수 있는 실패 수는 Consul 합의 문서에서 확인할 수 있습니다.

Consul을 재시작하려면:

sudo gitlab-ctl restart consul

Consul 노드 간 통신 불가능

기본적으로 Consul은 0.0.0.0bind를 시도하지만, 다른 Consul 노드가 이 노드와 통신하기 위해 첫 번째 사설 IP 주소를 광고합니다. 다른 노드가 이 주소에서 노드와 통신할 수 없는 경우 클러스터는 실패한 상태입니다.

이 문제가 발생하면 gitlab-ctl tail consul에서 다음과 유사한 메시지가 출력됩니다:

2017-09-25_19:53:39.90821     2017/09/25 19:53:39 [WARN] raft: no known peers, aborting election
2017-09-25_19:53:41.74356     2017/09/25 19:53:41 [ERR] agent: failed to sync remote state: No cluster leader

이를 해결하려면:

  1. 각 노드에서 다른 모든 노드가이 노드에 도달 할 수있는 주소를 선택합니다.
  2. /etc/gitlab/gitlab.rb을 업데이트합니다.

    consul['configuration'] = {
      ...
      bind_addr: 'IP 주소'
    }
    
  3. GitLab을 다시 구성합니다.

    gitlab-ctl reconfigure
    

에러가 계속되면 영향을 받는 노드에서 Consul 데이터베이스를 삭제하고 다시 초기화해야 할 수도 있습니다.

Consul 시작되지 않음 - 여러 사설 IP

노드에 여러 개의 사설 IP가있는 경우 Consul은 광고 할 사설 주소를 모르기 때문에 시작 즉시 종료됩니다.

다음과 유사한 메시지가 gitlab-ctl tail consul에서 출력됩니다:

2017-11-09_17:41:45.52876 ==> Starting Consul agent...
2017-11-09_17:41:45.53057 ==> Error creating agent: Failed to get advertise address: Multiple private IPs found. Please configure one.

이를 해결하려면:

  1. 노드의 여러 개의 사설 주소 중 모든 다른 노드가이 노드에 도달 할 수있는 주소를 선택합니다.
  2. /etc/gitlab/gitlab.rb을 업데이트합니다.

    consul['configuration'] = {
      ...
      bind_addr: 'IP 주소'
    }
    
  3. GitLab을 다시 구성합니다.

    gitlab-ctl reconfigure
    

장애 복구

쿼럼을 깨기 충분한 Consul 노드를 잃은 경우 클러스터는 실패한 것으로 간주되어 수동 개입 없이는 작동할 수 없습니다. 그런 경우 노드를 처음부터 다시 만들거나 복구를 시도할 수 있습니다.

처음부터 다시 만들기

기본적으로 GitLab은 다시 생성할 수 없는 Consul 노드에 아무 것도 저장하지 않습니다. Consul 데이터베이스를 지우고 다시 초기화하려면:

sudo gitlab-ctl stop consul
sudo rm -rf /var/opt/gitlab/consul/data
sudo gitlab-ctl start consul

이후에 노드는 다시 시작되고 다른 서버 에이전트가 다시 참여합니다. 그 후에 클라이언트 에이전트도 참여해야 합니다.

참여하지 않는 경우 클라이언트에서도 Consul 데이터를 지우어야 할 수도 있습니다:

sudo rm -rf /var/opt/gitlab/consul/data

실패한 노드 복구

Consul을 활용하여 다른 데이터를 저장한 경우, 실패한 노드를 복구하려면 Consul 가이드에 따라 실패한 클러스터를 복구하십시오.