Geo 장애 조치

Tier: Premium, Ultimate Offering: Self-managed

장애 조치 중 또는 2차 사이트를 1차 사이트로 승격할 때 오류 수정

다음은 장애 조치 중 또는 2차 사이트를 1차 사이트로 승격할 때 발생할 수 있는 오류 메시지와 이를 해결하기 위한 전략입니다.

메시지: ActiveRecord::RecordInvalid: Validation failed: Name has already been taken

2차 사이트를 승격할 때, 다음과 같은 오류 메시지가 발생할 수 있습니다:

Running gitlab-rake geo:set_secondary_as_primary...

rake aborted!  
ActiveRecord::RecordInvalid: Validation failed: Name has already been taken  
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:236:in `block (3 levels) in <top (required)>`  
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:221:in `block (2 levels) in <top (required)>`  
/opt/gitlab/embedded/bin/bundle:23:in `load`  
/opt/gitlab/embedded/bin/bundle:23:in `<main>`  
Tasks: TOP => geo:set_secondary_as_primary  
(See full trace by running task with --trace)  

You successfully promoted this node!  

gitlab-rake geo:set_secondary_as_primary 또는 gitlab-ctl promote-to-primary-node를 실행할 때 이 메시지가 나타나면, Rails 콘솔에 들어가 다음을 실행하십시오:

Rails.application.load_tasks; nil  
Gitlab::Geo.expire_cache!  
Rake::Task['geo:set_secondary_as_primary'].invoke  

메시지: NoMethodError: undefined method `secondary?' for nil:NilClass

2차 사이트를 승격할 때, 다음과 같은 오류 메시지가 발생할 수 있습니다:

sudo gitlab-rake geo:set_secondary_as_primary

rake aborted!  
NoMethodError: undefined method `secondary?' for nil:NilClass  
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:232:in `block (3 levels) in <top (required)>`  
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:221:in `block (2 levels) in <top (required)>`  
/opt/gitlab/embedded/bin/bundle:23:in `load`  
/opt/gitlab/embedded/bin/bundle:23:in `<main>`  
Tasks: TOP => geo:set_secondary_as_primary  
(See full trace by running task with --trace)  

이 명령은 2차 사이트에서만 실행할 수 있도록 설계되었으며, 이 명령을 1차 사이트에서 실행하려고 할 경우 이 오류 메시지가 표시됩니다.

만료된 아티팩트

어떤 이유로 인해 Geo 2차 사이트에 Geo 1차 사이트보다 더 많은 아티팩트가 있는 경우, Rake 작업을 사용하여 고아 아티팩트 파일 정리를 수행할 수 있습니다.

Geo 2차 사이트에서는 이 명령이 디스크의 고아 파일과 관련된 모든 Geo 레지스트리 레코드를 정리합니다.

로그인 오류 수정

메시지: 포함된 리디렉션 URI가 유효하지 않습니다

1차 사이트의 웹 인터페이스에 로그인할 수 있지만, 2차 웹 인터페이스에 로그인하려고 할 때 이 오류 메시지가 나타나면, Geo 사이트의 URL이 외부 URL과 일치하는지 확인해야 합니다.

1차 사이트에서:

  1. 왼쪽 사이드바의 아래쪽에서 관리자를 선택합니다.
  2. Geo > 사이트를 선택합니다.
  3. 영향을 받는 2차 사이트를 찾아 편집을 선택합니다.
  4. URL 필드가 /etc/gitlab/gitlab.rbexternal_url "https://gitlab.example.com"에 있는 값과 일치하는지 확인합니다.

SAML을 사용하여 인증하는 경우 보조 사이트는 항상 주 사이트로 연결됩니다

문제는 GitLab 15.1로 업그레이드할 때 주로 발생합니다. 이 문제를 해결하려면 단일 사인온을 사용하여 Geo에서 인스턴스 전체 SAML 구성을 참조하세요.

부분 장애 조치에서 복구하기

보조 Geo 사이트로의 부분 장애 조치는 일시적/변동적 문제의 결과일 수 있습니다. 따라서, 먼저 프로모트 명령을 다시 실행해 보세요.

  1. 보조 사이트의 모든 Sidekiq, PostgreSQL, Gitaly 및 Rails 노드에 SSH로 접속하고 다음 명령 중 하나를 실행하세요:

    • 보조 사이트를 주 사이트로 승격하려면:

      sudo gitlab-ctl geo promote
      
    • 추가 확인 없이 보조 사이트를 주 사이트로 승격하려면:

      sudo gitlab-ctl geo promote --force
      
  2. 이전에 보조 사이트에 사용했던 URL을 사용하여 새로 승격된 사이트에 연결할 수 있는지 확인하세요.
  3. 성공적이라면, 보조 사이트가 이제 사이트로 승격되었습니다.

위 단계가 성공적이지 않다면, 다음 단계를 진행하세요:

  1. 보조 사이트의 모든 Sidekiq, PostgreSQL, Gitaly 및 Rails 노드에 SSH로 접속하고 다음 작업을 수행하세요:

    • 다음 내용을 가진 /etc/gitlab/gitlab-cluster.json 파일을 생성하세요:

      {
        "primary": true,
        "secondary": false
      }
      
    • 변경 사항이 적용되도록 GitLab을 재구성하세요:

      sudo gitlab-ctl reconfigure
      
  2. 이전에 보조 사이트에 사용했던 URL을 사용하여 새로 승격된 사이트에 연결할 수 있는지 확인하세요.
  3. 성공적이라면, 보조 사이트가 이제 사이트로 승격되었습니다.