Geo 장애 조치

Tier: Premium, Ultimate Offering: Self-managed

장애 조치 또는 보조 사이트를 주 사이트로 승격하는 중에 발생한 오류 해결

다음은 장애 조치나 보조를 주 사이트로 승격하는 동안 발생할 수 있는 가능한 오류 메시지와 그 해결 방법입니다.

메시지: ActiveRecord::RecordInvalid: Validation failed: Name has already been taken

보조 사이트를 승격하는 중 다음과 같은 오류 메시지가 발생할 수 있습니다.

Running gitlab-rake geo:set_secondary_as_primary...

rake aborted!
ActiveRecord::RecordInvalid: Validation failed: Name has already been taken
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:236:in `block (3 levels) in <top (required)>'
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:221:in `block (2 levels) in <top (required)>'
/opt/gitlab/embedded/bin/bundle:23:in `load'
/opt/gitlab/embedded/bin/bundle:23:in `<main>'
Tasks: TOP => geo:set_secondary_as_primary
(See full trace by running task with --trace)

You successfully promoted this node!

gitlab-rake geo:set_secondary_as_primary 또는 gitlab-ctl promote-to-primary-node를 실행하는 도중 이 메시지를 만나게 되면, 레일즈 콘솔로 들어가서 다음을 실행하십시오:

  Rails.application.load_tasks; nil
  Gitlab::Geo.expire_cache!
  Rake::Task['geo:set_secondary_as_primary'].invoke

메시지: NoMethodError: undefined method `secondary?' for nil:NilClass

보조 사이트를 승격하는 중 다음과 같은 오류 메시지가 발생할 수 있습니다:

sudo gitlab-rake geo:set_secondary_as_primary

rake aborted!
NoMethodError: undefined method `secondary?' for nil:NilClass
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:232:in `block (3 levels) in <top (required)>'
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:221:in `block (2 levels) in <top (required)>'
/opt/gitlab/embedded/bin/bundle:23:in `load'
/opt/gitlab/embedded/bin/bundle:23:in `<main>'
Tasks: TOP => geo:set_secondary_as_primary
(See full trace by running task with --trace)

이 명령은 보조 사이트에서만 실행되어야 하며, 이 오류 메시지는 주 사이트에서 이 명령을 실행하려고 할 때 표시됩니다.

만료된 아티팩트

Geo 보조 사이트에 아티팩트가 Geo 사이트보다 더 많은 이유가 있다면, Rake 작업을 사용하여 고아 아티팩트 파일을 정리할 수 있습니다.

Geo 보조 사이트에서 이 명령을 실행하면 디스크 상의 고아 파일과 관련된 모든 Geo 레지스트리 레코드도 정리됩니다.

로그인 오류 해결

메시지: The redirect URI included is not valid

사이트의 웹 인터페이스에 로그인할 수 있지만, 보조 웹 인터페이스에 로그인하는 중에 이 오류 메시지를 받는다면, Geo 사이트의 URL이 해당 사이트의 외부 URL과 일치하는지 확인해야 합니다.

사이트에서:

  1. 왼쪽 사이드바에서 아래쪽에 있는 Admin을 선택합니다.
  2. Geo > Sites를 선택합니다.
  3. 영향을 받는 보조 사이트를 찾아 편집을 선택합니다.
  4. URL 필드가 보조 사이트의 Rails 노드의 /etc/gitlab/gitlab.rb에서 찾을 수 있는 값과 일치하는지 확인합니다.

SAML로 보조 사이트에 인증하는 중에 항상 주 사이트로 이동

일반적으로 GitLab 15.1로 업그레이드할 때 이 문제가 발생합니다. 이 문제를 해결하려면 단일 사인온으로 Geo에서 인스턴스 전체 SAML 구성을 참조하십시오.

부분적 장애 조치로부터의 복구

부분적인 Geo 사이트로의 장애 조치는 일시적인 문제로 인한 결과일 수 있습니다. 따라서 먼저 승격 명령을 다시 실행해 보세요.

  1. 보조 사이트의 모든 Sidekiq, PostgreSQL, Gitaly, Rails 노드로 SSH를 연결하고 다음 명령 중 하나를 실행합니다:

    • 보조 사이트를 주 사이트로 승격:

      sudo gitlab-ctl geo promote
      
    • 어떤 추가 확인도 없이 보조 사이트를 주 사이트로 승격:

      sudo gitlab-ctl geo promote --force
      
  2. 이전에 보조 사이트에 사용했던 URL을 사용하여 새로 승격된 사이트에 연결할 수 있는지 확인합니다.
  3. 성공적으로 연결된다면, 보조 사이트가 사이트로 승격되었습니다.

위 단계가 성공적이지 않으면 다음 단계를 진행하십시오:

  1. 보조 사이트의 모든 Sidekiq, PostgreSQL, Gitaly 및 Rails 노드로 SSH를 연결하고 다음 작업을 수행합니다:

    • 다음 내용과 같은 /etc/gitlab/gitlab-cluster.json 파일을 작성합니다:

      {
        "primary": true,
        "secondary": false
      }
      
    • 변경 사항이 적용되도록 GitLab을 다시 구성합니다:

      sudo gitlab-ctl reconfigure
      
  2. 이전에 보조 사이트에 사용했던 URL을 사용하여 새로 승격된 사이트에 연결할 수 있는지 확인합니다.
  3. 성공적으로 연결된다면, 보조 사이트가 사이트로 승격되었습니다.