Geo 장애 조치
장애 조치 중 또는 2차 사이트를 1차 사이트로 승격할 때 오류 수정
다음은 장애 조치 중 또는 2차 사이트를 1차 사이트로 승격할 때 발생할 수 있는 오류 메시지와 이를 해결하기 위한 전략입니다.
메시지: ActiveRecord::RecordInvalid: Validation failed: Name has already been taken
2차 사이트를 승격할 때, 다음과 같은 오류 메시지가 발생할 수 있습니다:
Running gitlab-rake geo:set_secondary_as_primary...
rake aborted!
ActiveRecord::RecordInvalid: Validation failed: Name has already been taken
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:236:in `block (3 levels) in <top (required)>`
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:221:in `block (2 levels) in <top (required)>`
/opt/gitlab/embedded/bin/bundle:23:in `load`
/opt/gitlab/embedded/bin/bundle:23:in `<main>`
Tasks: TOP => geo:set_secondary_as_primary
(See full trace by running task with --trace)
You successfully promoted this node!
gitlab-rake geo:set_secondary_as_primary
또는 gitlab-ctl promote-to-primary-node
를 실행할 때 이 메시지가 나타나면, Rails 콘솔에 들어가 다음을 실행하십시오:
Rails.application.load_tasks; nil
Gitlab::Geo.expire_cache!
Rake::Task['geo:set_secondary_as_primary'].invoke
메시지: NoMethodError: undefined method `secondary?' for nil:NilClass
2차 사이트를 승격할 때, 다음과 같은 오류 메시지가 발생할 수 있습니다:
sudo gitlab-rake geo:set_secondary_as_primary
rake aborted!
NoMethodError: undefined method `secondary?' for nil:NilClass
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:232:in `block (3 levels) in <top (required)>`
/opt/gitlab/embedded/service/gitlab-rails/ee/lib/tasks/geo.rake:221:in `block (2 levels) in <top (required)>`
/opt/gitlab/embedded/bin/bundle:23:in `load`
/opt/gitlab/embedded/bin/bundle:23:in `<main>`
Tasks: TOP => geo:set_secondary_as_primary
(See full trace by running task with --trace)
이 명령은 2차 사이트에서만 실행할 수 있도록 설계되었으며, 이 명령을 1차 사이트에서 실행하려고 할 경우 이 오류 메시지가 표시됩니다.
만료된 아티팩트
어떤 이유로 인해 Geo 2차 사이트에 Geo 1차 사이트보다 더 많은 아티팩트가 있는 경우, Rake 작업을 사용하여 고아 아티팩트 파일 정리를 수행할 수 있습니다.
Geo 2차 사이트에서는 이 명령이 디스크의 고아 파일과 관련된 모든 Geo 레지스트리 레코드를 정리합니다.
로그인 오류 수정
메시지: 포함된 리디렉션 URI가 유효하지 않습니다
1차 사이트의 웹 인터페이스에 로그인할 수 있지만, 2차 웹 인터페이스에 로그인하려고 할 때 이 오류 메시지가 나타나면, Geo 사이트의 URL이 외부 URL과 일치하는지 확인해야 합니다.
1차 사이트에서:
- 왼쪽 사이드바의 아래쪽에서 관리자를 선택합니다.
- Geo > 사이트를 선택합니다.
- 영향을 받는 2차 사이트를 찾아 편집을 선택합니다.
-
URL 필드가
/etc/gitlab/gitlab.rb
의external_url "https://gitlab.example.com"
에 있는 값과 일치하는지 확인합니다.
SAML을 사용하여 인증하는 경우 보조 사이트는 항상 주 사이트로 연결됩니다
이 문제는 GitLab 15.1로 업그레이드할 때 주로 발생합니다. 이 문제를 해결하려면 단일 사인온을 사용하여 Geo에서 인스턴스 전체 SAML 구성을 참조하세요.
부분 장애 조치에서 복구하기
보조 Geo 사이트로의 부분 장애 조치는 일시적/변동적 문제의 결과일 수 있습니다. 따라서, 먼저 프로모트 명령을 다시 실행해 보세요.
-
보조 사이트의 모든 Sidekiq, PostgreSQL, Gitaly 및 Rails 노드에 SSH로 접속하고 다음 명령 중 하나를 실행하세요:
-
보조 사이트를 주 사이트로 승격하려면:
sudo gitlab-ctl geo promote
-
추가 확인 없이 보조 사이트를 주 사이트로 승격하려면:
sudo gitlab-ctl geo promote --force
-
- 이전에 보조 사이트에 사용했던 URL을 사용하여 새로 승격된 주 사이트에 연결할 수 있는지 확인하세요.
- 성공적이라면, 보조 사이트가 이제 주 사이트로 승격되었습니다.
위 단계가 성공적이지 않다면, 다음 단계를 진행하세요:
-
보조 사이트의 모든 Sidekiq, PostgreSQL, Gitaly 및 Rails 노드에 SSH로 접속하고 다음 작업을 수행하세요:
-
다음 내용을 가진
/etc/gitlab/gitlab-cluster.json
파일을 생성하세요:{ "primary": true, "secondary": false }
-
변경 사항이 적용되도록 GitLab을 재구성하세요:
sudo gitlab-ctl reconfigure
-
- 이전에 보조 사이트에 사용했던 URL을 사용하여 새로 승격된 주 사이트에 연결할 수 있는지 확인하세요.
- 성공적이라면, 보조 사이트가 이제 주 사이트로 승격되었습니다.