Geo

Tier: Premium, Ultimate Offering: Self-managed

Geo는 분산 개발 팀 및 재해 복구 전략의 일환으로 웜-스탠바이를 제공하는 솔루션입니다.

caution
Geo는 릴리스마다 중대한 변화를 겪습니다. 업그레이드는 지원되며 문서화되어 있지만 설치된 버전의 문서를 사용하는지 확인해야 합니다.

팀 및 러너가 단일 GitLab 인스턴스에서 먼 거리에 위치한 경우 대형 리포지터리를 가져오는 데 시간이 오래 걸릴 수 있습니다.

Geo는 원격 팀에 지리적으로 가까운 위치에 배치할 수 있는 로컬 캐시를 제공하여 읽기 요청을 처리할 수 있습니다. 이로써 대형 리포지터리의 복제 및 가져오기 시간을 줄이고 원격 팀의 개발 속도를 높이고 프로덕션성을 향상시킬 수 있습니다.

Geo 보조 사이트는 기본 사이트로부터 쓰기 요청을 투명하게 프록시합니다. 모든 Geo 사이트는 사용자가 착륙하는 사이트에 관계없이 일관되고 원활하며 포괄적인 경험을 제공하기 위해 단일 GitLab URL에 응답하도록 구성할 수 있습니다.

문서의 올바른 버전을 사용하고 있는지 확인하려면 GitLab.com의 Geo 페이지로 이동하고 브랜치/태그 전환 드롭다운 디렉터리에서 적절한 릴리스를 선택하세요. 예를 들어, v13.7.6-ee입니다.

Geo는 Geo 용어집에 설명된 일련의 정의된 용어를 사용합니다. 해당 용어에 익숙해지도록 해야 합니다.

사용 사례

Geo를 구현하면 다음과 같은 이점이 제공됩니다:

  • 분산된 개발자들이 대형 리포지터리 및 프로젝트를 복제하고 가져오는 데 걸리는 시간을 분에서 초로 줄입니다.
  • 어디서든 아이디어를 기여하고 병행하여 작업할 수 있도록 모든 개발자가 활성화됩니다.
  • 기본 사이트와 보조 사이트 간에 읽기 전용 부하를 균형있게 분배합니다.

또한 이러한 추가적인 이점이 있습니다:

  • 한계점을 참조하여 GitLab 웹 인터페이스에서 사용 가능한 모든 데이터를 읽는 데 추가로 프로젝트를 복제하고 가져오는 데 사용할 수 있습니다.
  • 거리가 먼 사무실 간의 느린 연결을 극복하여 분산된 팀에 대한 속도를 개선하여 시간을 절약합니다.
  • 자동화된 작업, 사용자 정의 통합 및 내부 업무 흐름의 로딩 시간을 줄이는 데 도움이 됩니다.
  • 재해 복구 시 보조 사이트로 빠르게 이전할 수 있습니다.
  • 보조 사이트로의 계획된 장애 조치가 가능합니다.

Geo는 다음을 제공합니다:

  • 보조 사이트에서 완전한 GitLab 경험: 하나의 기본 GitLab 사이트를 유지 관리하면서 분산된 팀 각각에 대해 보조 사이트가 완전한 읽기 및 쓰기 및 UI 경험을 제공합니다.
  • 인증 시스템 후크: 보조 사이트가 기본 인스턴스로부터 모든 인증 데이터(사용자 계정 및 로그인과 같은)를 수신합니다.

Gitaly 클러스터

Geo는 Gitaly 클러스터와 혼동해서는 안 됩니다. Geo와 Gitaly 클러스터의 차이에 대한 자세한 내용은 Geo와 비교를 참조하세요.

작동 방식

Geo 인스턴스는 큰 리포지터리를 빠르게 처리할 수 있도록 클론 및 프로젝트 가져오기에 사용될 수 있습니다.

Geo 개요

Geo를 사용할 때는 다음과 같습니다:

  • 원본 인스턴스는 기본 사이트로 알려져 있습니다.
  • 복제 사이트는 보조 사이트로 알려져 있습니다.

다음을 염두에 두세요:

  • 보조 사이트는 다음과 같은 경우 기본 사이트로 연결합니다:
    • 로그인용 사용자 데이터 가져오기(API).
    • 리포지터리, LFS 객체 및 첨부 파일 복제(HTTPS + JWT).
  • 기본 사이트는 보조 사이트에 변경 사항 알림을 위해 연결하지 않습니다(API).
  • 보조 사이트로 직접 푸시할 수 있습니다(HTTPS 및 SSH, Git LFS 포함).
  • Geo 사용 시 제한 사항이 있습니다.

아키텍처

다음 다이어그램은 Geo의 기본 아키텍처를 보여줍니다.

Geo 아키텍처

이 다이어그램에서는 다음이 포함됩니다:

  • 기본 사이트 및 하나의 보조 사이트의 세부 정보가 있습니다.
  • 데이터베이스에 대한 쓰기는 반드시 기본 사이트에서만 수행할 수 있습니다. 보조 사이트는 PostgreSQL 스트리밍 복제를 사용하여 데이터베이스 업데이트를 수신합니다.
  • LDAP 서버가 있을 경우 재해 복구(scenario)를 위해 복제하도록 구성되어야 합니다.
  • 보조 사이트는 JWT로 보호된 특별한 권한을 사용하여 기본 사이트에 대해 다양한 유형의 동기화를 수행합니다:
    • 리포지터리는 HTTPS를 통해 클론/업데이트됩니다.
    • 첨부 파일, LFS 객체 및 기타 파일은 개인 API 엔드포인트를 통해 HTTPS를 통해 다운로드됩니다.

Git 작업 수행 사용자 관점에서:

  • 기본 사이트는 완전한 읽기-쓰기 GitLab 인스턴스로 동작합니다.
  • 보조 사이트는 읽기 전용이지만 Git 푸시 작업을 기본 사이트로 프록시합니다. 이로써 보조 사이트는 자체적으로 푸시 작업을 지원하는 것처럼 보입니다.
  • 보조 사이트는 웹 UI 요청을 프록시하여 기본 사이트로 전달합니다. 이렇게 함으로써 보조 사이트가 완전한 UI 읽기/쓰기 작업을 지원하는 것처럼 보입니다.

다이어그램을 간략화하기 위해 일부 필수 컴포넌트가 생략되었습니다.

보조 사이트에는 두 가지 다른 PostgreSQL 데이터베이스가 필요합니다:

보조 사이트에서는 추가적으로 Geo Log Cursor라는 데몬이 필요합니다.

Geo 실행을 위한 요구 사항

Geo를 실행하기 위한 다음 사항이 필요합니다:

또한 GitLab 최소 요구 사항을 확인하고 더 나은 경험을 위해 GitLab의 최신 버전을 사용하세요.

방화벽 규칙

다음 표는 Geo를 위해 보조 사이트 간에 열어야 하는 기본 포트를 나열합니다. 장애 조치(failover)를 간단히 하기 위해 양방향으로 포트를 열어야 합니다.

소스 사이트 소스 포트 대상 사이트 대상 포트 프로토콜
Primary 어떤 것이든 Secondary 80 TCP (HTTP)
Primary 어떤 것이든 Secondary 443 TCP (HTTPS)
Secondary 어떤 것이든 Primary 80 TCP (HTTP)
Secondary 어떤 것이든 Primary 443 TCP (HTTPS)
Secondary 어떤 것이든 Primary 5432 TCP

GitLab에서 사용하는 포트의 전체 디렉터리은 기본값을 참조하십시오.

note
웹 터미널 지원을 위해서 로드 밸런서는 WebSocket 연결을 올바르게 처리해야 합니다. HTTP 또는 HTTPS 프록시를 사용할 때 로드 밸런서는 ConnectionUpgrade hop-by-hop 헤더를 통과하도록 구성되어 있어야 합니다. 자세한 내용은 웹 터미널 통합 가이드를 참조하십시오.
note
포트 443에 HTTPS 프로토콜을 사용할 때 로드 밸런서에 SSL 인증서를 추가해야 합니다. 만약 SSL을 GitLab 응용 프로그램 서버에서 종료하려면 TCP 프로토콜을 사용하십시오.

내부 URL

Geo 보조 사이트에서 주 Geo 사이트로 HTTP 요청을 보낼 때, 주 Geo 사이트의 내부 URL을 사용합니다. 주 Geo 사이트 설정의 관리자 영역에 명시적으로 정의되지 않은 경우, 주 사이트의 공개 URL이 사용됩니다.

주 Geo 사이트의 내부 URL을 업데이트하려면:

  1. 왼쪽 사이드바에서 맨 아래에서 관리자 영역을 선택합니다.
  2. Geo > 사이트를 선택합니다.
  3. 주 사이트에서 편집을 선택합니다.
  4. 내부 URL을 변경한 다음 변경 사항 저장을 선택합니다.

Geo 추적 데이터베이스

추적 데이터베이스 인스턴스는 로컬 인스턴스에서 업데이트해야 할 메타데이터로 사용됩니다. 예를 들면:

  • 새 자산을 다운로드합니다.
  • 새 LFS 오브젝트를 가져옵니다.
  • 최근에 업데이트된 리포지터리에서 변경 사항을 가져옵니다.

복제된 데이터베이스 인스턴스가 읽기 전용이기 때문에 각 보조 사이트마다 이 추가적인 데이터베이스 인스턴스가 필요합니다.

Geo 로그 커서

이 데몬은 다음을 수행합니다:

  • 사이트가 보조 데이터베이스 인스턴스로 복제한 이벤트 로그를 읽습니다.
  • 수행해야 하는 변경 내용을 가진 Geo 추적 데이터베이스 인스턴스를 업데이트합니다.

추적 데이터베이스 인스턴스에서 업데이트해야 할 것으로 표시된 경우, 보조 사이트에서 비동기 작업이 필요한 작업을 실행하고 상태를 업데이트합니다.

이 새로운 아키텍처는 사이트 간의 연결 문제에 견고하게 만들어줍니다. 보조 사이트가 사이트와의 연결이 얼마나 오래 끊겨있을지 상관없이 모든 이벤트를 올바른 순서로 재생하고 다시 사이트와 동기화될 수 있습니다.

한계

caution
이 한계 디렉터리은 GitLab의 최신 버전만을 반영합니다. 이전 버전을 사용하는 경우 추가적인 한계 사항이 적용될 수 있습니다.
  • HTTP로 직접 보조 사이트로 푸시하면 요청이 사이트로 리디렉션됩니다(또는 SSH의 경우 프록시됨)(직접 처리하지 않음). 이는 URI에 포함된 자격 증명을 사용한 HTTP를 통한 Git 사용이 불가능하다는 제한이 있습니다. 자세한 내용은 Geo 사이트 사용을 참조하십시오.
  • OAuth 로그인을 위해서 사이트가 오프라인 상태일 수 없습니다. 기존 세션 및 Git에는 영향을 미치지 않습니다. 보조 사이트가 주 사이트와 독립적으로 OAuth 제공자를 사용할 수 있게 해주는 기능은 계획 중입니다.
  • 설치에는 여러 단계의 매뉴얼 작업이 필요하며 상황에 따라 약 1시간이 소요될 수 있습니다. GitLab 환경 도구킷 Terraform 및 Ansible 스크립트를 사용하여 일반적인 일상적인 작업을 자동화하여 운영을 할 수 있습니다. 참조 아키텍처를 기반으로 GitLab 인스턴스를 배포 및 운영하는 데 도움이 되는 것도 고려하십시오. Epic 1465에서 Geo 설치를 더 개선할 것으로 제안되었습니다.
  • 실시간으로 이슈/Merge Request을 업데이트하는 것(예: long polling을 통해)은 보조 사이트에서 작동하지 않습니다.
  • Geo 보조 사이트를 사용하여 러너를 가속화하는 것은 공식적으로 지원되지 않습니다. 이 기능에 대한 지원은 계획 중이며, 이에 대한 내용은 epic 9779에서 추적할 수 있습니다. 사이트와 보조 사이트 간의 복제 지연이 발생하고 작업 실행 시 보조 사이트에서 파이프라인 참조가 사용 불가능한 경우, 작업이 실패합니다.
  • 선택적 동기화는 리포지터리 및 파일이 복제되는 내용만을 제한합니다. 전체 PostgreSQL 데이터는 여전히 복제됩니다. 선택적 동기화는 규정 준수/수출 통제 사용 사례에 적합한 것이 아닙니다.
  • 페이지 액세스 제어는 보조 사이트에서 작동하지 않습니다. 자세한 내용은 GitLab issue #9336을 확인하십시오.
  • 여러 보조 사이트가 있는 배포에 대한 재해 복구는 새 주 사이트를 따르도록 모든 비승격된 보조 사이트의 완전한 재동기화 및 재구성이 필요하므로 다운타임을 유발합니다.
  • Git over SSH에 대한 프로젝트 클론 URL이 올바르게 표시되도록 하기 위해 보조 사이트는 주 사이트와 동일한 포트를 사용해야 합니다. GitLab issue #339262에서 이 제한을 없애는 것이 제안되었습니다.
  • SSH를 통해 보조 사이트로 1.86 GB 이상의 푸시는 작동하지 않습니다. GitLab issue #413109에서 이 버그를 추적하고 있습니다.
  • 백업은 보조 사이트에서 실행할 수 없습니다.
  • SSH를 통해 보조 사이트로 옵션 --depth와 함께 프로젝트 클론 및 가져오기 요청은 보조 사이트가 업데이트되지 않은 상태에서 요청이 시작된 경우에는 작동하지 않고 무한대로 대기합니다. 자세한 내용은 issue 391980을 참조하십시오.
  • SSH를 통해 보조 사이트로 옵션을 사용하여 푸시하면 연결이 해제됩니다. 자세한 내용은 issue 417186을 확인하십시오.
  • 대부분의 경우 Geo 보조 사이트는 파이프라인의 첫 번째 단계에 대한 클론 요청을 가속화하거나 제공하지 않습니다. 나중 단계에 대한 클론 요청이 보조 사이트에서 제공되는 것도 보장되지 않습니다. 예를 들어 Git 변경이 크거나 대역폭이 작거나 파이프라인 단계가 짧은 경우 등 짧지 않은 전체적으로는 보조 사이트에서 클론 요청을 제공합니다. Issue 446176은 이에 대한 이유를 논의하며 러너 클론 요청이 보조 사이트에서 제공될 가능성을 높이기 위한 개선을 제안합니다.

데이터 복제/확인의 제한 사항

모든 GitLab 데이터 유형복제 및 확인 지원 사항의 완전한 디렉터리이 있습니다.

설정 지침

설정 지침은 Geo 설정을 참조하십시오.

설치 후 문서

GitLab을 보조 사이트에 설치한 후 초기 구성을 완료하면, 설치 후 정보를 얻을 수 있는 다음 문서를 참조하십시오.

Geo 구성

Geo 구성에 대한 정보는 Geo 구성을 참조하십시오.

Geo 업그레이드

Geo 사이트를 최신 버전의 GitLab으로 업데이트하는 방법에 대한 정보는 Geo 사이트 업그레이드를 참조하십시오.

복제 일시 중지 및 재개

caution
복제를 일시 중지 및 재개하는 것은 리눅스 패키지 관리 데이터베이스를 사용하는 Geo 설치에 대해서만 지원됩니다. 외부 데이터베이스는 지원되지 않습니다.

업그레이드 또는 계획된 장애 조치 중과 같은 특정 상황에서 원하는 것은 주 사이트와 보조 사이트 간의 복제를 일시 중지하는 것입니다.

업그레이드 중에 보조 사이트에서 사용자 활동을 허용할 계획이라면, 제로 다운타임 업그레이드를 위해 복제를 일시 중지하지 마십시오. 일시 중지된 동안 보조 사이트는 계속해서 더 오래된 상태가 됩니다. 알려진 영향 중 하나는 Git fetch가 주 사이트로 리디렉션되거나 프록시되는 횟수가 점점 더 많아진다는 것입니다. 추가 알려지지 않은 영향이 있을 수 있습니다.

복제를 일시 중지하고 재개하기 위해서는 보조 사이트의 특정 노드에서 명령줄 도구를 통해 수행됩니다. 데이터베이스 아키텍처에 따라 이 작업은 postgresql 또는 patroni 서비스를 대상으로 합니다.

  • 보조 사이트의 모든 서비스에 단일 노드를 사용하는 경우, 이 명령을 해당 단일 노드에서 실행해야 합니다.
  • 보조 PostgreSQL 노드가 있는 경우, 해당 독립형 PostgreSQL 노드에서 명령을 실행해야 합니다.
  • 보조 사이트에서 Patroni 클러스터를 사용하는 경우, 해당 보조 Patroni 스탠바이 리더 노드에서 이러한 명령을 실행해야 합니다.

보조 사이트의 모든 서비스에 단일 노드를 사용하지 않는 경우, PostgreSQL 또는 Patroni 노드의 /etc/gitlab/gitlab.rb가 구성 줄 gitlab_rails['geo_node_name'] = '노드_이름'을 포함하는지 확인하십시오. 여기서 노드_이름은 응용 프로그램 노드의 geo_node_name과 동일해야 합니다.

일시 중지:(보조 사이트에서)

또한, 복제를 일시 중지한 후 PostgreSQL이 재시작되면(VM을 다시 시작하거나 gitlab-ctl restart postgresql로 서비스를 재시작하는 경우 모두), PostgreSQL은 자동으로 복제를 재개하게 됩니다. 이러한 상황은 업그레이드나 계획된 장애 조치 시에 원치 않을 것입니다.

gitlab-ctl geo-replication-pause

재개:(보조 사이트에서)

gitlab-ctl geo-replication-resume

다중 노드용 Geo 구성

다중 노드용 Geo 구성에 대한 정보는 다중 서버용 Geo를 참조하세요.

객체 리포지터리와 함께 Geo 구성

객체 리포지터리와 함께 Geo를 구성하는 방법에 대한 정보는 객체 리포지터리와 함께 Geo를 참조하십시오.

재해 복구

재해 복구 상황에서 데이터 손실을 완화하고 서비스를 복구하는 데 Geo를 사용하는 방법에 대한 정보는 재해 복구를 참조하십시오.

컨테이너 레지스트리 복제

컨테이너 레지스트리를 복제하는 방법에 대한 자세한 정보는 보조 사이트용 컨테이너 레지스트리를 참조하십시오.

Geo 보조 프록시

보조 사이트에서 Geo 프록시를 사용하는 방법에 대한 자세한 정보는 보조 사이트용 Geo 프록시를 참조하십시오.

단일 로그인 (SSO)

단일 로그인 (SSO)를 구성하는 방법에 대한 자세한 정보는 단일 로그인 (SSO)와 함께 Geo를 참조하십시오.

LDAP

LDAP를 구성하는 방법에 대한 자세한 정보는 단일 로그인 (SSO) > LDAP를 참조하십시오.

보안 검토

Geo 보안에 대한 자세한 정보는 Geo 보안 검토를 참조하십시오.

Geo 튜닝

Geo 튜닝에 대한 자세한 정보는 Geo 튜닝을 참조하십시오.

위치 인식 Git URL 설정

AWS Route53으로 위치 인식 Git 원격 URL을 설정하는 예제에 대한 자세한 정보는 AWS Route53를 사용한 위치 인식 Git 원격 URL을 참조하십시오.

백필

보조 사이트를 설정하면 기본 사이트에서 백필 프로세스로 누락된 데이터를 복제하기 시작합니다. 브라우저의 기본 사이트의 Geo 노드 대시보드에서 각 Geo 사이트의 동기화 프로세스를 모니터링할 수 있습니다.

백필 중에 발생하는 실패는 백필이 종료된 후 다시 재시도할 예정입니다.

Geo 사이트 제거

Geo 사이트를 제거하는 방법에 대한 자세한 정보는 보조 Geo 사이트 제거를 참조하십시오.

Geo 비활성화

Geo를 비활성화하는 방법에 대한 자세한 정보는 Geo 비활성화를 참조하십시오.

자주 묻는 질문

일반적인 질문에 대한 답변은 Geo FAQ를 참조하십시오.

로그 파일

Geo는 geo.log 파일에 구조화된 로그 메시지를 저장합니다.

Geo 로그에 액세스하고 사용하는 방법에 대한 자세한 정보는 로그 시스템 설명서의 Geo 섹션를 참조하십시오.

문제 해결

문제 해결 단계에 대한 자세한 정보는 Geo 문제 해결을 참조하십시오.