컨테이너 레지스트리 데이터 전송량 줄이기

Tier: Free, Premium, Ultimate Offering: GitLab.com, Self-Managed, GitLab Dedicated

이미지 또는 태그의 다운로드 빈도에 따라 컨테이너 레지스트리에서의 데이터 전송이 GitLab.com 제한을 초과할 수 있습니다. 이 페이지에서는 컨테이너 레지스트리의 데이터 전송량을 줄이는 데 도움이 되는 여러 권장 사항과 유의 사항을 제공합니다.

데이터 전송 사용량 확인

전송 사용량은 GitLab UI에서 사용할 수 없습니다. GitLab-#350905에서 이 정보를 노출하기 위한 작업을 추적하는 epic입니다. 그 동안 GitLab 팀원은 전송 한계를 크게 초과한 고객에게 연락하여 사용 사례를 더 잘 이해하고 데이터 전송 사용량을 줄이는 방법을 제공할 수 있습니다.

이미지 크기 결정

이미지의 크기를 결정하기 위해 다음 도구와 기술을 사용하세요:

  • Skopeo: Skopeo inspect 명령을 사용하여 API 호출을 통해 레이어 수와 크기를 조사합니다. 따라서 docker pull IMAGE를 실행하기 전에 이 데이터를 조사할 수 있습니다.

  • Docker in CI: Docker를 사용하여 이미지를 푸시하기 전에 GitLab CI를 사용하여 이미지 크기를 조사하고 기록하세요. 예:

    docker inspect "$CI_REGISTRY_IMAGE:$IMAGE_TAG" \
        | awk '/"Size": ([0-9]+)[,]?/{ printf "최종 이미지 크기: %d\n", $2 }'
    
  • Dive: Docker 이미지 및 레이어 내용을 탐색하고 크기를 줄이는 방법을 찾는 도구입니다.

이미지 크기 줄이기

더 작은 기본 이미지 사용

Alpine Linux와 같은 더 작은 기본 이미지를 사용하는 것을 고려해보세요. Alpine 이미지는 약 5MB로, Debian과 같은 인기 있는 기본 이미지보다 훨씬 작습니다. Go 애플리케이션 등 독립적으로 정적 바이너리로 배포되는 경우 Docker scratch 기본 이미지를 사용할 수도 있습니다.

특정 기본 이미지 OS를 사용해야 하는 경우 -slim 또는 -minimal 변형을 찾아보세요. 이렇게 하면 이미지 크기가 줄어듭니다.

또한 기본 이미지 위에 설치하는 운영 체제 패키지를 신중하게 선택하세요. 이로 인해 수백 메가바이트가 추가될 수 있습니다. 빌드 프로세스에서 설치된 패키지 수를 최소한으로 유지해 보세요.

다중 단계 빌드는 일시적인 빌드 의존성을 정리하는 데 강력한 도구일 수 있습니다.

다음과 같은 도구를 사용하는 것도 고려해 볼 수 있습니다:

  • DockerSlim: 컨테이너 이미지 크기를 줄이기 위한 일련의 명령을 제공합니다.
  • Distroless: 애플리케이션 및 런타임 의존성만 포함하며 패키지 관리자, 셸 또는 표준 Linux 배포본에 기대할 수 있는 다른 프로그램을 포함하지 않는 이미지입니다.

레이어 최소화

Dockerfile의 각 명령은 새 레이어를 만들어내며 해당 명령 동안 적용된 파일 시스템 변경 사항을 나타냅니다. 일반적으로, 더 많거나 큰 레이어는 더 큰 이미지를 만듭니다. Dockerfile에서 패키지를 설치하는 레이어의 수를 최소화해 보세요. 그렇지 않으면 빌드 프로세스의 각 단계마다 이미지 크기가 커질 수 있습니다.

레이어 수와 크기를 줄이는 다양한 전략이 있습니다. 예를 들어 설치하려는 각 운영 체제 패키지마다 RUN 명령을 사용하는 대신 패키지를 모두 한 번에 설치하여 빌드 프로세스의 단계 수를 줄이고 이미지 크기를 줄일 수 있습니다.

모든 일시적 빌드 의존성을 제거하고 패키지 관리자 캐시를 비활성화하거나 비우는 것을 설치한 후 전, 후에 수행하여 사용하는 이미지를 최소화하는 것도 유용한 전략입니다.

이미지를 빌드할 때 관련 파일만 복사하도록 해야 합니다. Docker에서는 .dockerignore 사용이 빌드 프로세스가 관련 없는 파일을 무시하도록 보장합니다.

DockerSlim과 같은 타사 도구를 사용하여 이미지 크기를 최소화할 수 있습니다. 그러나 잘못 사용하는 경우 애플리케이션이 특정 상황에서 동작하는 데 필요한 의존성을 제거할 수 있습니다. 그러므로 이미지를 최소화하는 대신 빌드 프로세스 중에 이미지를 줄이는 데 노력하는 편이 좋습니다.

다중 단계 빌드 사용

다중 단계 빌드를 사용하면 Dockerfile에서 여러 FROM 문을 사용합니다. 각 FROM 지시문은 다른 기본을 사용하고 새로운 빌드 단계를 시작합니다. 하나의 단계에서 다른 단계로 아티팩트를 선택적으로 복사하여 최종 이미지에 포함시키지 않을 항목을 남길 수 있습니다. 이는 빌드 의존성을 설치해야 하지만 최종 이미지에는 필요하지 않은 경우에 특히 유용합니다.

이미지 풀 정책 사용

docker 또는 docker+machine executor를 사용할 때, runner config.toml에서 pull_policy 매개변수를 설정하여 Docker 이미지를 가져올 때 runner가 작동하는 방식을 정의할 수 있습니다. 크고 드물게 업데이트되는 이미지를 사용할 때 데이터 전송을 피하려면 if-not-present 풀 정책을 사용하는 것을 고려하세요.

Docker 레이어 캐싱 사용

docker build를 실행할 때, Dockerfile의 각 명령은 레이어로 이어집니다. 이러한 레이어들은 캐시로 유지되어 수정 사항이 없는 경우 재사용될 수 있습니다. --cache-from 인수를 사용하여 docker build 명령에 캐시 원본으로 사용할 태그가 지정된 이미지를 지정할 수 있습니다. --cache-from 인수를 여러 개 사용하여 여러 이미지를 캐시 원본으로 지정할 수도 있습니다. 이렇게 하면 빌드 시간이 단축되고 전송되는 데이터 양이 줄어들 수 있습니다. 자세한 내용은 Docker 레이어 캐싱에 대한 문서를 참조하세요.

자동화 빈도 확인

특정 간격에 정기적인 작업을 수행하기 위해 컨테이너 이미지에 포함된 자동화 스크립트를 자주 만듭니다. GitLab 레지스트리에서 컨테이너 이미지를 GitLab.com 외부의 서비스로 가져 오는 자동화 간격을 줄일 수 있습니다.

GitLab Premium 또는 Ultimate로 이동

GitLab.com의 데이터 전송 한계는 티어 수준으로 설정됩니다. 더 높은 한도가 필요한 경우 GitLab Premium 또는 Ultimate로 업그레이드하는 것을 고려해보세요.

추가 데이터 전송 구매

데이터 전송 한계를 관리하는 방법에 대해 자세히 알아보세요.

관련된 이슈

  • 기본 Docker 이미지가 업데이트될 때 이미지를 다시 빌드하려고 할 수 있습니다. 그러나 파이프라인 구독 한도가 너무 낮습니다 사용하여 이 기능을 활용할 수 없습니다. 해결책으로 매일 또는 하루에 여러 번 다시 빌드 할 수 있습니다. GitLab-#225278에서는 이 워크플로우를 돕기 위해 한도를 높이는 것이 제안되었습니다.