CI 데이터베이스에 새 테이블 추가하기

pipeline data partitioning 디자인 문서는 CI 도메인의 기존 테이블을 분할하는 방법에 대해 설명합니다. 그러나 새로운 기능을 위한 테이블을 추가해야 합니다. 때로는 이러한 테이블은 분할해야 하는 큰 테이블을 참조합니다. 미래의 작업을 줄이기 위해, 분할 가능한 테이블에 대한 belongs_to 연관을 사용하는 모든 테이블은 시작부터 분할되어야 합니다.

새 라우팅 테이블 생성하기

다음은 데이터베이스 헬퍼를 사용하여 새 테이블과 외래 키를 만드는 예시입니다:

  include Gitlab::Database::PartitioningMigrationHelpers
  disable_ddl_transaction!

  def up
    create_table(:p_ci_examples, primary_key: [:id, :partition_id], options: 'PARTITION BY LIST (partition_id)', if_not_exists: true) do |t|
      t.bigserial :id, null: false
      t.bigint :partition_id, null: false
      t.bigint :build_id, null: false
    end

    add_concurrent_partitioned_foreign_key(
      :p_ci_examples, :p_ci_builds,
      column: [:partition_id, :build_id],
      target_column: [:partition_id, :id],
      on_update: :cascade,
      on_delete: :cascade,
      reverse_lock_order: true
    )
  end

  def down
    drop_table :p_ci_examples
  end

이 테이블은 라우팅 테이블이라고 하며 어떤 데이터도 보유하지 않습니다. 데이터는 분할에 저장됩니다.

라우팅 테이블을 생성할 때:

  • 테이블 이름은 p_ 접두어로 시작해야 합니다. 모든 쿼리가 라우팅 테이블을 통과하고 분할에 직접 액세스하지 않도록하는 분석기가 있습니다.
  • 각 새 테이블에는 partition_id 열이 필요하며, 해당 값은 관련 연관에 있는 값과 동일해야 합니다. 이 예에서는 p_ci_builds입니다. 파이프라인에 속한 모든 리소스는 동일한 partition_id 값을 공유합니다.
  • 기본 키는 효율적인 id로 검색하기 위해 이러한 열로 순서대로 있어야 합니다.
  • 외래 키 제약 조건에는 ON UPDATE CASCADE 옵션이 포함되어 있어야 합니다. 왜냐하면 partition_id 값은 파티션 재분배를 위해 업데이트될 수 있어야 하기 때문입니다.

첫 번째 분할 생성하기

보통은 애플리케이션에 초기 분할 생성을 의존하지만, CI 테이블의 고트래픽 및 많은 수의 노드로 인해 참조 테이블에 잠금을 얻기 어려울 수 있습니다. 결과적으로 배포 중에 노드가 시작하지 못할 수 있습니다. 따라서 애플리케이션이 실행되기 전에 이미 분할이 설치되어있는지 확인해야 합니다:

  disable_ddl_transaction!

  def up
    with_lock_retries do
      connection.execute(<<~SQL)
        LOCK TABLE p_ci_builds IN SHARE ROW EXCLUSIVE MODE;
        LOCK TABLE ONLY p_ci_examples IN ACCESS EXCLUSIVE MODE;
      SQL

      connection.execute(<<~SQL)
        CREATE TABLE IF NOT EXISTS gitlab_partitions_dynamic.ci_examples_100
          PARTITION OF p_ci_examples
          FOR VALUES IN (100);
      SQL
    end
  end

분할은 gitlab_partitions_dynamic 스키마에서 생성됩니다.

분할을 생성할 때, 기억해야 할 점:

  • 분할 이름은 p_ 접두사를 사용하지 않습니다.
  • partition_id의 시작 값은 100입니다.

분할 값 전파하기

분할 값을 전파하기 위해 이 모듈은 Ci::Partitionable 모듈을 사용해야 합니다:

class Ci::Example < Ci::ApplicationRecord
  include Ci::Partitionable

  self.table_name = :p_ci_examples
  self.primary_key = :id

  belongs_to :build, class_name: 'Ci::Build'
  partitionable scope: :build, partitioned: true
end

분할 관리하기

모델은 PARTITIONABLE_MODELS 목록에 포함되어야 합니다. 분할이 올바르게 전파되었는지 테스트하는 데 사용되기 때문입니다.

만약 누락되면, partitioned: true를 지정하면 첫 번째 분할이 생성됩니다. 또한 모델은 postgres_partitioning.rb 초기화 파일에 등록되어야 합니다.