제품 분석

Tier: Ultimate Offering: GitLab.com, Self-Managed, GitLab Dedicated
  • GitLab 15.4에서 “실험” 기능으로 도입되었으며 기본적으로 비활성화된 ‘cube_api_proxy’ 플래그를 사용하여 제공됩니다.
  • ‘cube_api_proxy’는 GitLab 15.6에서 상품 분석 API만을 참조하도록 변경되었습니다.
  • ‘cube_api_proxy’는 GitLab 15.10에서 제거되고 ‘product_analytics_internal_preview’로 대체되었습니다.
  • ‘product_analytics_internal_preview’는 GitLab 15.11에서 ‘product_analytics_dashboards’로 대체되었습니다.
  • 스노우플로우 통합 기능이 GitLab 15.11에서 ‘product_analytics_snowplow_support’가 비활성화된 상태로 도입되었습니다.
  • 스노우플로우 통합 피처 플래그 ‘product_analytics_snowplow_support’가 GitLab 16.4에서 제거되었습니다.
  • GitLab 16.7에서 GitLab Self-Managed에서 GitLab.com으로 이동되었습니다.
  • GitLab 16.7에서 베타 기능으로 활성화되었습니다.
  • ‘product_analytics_dashboards’는 GitLab 16.11에서 기본적으로 활성화되었습니다.
  • GitLab 16.11에서 Self-Managed 및 GitLab Dedicated에서 활성화되었습니다.
이 기능의 가용성은 피처 플래그에 의해 제어됩니다. 자세한 정보는 히스토리를 참조하십시오.

제품 분석의 비전 및 개발에 대한 자세한 내용은 그룹 방향 페이지를 참조하십시오. 제품 분석 버그 또는 기능에 대한 피드백을 남기려면:

  • 이슈 391970에 댓글 남기기
  • group::product analytics 라벨이 지정된 이슈 생성

제품 분석 작동 방식

제품 분석에는 다음 도구가 사용됩니다:

  • Snowplow - 행동 데이터를 수집하고 ClickHouse에 전달하는 개발자 중심의 엔진입니다.
  • ClickHouse - 분석 데이터를 저장, 쿼리 및 검색하는 데 적합한 데이터베이스입니다.
  • Cube - ClickHouse에 저장된 데이터에 대한 쿼리를 실행하기 위한 API를 제공하는 범용 의미론적 레이어입니다.

다음 다이어그램은 제품 분석의 흐름을 보여줍니다:

--- title: 제품 분석 흐름 --- flowchart TB subgraph 이벤트 수집 A([SDK]) --사용자 데이터 전송--> B[Snowplow Collector] B --데이터 전달--> C[Snowplow Enricher] end subgraph 데이터 웨어하우스 C --데이터 변환 및 풍요화--> D([ClickHouse]) end subgraph 데이터 시각화 F([패널/시각화가 있는 대시보드]) F --데이터 요청--> G[제품 분석 API] G --사전 집계를 사용하여 Cube 쿼리 실행--> H[Cube] H --데이터 가져오기--> D D --결과 반환--> H H --렌더링할 데이터로 변환--> G G --데이터 반환--> F end

제품 분석 활성화

  • GitLab 15.6에서 ‘cube_api_proxy’라는 플래그로 도입되었으며 기본적으로 비활성화되었습니다.
  • GitLab 15.7에서 ‘product_analytics_admin_settings’라는 플래그 뒤로 이동되었으며 기본적으로 비활성화되었습니다.
  • ‘cube_api_proxy’ 플래그가 GitLab 15.10에서 제거되고 ‘product_analytics_internal_preview’로 대체되었습니다.
  • ‘product_analytics_internal_preview’ 플래그가 GitLab 15.11에서 ‘product_analytics_dashboards’로 대체되었습니다.
  • ‘product_analytics_admin_settings’ 플래그가 GitLab 16.11에서 기본적으로 활성화되었습니다.

프로젝트 애플리케이션의 이벤트를 추적하려면 제품 분석을 활성화하고 구성해야 합니다.

제품 분석 제공업체

귀하의 GitLab 인스턴스는 제품 분석 제공업체에 연결됩니다. 제품 분석 제공업체는 귀하의 분석 데이터를 수신, 처리, 저장 및 쿼리하는 데 필요한 서비스 모음입니다.

GitLab-managed provider
Offering: GitLab.com

GitLab.com에서는 Beta에 가입한 경우 Google Cloud Platform 존 ‘us-central-1’에서 제공되는 GitLab-managed 제공업체를 사용할 수 있습니다. 가입하려면 GitLab의 영업팀에 문의하십시오.

GitLab이 제품 분석 제공업체를 관리하는 경우 귀하의 분석 데이터는 1년 동안 보관됩니다. 지원팀에 문의하여 언제든지 데이터 삭제를 요청할 수 있습니다.

Self-Managed provider

GitLab 16.0에서 도입되었습니다.

Self-Managed 제품 분석 제공업체는 제품 분석 헬름 차트의 배포된 인스턴스입니다.

GitLab.com에서는 Self-Managed형 제공업체 세부정보가 프로젝트 수준 설정에서 정의됩니다.

GitLab Self-Managed 및 GitLab Dedicated에서는 Self-Managed형 분석 제공업체를 인스턴스 수준 설정에서 정의해야 합니다. 다른 프로젝트에 대해 다른 제공업체가 필요한 경우 프로젝트 수준 설정에서 추가적인 분석 제공업체를 정의할 수 있습니다.

인스턴스 수준 설정

Offering: Self-Managed, GitLab Dedicated

필수 조건:

  • 인스턴스에 대한 관리자 액세스 권한이 있어야 합니다.
note
이러한 인스턴스 수준 설정은 GitLab Self-Managed 및 GitLab Dedicated에서 제품 분석을 활성화하고 기본적으로 모든 프로젝트에 전파됩니다.

귀하의 인스턴스에서 제품 분석을 활성화하려면:

  1. 왼쪽 사이드바에서 가장 아래에서 관리 영역을 선택합니다.
  2. 설정 > 분석을 선택합니다.
  3. 제품 분석을 확장하고 구성 값을 입력합니다.
  4. 변경 사항 저장을 선택합니다.

그룹 수준 설정

필수 조건:

  • 그룹에 대한 소유자 역할이 있어야 합니다.
note
이러한 그룹 수준 설정은 최상위 그룹에 대해 사용할 수 있으며 해당 그룹에 속하는 모든 프로젝트에 전파됩니다.
  1. 왼쪽 사이드바에서 검색 또는 이동하여 이동을 선택하여 그룹을 찾습니다.
  2. 설정 > 일반을 선택합니다.
  3. 권한 및 그룹 기능 섹션을 확장합니다.
  4. 실험 및 베타 기능 사용 확인란을 선택합니다.
  5. 변경 사항 저장을 선택합니다.

프로젝트 수준 설정

프로젝트에 대해 다른 구성을 갖는 제품 분석 인스턴스를 원하는 경우, 관리자가 정의한 인스턴스 수준 설정을 프로젝트별로 재정의할 수 있습니다.

필수 조건:

  • 프로젝트 또는 프로젝트가 속한 그룹에 대해 적어도 관리자 역할이 있어야 합니다.
  • 프로젝트가 그룹 네임스페이스에 있어야 합니다.
  1. 왼쪽 사이드바에서 검색 또는 이동하여 이동을 선택하여 프로젝트를 찾습니다.
  2. 설정 > 분석을 선택합니다.
  3. 데이터 소스를 확장하고 구성 값을 입력합니다. 1.변경 사항 저장를 선택합니다.

GitLab 프로젝트 온보딩

필수 사항:

  • 프로젝트 또는 해당 프로젝트가 속한 그룹에 적어도 Developer 역할이 있어야 합니다.

GitLab 프로젝트 온보딩이란 제품 분석에 사용되는 이벤트를 수신할 준비를 하는 것을 의미합니다.

프로젝트를 온보딩하려면:

  1. 왼쪽 사이드바에서 검색 또는 이동을 선택하고 프로젝트를 찾습니다.
  2. 분석 > 분석 대시보드를 선택합니다.
  3. 제품 분석에서 설정을 선택합니다.

그런 다음 환경에 따라 설정을 계속합니다.

GitLab.com에서

::Tabs

GitLab 관리형 제공업체

필수 사항:

  1. 이 지역에서 이벤트 수집 및 처리에 동의합니다 확인란을 선택합니다.
  2. GitLab 관리형 제공업체에 연결을 선택합니다.
  3. 이미 구성된 프로젝트 수준 설정을 삭제합니다:
    1. 분석 설정으로 이동을 선택합니다.
    2. 데이터 소스를 확장하고 구성 값을 제거합니다.
    3. 변경 사항 저장을 선택합니다.
    4. 분석 > 분석 대시보드를 선택합니다.
    5. 제품 분석을 선택합니다.
    6. GitLab 관리형 제공업체에 연결을 선택합니다.

인스턴스가 생성되고 프로젝트가 온보딩됩니다.

자체 제공업체
  1. 자체 제공업체에 연결을 선택합니다.
  2. 자체 제공업체에 대한 프로젝트 수준 설정을 구성합니다:
    1. 분석 설정으로 이동을 선택합니다.
    2. 데이터 소스를 확장하고 구성 값을 입력합니다.
    3. 변경 사항 저장을 선택합니다.
    4. 분석 > 분석 대시보드를 선택합니다.
    5. 제품 분석을 선택합니다.
    6. 자체 제공업체에 연결을 선택합니다.

인스턴스가 생성되고 프로젝트가 온보딩됩니다.

:::EndTab

GitLab 자체 제공 또는 GitLab 전담

  • 제품 분석 설정을 선택합니다. 정의된 경우 프로젝트 수준 설정이 사용되며, 그렇지 않으면 인스턴스 수준 설정이 사용됩니다.

인스턴스가 생성되고 프로젝트가 온보딩됩니다.

응용 프로그램을 계기화

트래킹 SDKs를 사용하여 코드를 계기화하여 데이터를 수집할 수 있습니다.

제품 분석 대시보드

  • product_analytics_internal_preview라는 플래그로 GitLab 15.5에서 도입되었습니다. 기본적으로 비활성화됩니다.

제품 분석 대시보드는 분석 대시보드 하위 집합입니다.

구체적으로, 제품 분석 대시보드와 시각화는 cube_analytics 데이터 유형을 사용합니다. cube_analytics 데이터 유형은 제품 분석이 활성화될 때 정의된 Cube 인스턴스에 연결됩니다. 모든 필터 및 쿼리는 Cube 인스턴스로 전송되며 반환된 데이터는 적절한 시각화를 위해 제품 분석 데이터 원본에 의해 처리됩니다.

cube_analytics에서의 데이터 테이블 시각화에는 링크를 렌더링하는 추가 구성 옵션이 있습니다. 이 옵션은 texthref 속성을 갖는 객체 배열로, 링크에 사용될 차원을 지정합니다. href에 여러 차원이 포함된 경우 값은 단일 URL로 결합됩니다. 예시를 확인하세요.

누락된 데이터 채우기

  • product_analytics_dashboards라는 플래그로 GitLab 16.3에서 도입되었습니다. 기본적으로 비활성화됩니다.

데이터가 없는 경우 데이터 내보내기 또는 대시보드 보기 시, 해당 날짜에 대해 누락된 데이터는 0으로 자동으로 채워집니다.

자동 채우기 접근 방식에는 장단점이 있습니다.

  • 장점:
    • 시각화의 날짜 축이 선택한 날짜 범위와 일치하여 누락된 데이터에 대한 모호함이 제거됩니다.
    • 데이터 내보내기에는 전체 날짜 범위에 대한 행이 있어 데이터 분석이 쉬워집니다.
  • 단점:
    • day 세분화를 사용해야 합니다. 다른 모든 세분화는 지원되지 않습니다.
    • inDateRange로 정의된 날짜 범위에만 데이터가 채워집니다.
      • UI의 날짜 선택기에서 이미 이 필터를 사용합니다.
    • 데이터가 채워지면 쿼리에서 정의된 제한이 무시됩니다. 20일에 걸쳐 10개의 데이터 포인트에 대한 제한을 설정하면 20개의 데이터 포인트가 반환되며 누락된 데이터가 0으로 채워집니다. 이슈 417231에서 이 제한에 대한 해결책이 제안되었습니다.

퍼널 분석

퍼널 분석을 사용하여 응용 프로그램을 통한 사용자의 흐름 및 사전에 정의된 흐름(예: 체크아웃 프로세스 또는 티켓 구매)에서 사용자가 이탈하는 위치를 이해할 수 있습니다.

각 제품은 또한 무제한의 퍼널을 정의할 수 있습니다. 대시보드와 마찬가지로 퍼널은 GitLab YAML 스키마로 정의되며 프로젝트 리포지터리의 .gitlab/analytics/funnels/ 디렉터리에 저장됩니다.

퍼널 정의에는 nameseconds_to_convert 키와 steps 배열이 포함되어야 합니다.

설명
name 퍼널의 이름.
seconds_to_convert 사용자가 퍼널을 완료하는 데 걸리는 시간(초).
steps 퍼널 단계의 배열.

각 단계에는 name, target, action 키가 포함되어야 합니다.

설명
name 단계의 이름(고유한 슬러그).
action 수행된 동작. (pageview만 지원됨)
target 단계의 대상. (pageview만 지원되므로 경로여야 함)

퍼널 정의 예시

다음 예시는 1시간 내에 완료된 구매를 추적하는 퍼널을 정의합니다. 해당되는 세 개의 대상 페이지를 통해 사용자가 지나간 사용자를 추적합니다.

name: completed_purchase
seconds_to_convert: 3600
steps:
  - name: view_page_1
    target: '/page1.html'
    action: 'pageview'
  - name: view_page_2
    target: '/page2.html'
    action: 'pageview'
  - name: view_page_3
    target: '/page3.html'
    action: 'pageview'

퍼널 쿼리

REST API를 사용하여 퍼널 데이터에 쿼리할 수 있습니다. 아래 예시 쿼리 본문을 사용하여 FUNNEL_NAME을 퍼널의 이름으로 대체해야 합니다.

note
afterDate 필터를 지원하지 않습니다. beforeDate 또는 inDateRange를 사용해야 합니다.
{
  "query": {
      "measures": [
        "FUNNEL_NAME.count"
      ],
      "order": {
        "completed_purchase.count": "desc"
      },
      "filters": [
        {
          "member": "FUNNEL_NAME.date",
          "operator": "beforeDate",
          "values": [
            "2023-02-01"
          ]
        }
      ],
      "dimensions": [
        "FUNNEL_NAME.step"
      ]
    }
}

원시 데이터 내보내기

기본 저장 엔진에서의 원시 이벤트 데이터를 내보내면 디버깅 및 데이터 분석용 데이터 집합을 생성하는 데 도움이 됩니다.

Cube가 원시 데이터와 API 간의 추상화 계층으로 동작하기 때문에 내보낸 원시 데이터에는 몇 가지 주의 사항이 있습니다:

  • 데이터는 선택한 차원으로 그룹화됩니다. 따라서 내보낸 데이터는 불완전할 수 있으며, utcTimeuserAnonymousId를 모두 포함해야 합니다.
  • 데이터는 기본적으로 10,000개의 행으로 제한되지만 최대 50,000개의 행까지 제한을 늘릴 수 있습니다. 데이터 집합이 50,000개 이상인 경우 limitoffset 매개변수를 사용하여 결과를 페이징해야 합니다.
  • 데이터는 항상 JSON 형식으로 반환됩니다. 다른 형식으로 필요한 경우에는 해당 JSON을 선택한 스크립팅 언어를 사용하여 필요한 형식으로 변환해야 합니다.

이슈 391683에서 더 확장 가능한 내보내기 솔루션을 구현하는 데 드는 노력을 추적합니다.

Cube 쿼리를 사용하여 Raw 데이터 내보내기

REST API를 사용하여 Raw 데이터를 쿼리하고 JSON 출력을 필요한 형식으로 변환할 수 있습니다.

특정 차원의 Raw 데이터를 내보내려면 dimensions 키에 차원 디렉터리을 전달하십시오. 예를 들어, 다음 쿼리는 다음과 같이 나열된 속성의 Raw 데이터를 출력합니다.

POST /api/v4/projects/PROJECT_ID/product_analytics/request/load?queryType=multi

{
    "query":{
  "dimensions": [
    "TrackedEvents.docEncoding",
    "TrackedEvents.docHost",
    "TrackedEvents.docPath",
    "TrackedEvents.docSearch",
    "TrackedEvents.eventType",
    "TrackedEvents.localTzOffset",
    "TrackedEvents.pageTitle",
    "TrackedEvents.src",
    "TrackedEvents.utcTime",
    "TrackedEvents.vpSize"
  ],
  "order": {
    "TrackedEvents.apiKey": "asc"
  }
    }
}

요청이 성공하면 반환된 JSON에는 결과의 행 배열이 포함됩니다.

제품 분석 사용량 할당 보기

제품 분석 사용량 할당은 계기화된 애플리케이션에서 수신된 이벤트의 수에 따라 계산됩니다.

제품 분석 사용량 할당을 보려면:

  1. 왼쪽 사이드바에서 검색 또는 이동을 선택하고 그룹을 찾습니다.
  2. 설정 > 사용량 할당을 선택합니다.
  3. 제품 분석 탭을 선택합니다.

탭에는 그룹별 월간 총계와 프로젝트별 사용량 분할이 표시됩니다. 현재 월은 현재 날짜까지의 이벤트를 표시합니다.

사용량 할당에는 제품 분석에 온보딩되지 않은 프로젝트가 제외됩니다.

모범 사례

  • 처음부터 주요 지표와 목표를 정의하십시오. 수집된 데이터를 어떻게 사용할지 알기 위해 답변을 원하는 질문을 결정합니다.
  • 사용자 여정의 모든 단계에서 이벤트 데이터를 사용하십시오. 이 데이터는 사용자 경험을 포괄적으로 보여줍니다.
  • 팀의 요구에 맞게 대시보드를 구축하십시오. 서로 다른 팀은 서로 다른 데이터 인티그를 필요로 합니다.
  • 정기적으로 대시보드를 검토하십시오. 이렇게 함으로써 고객 결과를 확인하고 데이터의 트렌드를 식별하고 시각화를 업데이트할 수 있습니다.
  • Raw 데이터를 주기적으로 내보내십시오. 대시보드는 데이터 하위 집합에 대한 개요만 제공하므로 보다 심층적인 분석을 위해 데이터를 내보내어야 합니다.

문제 해결

수집된 이벤트가 없음

계측 세부 정보를 확인하고 제품 분석이 활성화되어 있는지, 올바르게 설정되어 있는지 확인하십시오.

제품 분석 액세스가 제한됨

제품 분석 공급자에 연결되어 있는지 확인하십시오.