제안된 리뷰어 데이터 사용

Tier: Ultimate Offering: GitLab.com

작동 방식

GitLab Duo 제안된 리뷰어는 사용자 중심의 첫 번째 GitLab 기계 학습(ML)을 활용한 기능입니다. 프로젝트의 기여 그래프를 활용하여 제안을 생성합니다. 이 데이터는 이미 GitLab 내에 존재하며, 병합 요청 메타데이터, 소스 코드 파일 및 GitLab 사용자 계정 메타데이터를 활용합니다.

기능 활성화

프로젝트 유지보수자 또는 소유자가 프로젝트 설정에서 제안된 리뷰어를 활성화하면, GitLab은 프로젝트에 대한 데이터 추출 작업을 시작합니다. 이 작업은 병합 요청 API를 활용하여 리뷰의 패턴을 이해하고 최근성, 도메인 경험 및 빈도를 고려하여 적절한 리뷰어를 제안합니다. 프로젝트가 병합 요청 승인 프로세스를 사용하지 않거나 병합 요청 데이터가 없는 경우, 제안된 리뷰어는 리뷰어를 제안할 수 없습니다.

이 데이터 추출 작업은 몇 시간이 걸릴 수 있으며(최대 하루), 프로젝트의 크기에 크게 의존합니다. 이 과정은 자동화되어 있으며 해당 과정 중에는 조치가 필요하지 않습니다. 데이터 추출이 완료되면, 병합 요청에서 제안을 받을 수 있게 됩니다.

제안 생성

제안된 리뷰어가 활성화되고 데이터 추출이 완료되면, 새로운 병합 요청이나 기존 병합 요청에 대한 새로운 커밋이 자동으로 제안된 리뷰어 ML 모델 추론을 트리거하여 최대 5명의 제안된 리뷰어를 생성합니다. 이 제안은 병합 요청의 변경 사항과 관련됩니다. 추가적인 커밋은 리뷰어 제안을 변경할 수 있으며, 이는 리뷰어 드롭다운 목록에서 자동으로 업데이트됩니다.

점진적 개선

이 기능은 기존의 GitLab 리뷰어 기능에 대한 점진적 개선으로 설계되었습니다. GitLab 리뷰어 UI는 ML 엔진이 권장 사항을 제공할 수 있는 경우에만 제안을 제공합니다. 문제가 발생하거나 모델 추론이 실패하는 경우에도 기능은 우아하게 감소합니다. 제안된 리뷰어 사용으로 사용자가 수동으로 리뷰어를 설정하는 것을 방해하지 않습니다.

모델 정확도

기관은 코드 리뷰에 대해 다양한 프로세스를 사용합니다. 일부는 주니어 엔지니어의 코드를 시니어 엔지니어가 검토하는 데 중점을 두고, 다른 사람은 계층적 조직 구조 기반의 리뷰를 수행합니다. 제안된 리뷰어는 사용자들의 병합 요청 활동을 기반으로 문맥적 리뷰어를 중점으로 두고 있습니다. 기존의 ML 모델을 계속 발전시켜 다양한 코드 리뷰 사용 사례와 프로세스에 더욱 잘 맞추기는 하지만, 제안된 리뷰어는 코드 소유자 및 승인 규칙과 같은 다른 코드 리뷰 기능의 사용을 대체하지는 않습니다. 리뷰어 선택은 매우 주관적이기 때문에, 우리는 제안된 리뷰어가 항상 완벽한 제안을 제공할 것으로 기대하지는 않습니다.

베타 고객 사용 분석을 통해, 제안된 리뷰어 ML 모델이 제안을 받아들이는 경우가 60%임을 확인했습니다. 우리는 모델을 개선하기 위해 향후에 제안된 리뷰어 기능에 피드백 메커니즘을 도입할 계획이며, 또한 향후에는 프로젝트 데이터를 모델의 교육에 사용하도록 허용하는 선택 기능을 제공할 계획입니다.

기본 설정 해제

제안된 리뷰어는 기본적으로 비활성화되어 있으며, 프로젝트 소유자 또는 관리자가 기능을 활성화해야 합니다.

데이터 프라이버시

제안된 리뷰어는 GitLab.com 인프라 내에서 완전히 작동하며, GitLab.com의 다른 기능과 동일한 개인 정보 보호보안 수준을 제공합니다.

이 기능을 활성화하기 위해 추가 데이터를 수집하지 않습니다. GitLab은 훈련된 기계 학습 모델에 대한 병합 요청을 추론합니다. 소스 코드의 내용은 교육 데이터로 사용되지 않습니다. 데이터는 GitLab.com을 벗어나지 않으며, 모든 훈련 및 추론은 GitLab.com 인프라 내에서 이루어집니다.

GitLab.com 보안에 대해 더 알아보기