제안된 리뷰어 데이터 사용
작동 방식
GitLab Duo Suggested Reviewers는 첫 번째 사용자 지향 GitLab 기계 학습(ML) 기능입니다. 이 기능은 프로젝트의 기여 그래프를 활용하여 제안을 생성합니다. Merge Request 메타데이터, 소스 코드 파일 및 GitLab 사용자 계정 메타데이터와 같은 데이터는 이미 GitLab 내에 존재합니다.
기능 활성화
프로젝트 유지 관리자 또는 소유자가 프로젝트 설정에서 제안된 리뷰어를 활성화하면, GitLab은 해당 프로젝트에 대한 데이터 추출 작업을 시작합니다. 이는 Merge Request API를 활용하여 리뷰 패턴을 이해하고 최신성, 도메인 경험 및 빈도를 고려하여 적절한 리뷰어를 제안합니다. 프로젝트가 Merge Request 승인 프로세스를 사용하지 않거나 과거 Merge Request 데이터가 없는 경우, 제안된 리뷰어는 리뷰어를 제안할 수 없습니다.
이 데이터 추출 작업은 수 시간이 걸릴 수 있으며(최대 일 수 있음), 프로젝트의 크기에 매우 의존적입니다. 이 프로세스는 자동화되어 있으며 이 과정 동안 추가 조치가 필요하지 않습니다. 데이터 추출이 완료되면 Merge Request에서 제안을받기 시작합니다.
제안 생성
제안된 리뷰어가 활성화되고 데이터 추출이 완료되면, 새로운 Merge Request 또는 기존 Merge Request에 대한 새로운 커밋이 자동으로 제안된 리뷰어 ML 모델 추론을 트리거하고 최대 5명의 제안된 리뷰어를 생성합니다. 이러한 제안은 Merge Request의 변경 사항에 맞춰 컨텍스트가 있는 것입니다. Merge Request에 대한 추가 커밋은 리뷰어 제안을 변경할 수 있으며, 이는 리뷰어 드롭다운 디렉터리에서 자동으로 업데이트됩니다.
점진적 향상
이 기능은 기존의 GitLab Reviewers 기능에 대한 점진적인 개선으로 설계되었습니다. GitLab Reviewer UI는 ML 엔진이 권장 사항을 제공할 수 있는 경우에만 제안을합니다. 문제가 발생하거나 모델 추론이 실패하는 경우, 이 기능은 원활하게 저하됩니다. 제안된 리뷰어 사용으로 사용자가 매뉴얼으로 리뷰어를 설정하는 것을 방지하지 않습니다.
모델 정확도
조직은 코드 리뷰를 위해 다양한 프로세스를 사용합니다. 어떤 조직은 주니어 엔지니어의 코드를 시니어 엔지니어가 검토하는 데 중점을 두고 다른 조직은 계층적 조직 구조에 기반한 리뷰를 수행합니다. 제안된 리뷰어는 사용자에 의한 과거 Merge Request 활동에 기반한 문맥적 리뷰어에 중점을 두고 있습니다. ML 모델의 기저를 더 잘 사용하여 여러 코드 리뷰 사용 사례와 프로세스를 더 잘 제공하도록 계속 발전하는 동안 제안된 리뷰어는 Code Owners 및 코드 승인 규칙과 같은 다른 코드 리뷰 기능의 사용을 대체하지는 않습니다. 리뷰어 선택은 매우 주관적이므로, 우리는 제안된 리뷰어가 항상 완벽한 제안을 제공하지는 않을 것으로 예상하지 않습니다.
베타 고객 사용 분석을 통해 제안된 리뷰어 ML 모델이 채택된 제안을 60% 채택한다는 것을 발견했습니다. 우리는 모델을 개선하기 위해 사용자가 나쁜 리뷰어 제안을 표시할 수 있도록 제안된 리뷰어 기능에 피드백 메커니즘을 도입할 계획입니다. 또한 향후에는 프로젝트 데이터를 모델의 학습에 사용할 수 있도록 하는 옵트인 기능을 제공할 계획입니다.
기본으로 꺼져 있음
제안된 리뷰어는 기본적으로 꺼져 있으며, 프로젝트 소유자 또는 관리자가 이 기능을 활성화해야 합니다.
데이터 프라이버시
제안된 리뷰어는 GitLab.com 인프라 내에서 완전히 운영되며, GitLab.com의 다른 기능과 동일한 개인 정보 및 보안 수준을 제공합니다.
이 기능을 활성화하기 위해 추가 데이터가 수집되지 않습니다. GitLab은 교육된 기계 학습 모델에 대한 Merge Request을 추론합니다. 소스 코드의 내용은 교육 데이터로 사용되지 않습니다. 데이터는 GitLab.com을 떠나지 않으며, 교육 및 추론은 모두 GitLab.com 인프라 내에서 수행됩니다.