제안된 리뷰어 데이터 사용
작동 방식
GitLab Duo Suggested Reviewers는 사용자를 대상으로 하는 첫 번째 GitLab 기계 학습(ML)을 활용한 기능입니다. 이 기능은 프로젝트의 기여 그래프를 활용하여 제안을 생성합니다. 이 데이터는 이미 GitLab 내에 있으며, Merge Request 메타데이터, 소스 코드 파일 및 GitLab 사용자 계정 메타데이터를 활용합니다.
기능 활성화
프로젝트 유지 관리자 또는 소유자가 프로젝트 설정에서 제안된 리뷰어를 활성화하면, GitLab은 프로젝트에 대한 데이터 추출 작업을 시작합니다. 이 작업은 Merge Request API를 활용하여 리뷰 패턴, 최근성, 도메인 경험 및 빈도를 이해하여 적절한 리뷰어를 제안합니다. 프로젝트가 Merge Request 승인 프로세스를 사용하지 않거나 Merge Request 데이터가 없는 경우, 제안된 리뷰어는 리뷰어를 제안할 수 없습니다.
이 데이터 추출 작업은 수 시간에서 하루 정도 걸릴 수 있으며, 이는 프로젝트의 크기에 크게 의존합니다. 이 프로세스는 자동화되어 있으며, 이 과정 중에는 별도의 조치가 필요하지 않습니다. 데이터 추출이 완료되면, Merge Request에서 제안을 받을 수 있습니다.
제안 생성
제안된 리뷰어가 활성화되고 데이터 추출이 완료되면, 새로운 Merge Request이나 기존 Merge Request에 대한 새로운 커밋은 자동으로 제안된 리뷰어 ML 모델 추론을 트리거하고 최대 5명의 제안된 리뷰어를 생성합니다. 이러한 제안은 Merge Request의 변경 사항과 관련이 있습니다. Merge Request에 대한 추가 커밋은 리뷰어 제안을 변경할 수 있으며, 이는 리뷰어 드롭다운 디렉터리에서 자동으로 업데이트됩니다.
점진적 향상
이 기능은 기존의 GitLab 리뷰어 기능에 대한 점진적 개선으로 설계되었습니다. GitLab 리뷰어 UI는 ML 엔진이 권장 사항을 제공할 수 있는 경우에만 제안을 제공합니다. 문제가 발생하거나 모델 추론이 실패하는 경우, 이 기능은 우아하게 저하됩니다. 제안된 리뷰어 사용으로 사용자가 매뉴얼으로 리뷰어를 설정하는 것을 어떤 시점에서도 방해하지 않습니다.
모델 정확도
조직은 코드 검토에 대해 다양한 프로세스를 사용합니다. 일부는 주니어 엔지니어의 코드를 검토하는 시니어 엔지니어에 중점을 두고 있으며, 다른 사람들은 등급별 조직 구조 기반의 검토를 갖고 있습니다. 제안된 리뷰어는 사용자에 의해 과거 Merge Request 활동에 기반한 컨텍스트 리뷰어에 중점을 두고 있습니다. 우리는 기존에 다른 코드 검토 기능(예: 코드 소유자 및 승인 규칙)의 사용을 대체하는 것으로 제안된 리뷰어를 매번 완벽한 제안을 제공하지 않을 것으로 예상하지 않습니다.
베타 고객 사용 분석을 통해, 제안된 리뷰어 ML 모델은 경우에 따라서 60%의 케이스에서 채택된 제안을 제공합니다. 우리는 이후 제안된 리뷰어 기능에 피드백 매커니즘을 도입하여 사용자가 잘못된 리뷰어 제안을 신고하여 모델을 개선할 수 있도록 할 계획입니다. 또한 우리는 앞으로 프로젝트 데이터를 사용하여 기본 모델을 교육하는 것을 허용하는 선택 기능을 제공할 계획입니다.
기본으로 비활성화
제안된 리뷰어는 기본적으로 비활성화되어 있으며, 프로젝트 소유자 또는 관리자가 이 기능을 활성화해야 합니다.
데이터 개인 정보 보호
제안된 리뷰어는 GitLab.com 인프라 내에서 완전히 작동하며, GitLab.com의 다른 기능과 동일한 개인 정보 보호 및 보안 수준을 제공합니다.
이 기능을 활성화하기 위해 추가 데이터를 수집하지 않습니다. GitLab은 교육된 기계 학습 모델을 통해 Merge Request을 추론합니다. 소스 코드의 내용은 교육 데이터로 사용되지 않습니다. 사용자의 데이터는 GitLab.com을 벗어나지 않으며, 모든 교육 및 추론은 GitLab.com 인프라 내에서 이루어집니다.