GitLab Duo 데이터 사용

GitLab Duo는 발전적 AI를 사용하여 여러분의 속도를 증가시키고 더 생산적으로 만들어줍니다. 각 AI 기반 기능은 독립적으로 작동하며 다른 기능에 필요하지 않습니다.

GitLab는 특정 작업을 위해 최고 수준의 대형 언어 모델(LLMs)을 사용합니다. 이 LLM은 Google Vertex AI 모델Anthropic Claude입니다.

점진적 향상

GitLab Duo AI 기반 기능은 DevSecOps 플랫폼 전반에 걸쳐 기존 GitLab 기능을 점진적으로 향상시키도록 설계되었습니다. 이러한 기능은 우아하게 실패하도록 설계되어야 하며, 기본 기능의 핵심 기능을 방해해서는 안 됩니다. 각 기능은 관련 기능 지원 정책에서 정의된 예상 기능에 따라 작동해야 합니다.

안정성 및 성능

GitLab Duo AI 기반 기능은 다양한 기능 지원 수준에서 제공됩니다. 이러한 기능의 특성으로 인해 사용량이 많아질 수 있으며, 이로 인해 기능의 성능 하락이나 예상치 못한 다운타임이 발생할 수 있습니다. 우리는 이러한 기능이 우아하게 저하되도록 구축했으며, 남용이나 오남용을 완화하기 위한 제어장치가 마련되어 있습니다. GitLab은 재량에 따라 언제든지 모든 또는 일부 고객을 위해 베타 및 실험적인 기능을 비활성화할 수 있습니다.

데이터 프라이버시

GitLab Duo AI 기반 기능은 생성적 AI 모델에 의해 제공됩니다. 어떠한 개인 데이터의 처리도 개인정보 처리방침에 따라 이루어집니다. 이러한 기능을 제공하기 위해 사용하는 서브 프로세서 목록은 서브 프로세서 페이지에서 확인하실 수 있습니다.

데이터 유지 기간

아래는 GitLab AI 모델 서브 프로세서의 현재 유지 기간을 나타냅니다.: - Anthropic은 출력이 제공된 후 즉시 모델 입력 및 출력 데이터를 삭제합니다. Anthropic은 현재 남용 모니터링을 위해 데이터를 저장하지 않습니다. 모델 입력 및 출력은 모델 훈련에 사용되지 않습니다. GitLab은 Anthropic과의 GitLab Duo 요청을 위해 제로 데이터 유지 협약을 체결했습니다. - Google은 출력이 제공된 후 즉시 모델 입력 및 출력 데이터를 삭제합니다. Google은 현재 남용 모니터링을 위해 데이터를 저장하지 않습니다. 모델 입력 및 출력은 모델 훈련에 사용되지 않습니다. 추가로, GitLab은 GitLab Duo 요청에 대해 캐싱을 비활성화했습니다.

모든 이러한 AI 제공업체는 고객 콘텐츠를 자체 목적으로 사용하는 것을 금지하는 GitLab의 데이터 보호 협약 하에 있습니다.

GitLab은 고객이 GitLab 지원 티켓을 통해 동의를 제공하지 않는 한 입력 및 출력 데이터를 보관하지 않습니다. AI 기능 로깅에 대해 더 알아보세요.

훈련 데이터

GitLab은 비공개(비공개) 데이터를 기반으로 생성적 AI 모델을 훈련시키지 않습니다. 우리가 협력하는 공급업체들도 비공개 데이터를 기반으로 모델을 훈련하지 않습니다.

AI 서브 프로세서에 대한 자세한 내용은 다음을 참조하세요: - Google Vertex AI 모델 API 데이터 관리, 책임 있는 AI, 파운데이션 모델 훈련에 대한 상세 정보, Google Secure AI Framework (SAIF), 및 릴리스 노트. - Anthropic Claude의 헌장, 훈련 데이터 FAQ, 모델 개요, 및 최신 데이터에 대한 기사.

텔레메트리

GitLab Duo는 Snowplow 수집기를 통해 집계된 또는 식별 제거된 퍼스트파티 사용 데이터를 수집합니다. 이 사용 데이터에는 다음과 같은 메트릭이 포함됩니다: - 고유 사용자 수 - 고유 인스턴스 수 - 프롬프트 및 접미어 길이 - 사용된 모델 - 상태 코드 응답 - API 응답 시간 - Code Suggestions는 또한 다음을 수집합니다: - 건의된 언어(예: Python) - 사용된 편집기(예: VS Code) - 보여진 건의 사항, 수락된 건의 사항, 거부된 건의 사항 또는 오류가 발생한 건의 사항의 수 - 건의 사항이 표시된 기간

모델 정확도 및 품질

생성적 AI는 예상치 못한 결과를 가져올 수 있습니다. 이러한 결과는 다음과 같을 수 있습니다: - 저품질 - 부호가 명확하지 않음 - 불완전함 - 실패한 파이프라인 생성 - 보안 위협을 야기할 수 있는 코드 - 모욕적이거나 민감할 수 있음 - 최신 정보가 아닐 수 있음

GitLab은 모든 AI 지원 기능을 능동적으로 반복하여 생성된 콘텐츠의 품질을 향상시키고 있습니다. 이러한 기능을 향상시키기 위해 프롬프트 엔지니어링, 이러한 기능을 지원하는 새로운 AI/ML 모델을 평가, 이러한 기능에 직접 내장된 새로운 휴리스틱을 통해 품질을 향상시키고 있습니다.