GuidesAPI ReferenceChangelogDiscussions
Log In
Guides

GT파일 업로드

외부에서 작성된 라벨링 데이터(GT 파일)을 업로드하세요.

GT(Ground Truth) 파일이란?

Ground Truth는 기상학에서 유래된 용어로, 어느 한 장소에서 수집된 정보를 의미합니다. 기계 학습의 관점에서 보았을 때 Ground Truth는 학습하고자 하는 데이터의 원본 혹은 실제 값을 표현할 때 사용합니다.

인공지능 데이터 분야에서 Ground Truth는 AI 모델 출력값을 훈련 및 테스트하는 데 사용되는 실제 환경의 데이터를 지칭하는 용어입니다. Ground Truth 데이터는 자율주행과 오디오 또는 음성 인식 등 여러 AI 응용 사례에 필요합니다.

  • GT 파일 업로드 포맷은 JSON만 지원합니다.
  • 업로드 조건 : 업로드한 리소스 파일과 동일한 폴더 구조 및 파일명으로 JSON 파일 구조로 되어 있어야 합니다.

  • 프로젝트에 설정된 작업 유형(Bbox, Keypoint 등), 클래스 및 속성 이름 및 값까지 동일해야 합니다.

  • 대소문자, 띄어쓰기가 달라도 업로드 실패가 됩니다.
    -GT 파일 업로드 실패 사례(1)
    프로젝트에 등록된 클래스 명 : car /
    JSON에 적힌 클래스 명 : Car

    프로젝트에 없는 조건으로 실패 사례(2)
    프로젝트에 등록된 A 클래스 하위에 속성 weather의 값: sunny, cloudy, rainy
    JSON에 적힌 weather 속성값 : snow


GT 업로드 포맷 및 유효성

GT Upload Schema

{
    "annotations": [
        {
            "id": "26-abd21cb9-cb89-4cf4-8de6-b0a6421024b3",
            "type": "poly_seg",
            "attributes": {},
            "track_id": "1",
            "points": [
                [
                    905,
                    44
                ],
                [
                    1280,
                    228
                ],
                [
                    1272,
                    232
                ]
            ],
            "label": "Road"
        }
    ],
    "attributes": {},
  	"label": "Classification",
    "filename": "1020312_0_2023-05-03_17-10-44_1683133844_0001584.jpg",
    "parent_path": "/0000/3576612_0_2023-04-03_17-10-44_1683133844",
    }
}

GT Upload Field Definition

NameTypeDescriptionExample
annotationslist[object]어노테이션 정보각 Annotation 타입 별 Annotation 필드 참조
attributesobject작업유형 Classification의 속성 설정 시 classification의 attribute와 동일

Classification이 없으면 {}
{
"속성명": "속성값",
"속성명": "속성값"
}
미설정시 ⇒ {}
labelstringClassification의 클래스 명

Classification이 없으면 필드 제거
filenamestring파일명

* 리소스 유형 Sequence Image, Point Cloud의 경우 씬파일 내 프레임에 해당
image (28).jpeg
parent_pathstring파일의 부모 경로/

GT 파일 각 필드별 생성 가이드

  1. annotations 필드
    1. id 정의
      1. 숫자로 시작하며, 뒤의 문자열 부분이 uuid형식으로 작성 합니다.
      • ex. 26-abd21cb9-cb89-4cf4-8de6-b0a6421024b3
    2. attributes 정의
      1. key값과 value값이 라벨링 설정에 등록되어 있어야 합니다.
    3. type 정의
      1. [Single/Sequence Image(Vector)] : Bounding Box, Polygon, Polyline, Segmentation일 경우
        • annotations > points :좌표가 실수 혹은 정수값이고, 작업영역을 벗어나지 않도록 해야합니다.
  2. parent_path, filename과 일치하는 파일이 작업시작되어 있지 않아야 합니다.
    • 단, parent_path와 filename은 필수로 작성되어야 합니다.
  3. attributes 필드
    1. key값과 value값이 라벨링 설정에 등록되어 있어야 합니다.
  4. sequence_image 의 경우 annotations의 track_id가 중복되지 않아야 합니다.
  5. file_id의 경우 정보가 생략되어도 업로드에 영향을 받지 않습니다.

유효성 검사

  • 상태 유효성검사 : 작업이 시작되지 않은 상태를 확인합니다.
  • 파일 경로 존재 여부 검사 : 실제 파일이 경로명에 존재하는지 검사합니다.
  • annotation 검사 : 프로젝트 설정에 맞는 annotation 데이터를 검사합니다.

에이모 (서비스명) 산출물 양식 참고



다른 질문이 있으신가요? help@aimmo.ai으로 문의주세요.