GuidesAPI ReferenceChangelogDiscussions
Log In
Guides

GT파일 업로드

외부에서 작성된 라벨링 데이터(GT 파일)을 업로드하세요.

GT(Ground Truth) 파일이란?

Ground Truth는 기상학에서 유래된 용어로, 어느 한 장소에서 수집된 정보를 의미합니다. 기계 학습의 관점에서 보았을 때 Ground Truth는 학습하고자 하는 데이터의 원본 혹은 실제 값을 표현할 때 사용합니다.

인공지능 데이터 분야에서 Ground Truth는 AI 모델 출력값을 훈련 및 테스트하는 데 사용되는 실제 환경의 데이터를 지칭하는 용어입니다. Ground Truth 데이터는 자율주행과 오디오 또는 음성 인식 등 여러 AI 응용 사례에 필요합니다.

  • GT 파일 업로드 포맷은 JSON만 지원합니다.
  • 업로드 조건 : 업로드한 리소스 파일과 동일한 폴더 구조 및 파일명으로 JSON 파일 구조로 되어 있어야 합니다.

  • 프로젝트에 설정된 작업 유형(Bbox, Keypoint 등), 클래스 및 속성 이름 및 값까지 동일해야 합니다.

  • 대소문자, 띄어쓰기가 달라도 업로드 실패가 됩니다.
    -GT 파일 업로드 실패 사례(1)
    프로젝트에 등록된 클래스 명 : car /
    JSON에 적힌 클래스 명 : Car

    프로젝트에 없는 조건으로 실패 사례(2)
    프로젝트에 등록된 A 클래스 하위에 속성 weather의 값: sunny, cloudy, rainy
    JSON에 적힌 weather 속성값 : snow


GT 업로드 포맷 및 유효성

GT Upload Schema

{
  "annotations": [
    {
      "id": "26-abd21cb9-cb89-4cf4-8de6-b0a6421024b3",
      "type": "poly_seg",
      "attributes": {},
      "points": [
        [
          905,
          44
        ],
        [
          1280,
          228
        ],
        [
          1272,
          232
        ]
      ],
        "label": "Road"
      }
    ],
    "attributes": {},
    "file_id": "6465703408f21776587bbdac",
    "filename": "1020312_0_2023-05-03_17-10-44_1683133844_0001584.jpg",
    "parent_path": "/0000/3576612_0_2023-04-03_17-10-44_1683133844",
    "metadata": {
      "height": 1080,
      "width": 1920
    }
  }

GT Upload Field Definition

NameTypeDescriptionExample
annotationslist[object]어노테이션 정보각 Annotation 타입 별 Annotation 필드 참조
attributesobject작업유형 Classification의 속성 설정 시 classification의 attribute와 동일

Classification이 없으면 {}
{
"속성명": "속성값",
"속성명": "속성값"
}
미설정시 ⇒ {}
file_idobject파일의 아이디620aea6c1e3c3ccd9cfd8bc9
scene_idstring씬파일의 아이디

* 리소스 유형 Sequence Image, Point Cloud가 아닐경우 field가 존재하지 않음
620aea6c1e3c3ccd9cfd8bc8
filenamestring파일명

* 리소스 유형 Sequence Image, Point Cloud의 경우 씬파일 내 프레임에 해당
image (28).jpeg
parent_pathstring파일의 부모 경로/
last_modifier_idstring최종 수정자 id5fc7323e8511afbb60e8554b
metadataobject리소스 유형별 파일 메타데이터
Image : 이미지 크기
PointCloud, Text : {} 빈값
Video : fps (프레임)
# 이미지일 경우{
"height": 1080,
"width": 1920
}

# 비디오일 경우{
“fps” : 30
}
last_workersobject각 단계 별 마지막 작업자{
"라벨링": "5fc7323e8511afbb60e8554b",
"검수": null,
"최종 검수": null
}
tagslist[object]파일의 태그값
*태그 포함여부 체크하지 않으면 field가 존재하지 않음
tag 적용 돼있을 시 ⇒ [”car”]
tag 미적용 시 ⇒ 필드 없음
parent_tagslist[object]폴더의 태그값
*태그 포함여부 체크하지 않으면 field가 존재하지 않음
tag 적용 돼있을 시 ⇒ [”1차작업”]
tag 미적용 시 ⇒ 필드 없음
labelstring작업 유형 Classification일 경우에만 존재

*작업유형에 Classification이 없으면 field가 존재하지 않음
“Classification”

GT 파일 각 필드별 생성 가이드

  1. annotations 필드
    1. id 정의
      1. 숫자로 시작하며, 뒤의 문자열 부분이 uuid형식으로 작성 합니다.
      • ex. 26-abd21cb9-cb89-4cf4-8de6-b0a6421024b3
    2. attributes 정의
      1. key값과 value값이 라벨링 설정에 등록되어 있어야 합니다.
    3. type 정의
      1. [Single/Sequence Image(Vector)] : Bounding Box, Polygon, Polyline, Segmentation일 경우
        • annotations > points :좌표가 실수 혹은 정수값이고, 작업영역을 벗어나지 않도록 해야합니다.
  2. parent_path, filename과 일치하는 파일이 작업시작되어 있지 않아야 합니다.
    • 단, parent_path와 filename은 필수로 작성되어야 합니다.
  3. attributes 필드
    1. key값과 value값이 라벨링 설정에 등록되어 있어야 합니다.
  4. sequence_image 의 경우 annotations의 track_id가 중복되지 않아야 합니다.
  5. file_id의 경우 정보가 생략되어도 업로드에 영향을 받지 않습니다.

유효성 검사

  • 상태 유효성검사 : 작업이 시작되지 않은 상태를 확인합니다.
  • 파일 경로 존재 여부 검사 : 실제 파일이 경로명에 존재하는지 검사합니다.
  • annotation 검사 : 프로젝트 설정에 맞는 annotation 데이터를 검사합니다.

에이모 (서비스명) 산출물 양식 참고



다른 질문이 있으신가요? [email protected]으로 문의주세요.