GT파일 업로드
외부에서 작성된 라벨링 데이터(GT 파일)을 업로드하세요.
GT(Ground Truth) 파일이란?
Ground Truth는 기상학에서 유래된 용어로, 어느 한 장소에서 수집된 정보를 의미합니다. 기계 학습의 관점에서 보았을 때 Ground Truth는 학습하고자 하는 데이터의 원본 혹은 실제 값을 표현할 때 사용합니다.
인공지능 데이터 분야에서 Ground Truth는 AI 모델 출력값을 훈련 및 테스트하는 데 사용되는 실제 환경의 데이터를 지칭하는 용어입니다. Ground Truth 데이터는 자율주행과 오디오 또는 음성 인식 등 여러 AI 응용 사례에 필요합니다.
- GT 파일 업로드 포맷은 JSON만 지원합니다.
업로드 조건
: 업로드한 리소스 파일과 동일한 폴더 구조 및 파일명으로 JSON 파일 구조로 되어 있어야 합니다.
-
프로젝트에 설정된 작업 유형(Bbox, Keypoint 등), 클래스 및 속성 이름 및 값까지 동일해야 합니다.
-
대소문자, 띄어쓰기가 달라도 업로드 실패가 됩니다.
-GT 파일 업로드 실패 사례(1)
프로젝트에 등록된 클래스 명 : car /
JSON에 적힌 클래스 명 : Car프로젝트에 없는 조건으로 실패 사례(2)
프로젝트에 등록된 A 클래스 하위에 속성 weather의 값: sunny, cloudy, rainy
JSON에 적힌 weather 속성값 : snow
GT 업로드 포맷 및 유효성
GT Upload Schema
{
"annotations": [
{
"id": "26-abd21cb9-cb89-4cf4-8de6-b0a6421024b3",
"type": "poly_seg",
"attributes": {},
"track_id": "1",
"points": [
[
905,
44
],
[
1280,
228
],
[
1272,
232
]
],
"label": "Road"
}
],
"attributes": {},
"label": "Classification",
"filename": "1020312_0_2023-05-03_17-10-44_1683133844_0001584.jpg",
"parent_path": "/0000/3576612_0_2023-04-03_17-10-44_1683133844",
}
}
GT Upload Field Definition
Name | Type | Description | Example |
---|---|---|---|
annotations | list[object] | 어노테이션 정보 | 각 Annotation 타입 별 Annotation 필드 참조 |
attributes | object | 작업유형 Classification의 속성 설정 시 classification의 attribute와 동일 Classification이 없으면 {} | { "속성명": "속성값", "속성명": "속성값" } 미설정시 ⇒ {} |
label | string | Classification의 클래스 명 Classification이 없으면 필드 제거 | |
filename | string | 파일명 * 리소스 유형 Sequence Image, Point Cloud의 경우 씬파일 내 프레임에 해당 | image (28).jpeg |
parent_path | string | 파일의 부모 경로 | / |
GT 파일 각 필드별 생성 가이드
- annotations 필드
- id 정의
- 숫자로 시작하며, 뒤의 문자열 부분이 uuid형식으로 작성 합니다.
- ex. 26-abd21cb9-cb89-4cf4-8de6-b0a6421024b3
- attributes 정의
- key값과 value값이 라벨링 설정에 등록되어 있어야 합니다.
- type 정의
- [Single/Sequence Image(Vector)] : Bounding Box, Polygon, Polyline, Segmentation일 경우
- annotations > points :좌표가 실수 혹은 정수값이고, 작업영역을 벗어나지 않도록 해야합니다.
- [Single/Sequence Image(Vector)] : Bounding Box, Polygon, Polyline, Segmentation일 경우
- id 정의
- parent_path, filename과 일치하는 파일이 작업시작되어 있지 않아야 합니다.
- 단, parent_path와 filename은 필수로 작성되어야 합니다.
- attributes 필드
- key값과 value값이 라벨링 설정에 등록되어 있어야 합니다.
- sequence_image 의 경우 annotations의 track_id가 중복되지 않아야 합니다.
- file_id의 경우 정보가 생략되어도 업로드에 영향을 받지 않습니다.
유효성 검사
- 상태 유효성검사 : 작업이 시작되지 않은 상태를 확인합니다.
- 파일 경로 존재 여부 검사 : 실제 파일이 경로명에 존재하는지 검사합니다.
- annotation 검사 : 프로젝트 설정에 맞는 annotation 데이터를 검사합니다.
다른 질문이 있으신가요? help@aimmo.ai으로 문의주세요.
Updated about 2 months ago