인공지능데이터 품질 인증 표준 분석 데이터 인증 프로세스 구현방안 연구 대표이미지

인공지능데이터 품질 인증 표준 분석 데이터 인증 프로세스 구현방안 연구

저자 : 정규희(표준R&D센터)

발간일 : 2022.04.27
2284

개요

JTC1 SC 42 WG 3에서 작성하는 ISO/IEC 5259 시리즈 분석입니다.

머신러링에 대한 데이터 품질 요구사항 입니다.


인공지능
학습용 데이터 품질관리 지표는 국내 · 외 데이터 품질관리 지표 등 7 개 사례의 103 개 지표 항목을 대상으로 분석하였다.

• 인공지능 학습용 데이터 품질관리 지표 사례 : 인공지능 데이터 품질관리 요구사항 (TTA)“
• 국내 데이터 품질관리 지표 사례 : 공공데이터 품질관리 지표 (NIA)”, 빅데이터 플랫폼 및 센터 데이터 품질관리 지표 (NIA)”, 데이터 품질관리 지표 (K DATA)”
• 국내 비정형 데이터 품질관리 지표 사례 : 비정형데이터 유형별 품질 지표 (K DATA)”, “ 국가공간정보센터 품질 기준 국토교통부 )”
• 해외 인공지능 데이터 품질관리 지표 사례 : “Data quality for analytics and machine learning Part 4: Data quality process framework(ISO/IEC WD 5259 4:2020(E))”


별첨 1. 품질관리 기준 및 체크리스트


주요 요지



품질관리는 데이터 품질과 관련한 조직을 지휘하고 통제하기 위한 활동을 의미한다. 데이터 품질관리의 영역은 크게 두가지 영역으로 나누어져있다. 구조적 품질 영역 표준화 과 데이터 값 컨텐츠 의 영역이다 데이터 품질관리 기능을 통해 조직은 비즈니스 요구사항에 맞는 데이터 품질이 적절한 수준인지 확인할 수 있다 . 특히 국내 데이터 품질의 모든 평가 기준과 가이드는 정형 데이터에 국한되어 있으며 최근 빅데이터등과 같이 정형 · 비정형 데이터의수집 , 가공 , 활용 등을 위해서 정형데이터에서 비정형데이터를 포함한 품질기준 및 가이드를 수립해 가고 있는 상황이다 . 본 연구에서는 ISO 8000 시리즈를 통해계획 실행 평가 개선의 주기로 이뤄진 데이터 품 질관리 프로세스의 구조를 살펴본 바 있으며 , ISO/IEC 5259 시리즈를 통해 데이터 품질관리 프로세스에 대한 특징을 확인 하였 다 . 그 과정에서 데이터 유형을 특징짓는 항목과 정확도 , 안전성 등과 같은 15 가 지 특성을 살펴 보았다


현재 국제표준에서는 데이터 품질인증은 ISO 8000의 품질인증을 사용하고 있고
                    디지털 트윈의 품질인증은 ISO 8004 표준으로 추진하려고 하고 있습니다.


      인공지능에 대한 데이터 품질은 ISO/IEC 5259(WD) 시리즈 단계를 진행하고 있어 수정해야 할 부분이 많이 있습니다.


목록