정형데이터와 비정형데이터를 구분하는 실습을 해봅시다.

우리가 접하는 데이터들은 아주 빠른 속도로 생성되고 그 양이 증가하고 있습니다.
다양한 데이터들은 그 형태에 따라 정형 데이터, 비정형 데이터, 반정형 데이터로 나뉩니다.

정형 데이터: 구조가 명확하게 정의된 구조적 데이터로, 속성과 값이 구분 및 정리될 수 있으며 고정된 형식으로 저장 가능한 데이터
비정형 데이터: 구조를 명확하게 정의하기 어려워 명확한 속성이 정의 되어있지 않은 데이터로, 가공을 통해 속성 추출이 가능한 데이터
반정형 데이터: 정형데이터와 비정형데이터의 중간 형태로, 구조 형태(Schema, Meta Data)가 있지만, 연산이 불가능한 데이터

이번 차시에서는 정형/비정형 데이터를 살펴보고 다음의 실습을 수행합니다.

  • 정형/비정형 데이터를 구분
  • 비정형 데이터를 정형 데이터로 바꾸어 표현
  • 정형 데이터 내에서 문제를 해결하기 위해 어떤 데이터 속성이 필요한지를 결정

이번 실습을 통해 데이터를 분석하고 문제를 해결하는 데 도움이 되는 주요 속성을 이해하고, 데이터 분석 능력을 향상시킬 수 있습니다.