[빅데이터 분석 기획] 빅데이터의 특징

1. 빅데이터 정의

빅데이터는 기존 데이터베이스 관리 시스템(DBMS)로 관리할 수 없는 양(수십 테라바이트)의 데이터이다.

빅데이터는 정형 및 (반정형, )비정형 데이터로부터 가치를 추출하고 결과를 분석하는 기술이다.

2. 데이터 표시 단위

킬로바이트<메가바이트<기가바이트<테라바이트<페타바이트<엑사바이트<제타바이트<요타바이트

데이터 표시 단위
데이터 표시 단위

3. 빅데이터 주요 특징

3V

Volume(양) : 대규모의 데이터를 분석

Variety(다양성): 정형, 반정형, 비정형 데이터를 포함하여 다양한 데이터를 분석

Velocity(속도) : 수집/분석/활용 속도

4V

3V + Value(가치): 수집 데이터를 분석해서 얻을 수 있는 가치

5V

4V + Veracity(정확성, 신뢰성): 노이즈 및 오류 제거를 통해 데이터의 품질 및 신뢰성 제공

4. DIKW , 빅데이터의 가치 피라미드

Data(데이터): 가공하기 전 수치나 기호, 객관적 사실

A 서점: 빅데이터 20% 할인(16,000원), 인공지능 15% 할인(17,000원)

B 서점: 빅데이터 10% 할인(18,000원), 인공지능 10% 할인(18,000원)

Infomation(정보): 데이터를 가공 및 처리한 결과, 연관 관계를 도출

A서점이 B서점보다 도서 가격이 싸다.

Knowledge(지식): 정보를 구조화하고 일반화하여 유의미한 결과물, 정보 기반으로 찾은 규칙

도서 구입은 A서점에서 구입한다.

Wisdom(지혜): 깊은 이해를 바탕으로 도출한 창의적 아이디어, 규칙을 상황에 맞게 적용

다른 상품(문방구)도 A서점이 쌀 것이라고 예측한다.

DKIW, 빅데이터 가치 피라미드
DKIW, 빅데이터 가치 피라미드

5. 데이터 기반 지식 경영

공통화(Socailization): 다른 사람과 상호작용으로 개인의 암묵지를 습득

수업, 과외, 스터디

표출화(Externalization): 개인의 지식을 문서화 및 매체로 만드는 과정

출간, 블로깅, 유튜브에 동영상 업로드

연결화(Combination): 문서나 매체를 통해 새로운 문서나 매체를 작성

책의 내용을 요약하여 블로그에 게시, 여러 책의 내용을 정리하여 논문 제출

내면화(Internalization): 문서나 매체를 통해 학습하여 개인이 지식을 얻는 과정

책을 통해 지식 습득, 유튜브를 통해 기술 습득

데이터 지식경영 상호작용
데이터 지식경영 상호작용