1. 빅데이터 정의
빅데이터는 기존 데이터베이스 관리 시스템(DBMS)로 관리할 수 없는 양(수십 테라바이트)의 데이터이다.
빅데이터는 정형 및 (반정형, )비정형 데이터로부터 가치를 추출하고 결과를 분석하는 기술이다.
2. 데이터 표시 단위
킬로바이트<메가바이트<기가바이트<테라바이트<페타바이트<엑사바이트<제타바이트<요타바이트
3. 빅데이터 주요 특징
3V
Volume(양) : 대규모의 데이터를 분석
Variety(다양성): 정형, 반정형, 비정형 데이터를 포함하여 다양한 데이터를 분석
Velocity(속도) : 수집/분석/활용 속도
4V
3V + Value(가치): 수집 데이터를 분석해서 얻을 수 있는 가치
5V
4V + Veracity(정확성, 신뢰성): 노이즈 및 오류 제거를 통해 데이터의 품질 및 신뢰성 제공
4. DIKW , 빅데이터의 가치 피라미드
Data(데이터): 가공하기 전 수치나 기호, 객관적 사실
A 서점: 빅데이터 20% 할인(16,000원), 인공지능 15% 할인(17,000원)
B 서점: 빅데이터 10% 할인(18,000원), 인공지능 10% 할인(18,000원)
Infomation(정보): 데이터를 가공 및 처리한 결과, 연관 관계를 도출
A서점이 B서점보다 도서 가격이 싸다.
Knowledge(지식): 정보를 구조화하고 일반화하여 유의미한 결과물, 정보 기반으로 찾은 규칙
도서 구입은 A서점에서 구입한다.
Wisdom(지혜): 깊은 이해를 바탕으로 도출한 창의적 아이디어, 규칙을 상황에 맞게 적용
다른 상품(문방구)도 A서점이 쌀 것이라고 예측한다.
5. 데이터 기반 지식 경영
공통화(Socailization): 다른 사람과 상호작용으로 개인의 암묵지를 습득
수업, 과외, 스터디
표출화(Externalization): 개인의 지식을 문서화 및 매체로 만드는 과정
출간, 블로깅, 유튜브에 동영상 업로드
연결화(Combination): 문서나 매체를 통해 새로운 문서나 매체를 작성
책의 내용을 요약하여 블로그에 게시, 여러 책의 내용을 정리하여 논문 제출
내면화(Internalization): 문서나 매체를 통해 학습하여 개인이 지식을 얻는 과정
책을 통해 지식 습득, 유튜브를 통해 기술 습득