[데이터시각화]데이터 시각화의 개념

2022. 9. 30. 09:26코딩공부/시각화

728x90
반응형

 

 

 

 

데이터 시각화란?
  •  광범위하게 분산된 방대한 양의 자료를 분석해 한눈에 볼 수 있도록 도표나 차트 등으로 정리하는 것이다.

데이터 시각화는 분석 모델의 설계 단계, 분석 결과의 표현/전달 단계에서 사용

 

데이터 시각화 활용 목적

1) 탐색적 문제 해결(EDA): 데이터 분석을 위한 데이터 패턴, 주요 변수, 특징 확인

2) 현상의 해석(Decsription) :현상을 시각적으로 표현하고 데이터로부터 인사이트 발굴

3) 시각적 스토리텔링: 분석된 데이터의 효과적인 전달/설득을 위한 시각적 스토링 델링 목적

 

빅데이터 시각화는 데이터를 기반으로 정보의 객관적 표현에 초점을 둠 "데이터 시각화 + 정보 시각화"

빅데이터 시각화 영역
  • 데이터: 연구나 조사 발견 수집의 결과, 정보를 만들기 위한 원자재
  • 정보: 데이터가 특정 목적 하에 조직화, 변형된 의미를 내표한 가공된 형태
  • 정보 시각화: 서로 다른 데이터 간의 관계와 일정한 패턴을 기사화 시킴으로써 정보를 보는 사람들에게 데이터가 내포하는 의미를 전달하도록 하는 것
  • 정보형 메시지 vs 설득형 메시지: 객관적 정보의 전달 vs 주장하는 바의 전달
빅데이터 시각화 특징
  • 데이터를 기반으로 객관적 표현에 초점
  • 정보형 메시지를 전달 하기 위한 데이터 시각화 작업 경향
  • 양적 정보 디자인으로 정보의 내용과 환경이 복잡
  • 데이터를 기초로 해석된 이미지의 설득형 메시지 전달의 경우 유용(스토리텔링)
빅데이터 시각화 프로세스

1. 정보의 구조화 - 데이터를 수집하고 정제, 데이터셋 만들기

2. 정보의 시각화 - 분석 도구의 그래프 등을 이용한 시각화

3. 정보 시각 표현 - 의도를 정확히 전달하기 위해 그래픽 요소 추가

 

시각화 방법

[ 시각화 표현 분류 ]

빅데이터 시각화의 방법에 따라 시간, 비율, 관계, 비교, 공간 시각화로 구분

시간 시각화 비율(분포) 시각화 관계 시각화 비교 시각화 공간 시각화
- 막대 그래프
- 누적 막대 그래프
- 점 그래프

- 파이차트
- 도넛차트
- 트리맵
  (Tree 구조 분석)
- 누적 연속 그래프




- 캐스터 플롯
- 버블 차트
  (3개 변수)
- 히스토그램


- 히트맵
- 체르노프페이스
- 스타차트
- 평행좌표계
- 다차원척도법



- 지도 매핑
  • 함께 제공되는 시각화 도구(Tool)에 의해 결정되는 경향이 강함
  • 차트와 분석의 내용을 반영하기 위해 어떤 방식으로 써야 하는지 그 쓰임새를 익히고, 적절한 데이터와 정보 시각화를 하기 위한 수단으로 사용해야 함
  • 시각화 도구에 한정된 그래프로만 구현하다 보면, 분석적 사고를 효율적으로 보여주기보다는 단지 멋져 보이는 그래프를 선택하기 쉬우나, 분석 내용을 어떻게 효율적으로 전달할 것인가를 고려해 그래프를 선택하는 것이 매우 중요
시각화 도구
수준(난이도) 시각화 도구
기초 수준 - 엑셀, CSV/JSON, 구글 차트 API, Flot, Raphael,
  D3(Data,Driven, Documents), Visual.ly, infogr.am 등
인터랙티브
GUI 컨트롤
- Crossfilter, Tangle 등
맵핑 - Modest Maps, Leaflet, Polymaps, Openlayers, Carto DB 등
전문가 수준

- R, NodeBO, Weka, Gephi 등
시각화 관점에서 데이터 유형 분류
구분 데이터 유형 개념
수치형 데이터/
정량적 데이터
(Quantitative/
Numeric Data)
연속형 데이터
(Continuous data)
- 측정해서얻을 수 있는 데이터(계량치)
- 예) 시간, 온도, 무게, 길이 등
이산형 데이터
(Discrete Data)
- 헤아려서 얻을 수 있는 데이터(계수치)
- 예) 불량품수, 사건사고, 매출액 등
범주형 데이터
(Category Data)
순서형 데이터
(Ordered data)
- 범주 간에 순서가 주어지는 데이터
- 예) 학점, 평가등급, 선호도, 년도 등
명목형 데이터
(Nominal Data)
- 범주간에 순서가 없고 동등한 우선순위를 갖는 데이터
- 예) 지역, 성별, 메뉴, 분야, 업종 등
728x90
반응형