JangGeonWu
janggeonwu97
JangGeonWu
전체 방문자
오늘
어제
  • 분류 전체보기 (78)
    • SQLD (21)
    • 개인 공부용 (17)
    • Django (9)
    • Tableau (6)
    • ElasticSearch (8)
    • 빅데이터 엔지니어 (5)
    • Spring 퀵 스타트 (0)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • 개인 공부 기록용 블로그

인기 글

최근 글

티스토리

hELLO · Designed By 정상우.
JangGeonWu

janggeonwu97

워드 클라우드, 영역, 분산형, 히트맵 차트
Tableau

워드 클라우드, 영역, 분산형, 히트맵 차트

2022. 10. 31. 14:57

1. 워드 클라우드

워드 클라우드는 텍스트 형식의 데이터를 시각화하거나 분석할 때 사용한다. 차원틀 텍스트로 표현하며 측정값을 통해 텍스트의 크기 또는 색상으로 수치를 표현해 비교할 수 있다.

 

워드 클라우드는 댓글 또는 게시글 분석 등에서 어떤 키워드가 많이 활요오댔는지 분석할 때 사용한다.

 

[도시] 차원 필드를 [마크] 카드 위의 [레이블], 측정값 [매출] 필드를 [마크] 카드 위의 [크기]로 각각 드래그한다.

그리고, 마크 설정을 [텍스트]로 변경한다.

워드 클라우드는 만들어졌지만, 너무 많다.

필터를 적용해서 상위 50개만 출력되도록 해보자.

 

우선 [도시] 필드를 [필터]로 드래그해 필터를 생성하자

그리고, 도시 이름이 잘 보일 수 있도록 글씨체를 Bold체로 변경해보자

워드 클라우드가 완성되었다.

 

2. 영역 차트

영역 차트는 시계열에 따른 누적 데이터가 어떻게 구성되고 있는지 보여줄 때 효과적으로 활용할 수 있는 차트이다.

시간의 흐름에 따라 데이터 값의 변화를 확인할 수 있는데, 색상을 활용해 그 영역의 비율 또는 비중을 표현할 수 있다.

 

사이드 바에서 Ctrl을 이용해 [대분류], [주문 날짜], [매출] 필드를 다중 선택한 후 오른쪽 [표현 방식]에서 [영역 차트]를 선택한다.

이후 [대분류] 필드를 [마크] 카드 위의 레이블로 드래그한다.

 

주문 날짜를 분기로 바꾼 후, 서식을 변경하여 좀 더 깔끔하게 시각화해보자.

워크시트 뷰의 빈 곳을 마우스 우클릭한 후 [서식...]을 선택한다.

 

그리고 아래와 같이 격자선을 없애보자.

 

뷰에서 X축을 마우스 오른쪽 버튼으로 클릭한 후 [서식...]을 선택한다.

[축] 탭에서 [배율] 항목의 [날짜]를 클릭해 [사용자 지정]을 선택한다.

[사용자 지정] 창이 나타나면 서식에 'yyyy q"분기"'를 입력한다.

그리고, X축을 우클릭, [축 편집]을 선택해 축 제목을 아래와 같이 삭제한다.

그러면 아래와 같이 영역 차트가 완성된다.

 

3. 분산형 차트

행-열 선반에 각각 1개 이상의 측정값을 활용해, 해당 데이터가 어떻게 분포되어 있는지 파악할 수 있는 차트이다.

이때 여러 마크 유형을 활용할 수 있는데, 색상과 크기를 활용해 데이터의 측정 가능한 세부 정보 또한 추가로 표현할 수 잇다.

 

분산형 차트는 데이터의 분포 위치를 표현하거나, 데이터 간 상관관계를 파악할 때 유용하다.

먼저 분포를 표현하는 경우, 수익성과 매출이 높은 회원을 동시에 파악할 때 유용하다. 또한 수익률 또는 반품률과 같이 대비되는 데이터를 동시에 파악해 영업 사원의 정확한 실적을 파악하는 경우에도 활용된다고 한다.

 

일단, [마크] 카드의 마크 유형을 '원'으로 변경한다.

그리고 사이드바에 있는 [매출] 필드를 열 선반에, [수익] 필드를 행 선반으로 드래그한다.

사이드 바에서 [도시] 필드를 [마크] 카드 위의 [세부 정보]로 드래그한다.

이에 따라서, 집계 수준이 도시 기준으로 변경되어 각 원이 도시별 측정값을 보여주게 된다.

 

사이드 바에서 [할인율] 필드를 [마크] 카드 위의 [색상]으로 드래그한다.

이에 따라 원의 색상이 한일율의 크기에 따라 변하게 된다.

 

마크에 있는 [합계(할인율)]의 추가 메뉴[▼]를 클릭한 후, [측정값(평균)]을 클릭하고 [평균]을 선택한다.

집계 방식을 평균으로 변경해 할인율의 총합이 아닌 각 도시에 적용된 평균 할인율을 표시한다.

마크에 있는 [평균(할인율)]의 추가 메뉴를 클릭한 후 [서식...]을 선택한 후,

[패널] 탭을 선택해 기본값의 숫자 표시 형식을 [백분율]로 변경한다.

[마크] 카드 위의 [색상]을 클릭한 후 [색상 편집...]을 클릭하고 [색상표]를 선택해 색상을 변경한다.

다음과 같이 '빨간색-파란색-흰색 다중'을 선택한 후 [확인]을 클릭한다.

할인율에 따라 각각의 원 색상이 변경된 것을 알 수 있다.

[마크] 카드 위의 [색상]을 선택한 후 다음과 같이 [불투명도]와 [테두리]를 클릭해 변경한다.

- 불투명도: 80%

- 테두리: 회색

그리고 사이드 바에 있는 [수량] 필드를 [마크] 카드 위의 [크기]로 드래그한다.

[도시] 필드를 [마크] 카드 위의 [레이블]로 드래그하면 분산형 차트 내의 원에 도시 이름이 표현된다.

뷰에서 X축(열)과 Y축(행)을 마우스 오른쪽 버튼으로 클릭한 후 [서식...]을 클릭한다.

이후 [축] 탭에서 '배율'에 있는 [숫자] 표시 형식을 '원화'로 변경한다.

두 축에 대해 동일하게 서식을 '통화(표준)'으로 변경한다.

이렇게 도시별 4가지의 측정값이 표현된 분산형 차트가 완성되었다.


4. 히트맵 차트

히트맵 차트는 테이블 형식으로 데이터 수치상의 차이를 색상으로 표현할 수 있는 차트이다.

상대적인 차이를 확인할 때와 더불어 기준치 또는 평균에서 크게 벗어나는 데이터를 식별할 때 유용하게 활용할 수 있다.

 

히트맵 차트는 다양한 상황에서 활용될 수 있다.

대표적인 예로, 리테일(retail) 업계에서 X축에는 시간, Y축에는 요일을 넣어 요일별, 시간대별 방문 횟수 또는 매출 등을 파악할 때 활용된다.

 

[마크] 카드에서 마크 유형을 [자동]에서 [사각형]으로 변경한다.

사이드 바에 있는 [주문 날짜] 필드를 열 선반으로 드래그한다.

열 선반에 있는 [년(주문 날짜)]의 추가 메뉴[▼]를 클릭한 후 '불연속형'의 [자세히]를 클릭, 그 중 [요일]을 선택한다.

 

사이드 바에 있는 [주문 날짜] 필드를 행 선반으로 드래그한 후, [월]을 선택한다.

[매출] 필드를 [마크] 카드 위의 [색상]으로 드래그한다.

이후 [색상]을 클릭한 후 [색상 편집...]을 선택하고 [빨간색 - 파란색 - 흰색 다중]을 선택한다.

데이터를 구분하기 위해 [마크] 카드 위의 [색상]을 클릭한 후 테두리 영역에서 흰색 테두리를 지정한다.

이로 인해 각 사각형의 경계를 명확히 구분할 수 있다.

[매출] 필드를 [마크] 카드 위의 [레이블]로 드래그한 후, 서식의 숫자 표시 형식을 '원화'로 변경한다.

(칸이 너무 작아서 '전체 보기'로 바꿈)

그리고 [레이블]의 정렬을 가운데로 모이게 하면, 히트맵 차트가 완성된다.

 

 

'Tableau' 카테고리의 다른 글

코호트, 파레토, 생키 차트  (0) 2022.11.02
폭포, 덤벨, 맵, 게이지, 방사형 차트  (0) 2022.11.01
도넛, 피라미드(양방향) 막대, 테이블 차트, 전년 대비 비교 차트  (0) 2022.11.01
태블로 라인/막대 차트 다루기  (0) 2022.10.31
태블로 퍼블릭 설치 및 입문 정리  (0) 2022.10.31
    'Tableau' 카테고리의 다른 글
    • 폭포, 덤벨, 맵, 게이지, 방사형 차트
    • 도넛, 피라미드(양방향) 막대, 테이블 차트, 전년 대비 비교 차트
    • 태블로 라인/막대 차트 다루기
    • 태블로 퍼블릭 설치 및 입문 정리
    JangGeonWu
    JangGeonWu

    티스토리툴바