본문 바로가기

My Work/Data Literacy

Redash 데이터 시각화

Redash에서 쿼리셋을 추출하고 시각화를 할 때, 내가 가끔씩 헷갈리는 것들과 느낀 점들을 정리한 글이다. 데이터 시각화가 쉬워보이고 당연한 개념을 요구하지만 막상 실무를 할 때면 고민의 영역이 많아진다. 따라서, 매크로적인 판단이 필요할 것 같아 글로 정리한다. 

 

1. 데이터 유형별 차트는 라인(꺾은선) 차트와 바(막대) 차트 위주로 쓰자. 

 사실 다른 차트들을 많이 쓰는데 특수한 경우가 아니라면 사실 라인 차트와 바 차트만 쓰는 것 같다. 따라서, 이 2개의 차트의 쓰임새만 정확히 알고 있다면 거의 모든 데이터 시각화가 커버된다. 라인 차트는 시간에 따른 트렌드를 가장 효과적으로 보여주기 때문에 성장률 분석이나 매출 추이, DAU 변화 추이를 보여줄 때 쓰면 되고, 바 차트는 범주 간 수치 비교에 최적화되어 있어서 제품별 매출 비교, 연령대별 구매액 등으로 사용하면 된다. 

 

 - 라인 차트: 시계열 차트

 - 비 차트: 카테코리별 비교

 

2. 효과적인 시각화를 위한 기본 원칙

 내가 생각하는 시각화 기본 원칙은 아래와 같다. 

 - 명확성: 하나의 차트는 하나의 메시지만 전달

 - 간결성: 과도한 색상은 자제하며, 필요한 데이터만 표시

 - 맥락성: 비즈니스 목적에 맞는 시각화 선택

 

3. 시각화 설정 요소

redash_visualization

모든 설정이 데이터의 특성과 전달하고자 하는 메시지에 부합해야 함을 잊지말자. 

 

General (기본 설정)

- Chart Type: Line or Bar

- Title: 차트가 전달하는 핵심 메시지

- Subtitle: 부가 설명이나 데이터 출처

 

Axis (축 설정)

- X Axis: 기준이 되는 범주 또는 시간 단위

- Y Axis: 측정값의 단위 및 스케일, 최소/최대값 설정

 

Series & Groups

- Series: 표시할 데이터 시리즈 선택 / 스타일 설정 / 누적&그룹화 방식 선택

- Group by: 데이터 그룹화 기준 설정

 

* 시리즈는 차트에서 '무엇을' 보여줄지 결정하는 데이터

* Group by는 데이터를 특정 기준으로 묶어소 보고 싶을 때 사용

 

Visual Elements

- Colors: 시리즈별 색상 설정, 파레트 선택, 강조색 지정

- Data Labels: 레이블 표시 위치

 

쿼리셋 & 대시보드 네이밍 가이드

쿼리 네이밍 컨밴션

기본 구조: [팀명] _ [데이터 종류] _ [상세설명] _ [주기] 

예시1: mkt_campaign_performance_monthly (마케팅팀 월간 캠페인 성과)

예시2: cs_ticket_resolution_daily (CS팀 일간 티켓 처리율)

예시3: pd_user_retention_weekly (상품개발팀 주간 리텐션)

 

그외 일회성 쿼리에는 맨 앞에 'adhoc_'을 붙이자. 

 

대시보드 네이빙 컨밴션

기본 구조: [조직레벨] _ [팀명] _ [목적] _ [주기] 

예시1: exec_growth_metrics_weekly (경영진용 주간 그로스 지표)

예시2: team_cs_performance_daily (CS팀 일간 성과 대시보드)

 

그외 Description 작성을 통해 대시보드의 목적과 업데이트 주기, 담당자 정보를 알려주자. 그리고 정기적 리뷰를 통해 불필요한 대시보드를 정리하고 항상 인수인계 문서를 준비하자. 

 

마무리 (나의 생각)

데이터 시각화는 단순히 차트를 그리는 것이 아니라 데이터를 통해 내가 하고 싶은 말, 스토리를 전달하는 과정이라고 생각하자. 기본 원칙들만 잘 지켜도 효과적인 데이터 커뮤니케이션이 가능하다. 완벽한 시각화보다는 명확하고 일관된 시각화가 더 중요하다는 것과 쿼리셋과 대시보드의 체계적인 관리가 업무 효율로 이어진다는 것을 잊지말자.