본문 바로가기

My Work/Self Reflection(회고)

비데이터 조직에서 데이터 조직으로 (2편)

지난 편에서는 인력 리소스 때문에 데이터 리터러시를 등한시했던 것을 반성하고, GA4, 자체 대시보드 개발 착수 같은 간단한 액션 2가지를 취했다. 하지만, 갑작스럽게 필요성을 느끼고 행동을 취하다보니 뚜렷한 목표가 없었고 구체적인 실행 방안이 나오지 않았다. 따라서, 먼저 목표를 구체화하고 목표에 따른 액션 플랜을 세웠다. 

 

먼저, 내가 달성하고 싶은 데이터 문화 조직을 레벨링했다. 변성윤님의 강의 자료에서도 나오는 내용이지만 내가 조직의 상황에 맞게 재구성했다. 


데이터 문화 조직 Level System

Level 0 

- 데이터 수집 : 데이터 수집의 필요성을 인식하지 못하고, 구조화되지 않은 형태로 불규칙적으로 데이터를 수집함

- 데이터 활용 : 데이터 활용이 전혀 이루어지지 않거나 매우 제한적이며, 데이터 기반의 의사결정을 지향하지 않음

 

Level 1

- 데이터 수집 : 기초적인 데이터 수집 도구 (예: 스프레드시트)를 사용하여 필요한 데이터를 수집하기 시작함

- 데이터 활용 : 수집한 데이터를 기반으로 간단한 보고서 작성이나 결정 지원에 활용하지만, 체계적이지 않은 분석 방법을 사용함

 

Level 2

- 데이터 수집 : 데이터 수집 과정을 자동화하고, 여러 출처에서 데이터를 통합하여 체계적으로 관리하기 시작함

- 데이터 활용 : 데이터를 활용하며 조직의 문제를 해결, 고객 서비스 개선, 내부 프로세스 최적화 등에 사용. 데이터를 분석하기 위해 전문 도구나 대시보드를 도입함

 

Level 3

- 데이터 수집 : 고급 데이터 수집 기술 (예: 실시간 데이터 스트리밍, 웹 크롤링, 센서 데이터)을 활용하여 다양한 유형의 데이터를 효과적으로 수집함

- 데이터 활용 : 데이터 분석 및 인사이트를 통해 전략적 의사결정을 지원. 고급 분석 기법인 머신러닝, AI, 예측 분석을 활용하여 비즈니스 혁신과 경쟁력 강화를 추구함


 

위와 같이 데이터 문화 조직을 레벨링하고 현재 우리 조직의 레벨을 점검했다. 필요한 데이터만 구글 스프레드 시트에 기록하는 수준이었으니 Level 1에 해당한다. 그래서 Level 2에 달성하기 위한 구체적인 액션을 고안했다. 일단, 데이터 수집 과정을 자동화하는 대시보드가 필요했다. 대시보드에 쓰이는 데이터를 구성하려다 보니 이미 시장에 나온 데이터 어그리게이터 웹사이트에서 확인할 수 있는 데이터와 겹치는 데이터가 많았다. 따라서, 대시보드를 기능별로 2가지로 나눴다. 시장에 나온 웹사이트에서 수집하지 않은 데이터 중심의 사내용 대시보드 1개와 이미 시장에서 잘 활용되고 있는 데이터를 재구성한 사외용 대시보드 1개로 기능을 분리했다. 그리고 마지막으로 기존의 웹사이트을 관리하기 위해 Redash, GA를 도입하기로 했다. 

 

< 현 상황 >

- Level 1 달성 (22년 11월 28일 부) 

- Level 2 진행 중

 

따라서, 현재 우리 조직이 데이터 조직 Level 2로 나아가기 위해 필요한 것을 사내용 대시보드, 사외용 대시보드, Redash, GA로 정리하고 기획 및 개발에 착수했다. 

Level 2 달성을 위한 액션 플랜

1. 사내용 대시보드 구축 (완료)

: 다행이도 나는 이전에 `SSAFY(삼성SW아카데미)'에서 기본적인 웹 개발 과정을 수료한 상태이다. 따라서, Django를 활용해서 간단한 웹사이트 정도는 개발 및 배포를 할 수 있다. 그렇기 때문에 개발 리소스를 사용하지 않고 개발 진행이 가능한 상태였다.

 

그래서 필요한 데이터를 정하고, 필요한 데이터를 가져오기 위한 API를 선별했다. 그리고 Chat GPT의 도움을 받아 개발부터 배포까지 스스로 진행했다. 오랜만에 하는 작업이라서 내가 예상한 시간보다 다소 오래 걸렸지만 2주 안에 기획부터 배포까지 마쳤다. 특히, 프론트엔드 부분이 많이 어색해서 적응하는데 애를 먹었다. 자세한 내용을 공개할 수는 없지만 총 5페이지로 구성되어 있고 매일 오전마다 전날의 데이터가 업데이트된다. 

 

자체 대시보드

 

 

< 대시보드의 요구사항 >

- 필요한 데이터 관련 API를 매일 오전 10시에 호출 및 대시보드 업데이트

- 호출된 데이터를 테이블과 그래프로 시각화

- 주요한 히스토리(예: 변동률)를 아카이빙

 

< 개발 스펙 >

- 백엔드 : Django

- 사용 언어 : Python, Javascript

- 배포 : AWS EC2

 

2. 사외용 대시보드 (개발 중)

: 사외용 대시보드 같은 경우는 'Dune'이라는 웹사이트에서 필요한 데이터를 모아 커스텀할 예정이다. 이것 또한 개발자 리소스가 필요없는 작업이다. 간단한 SQL 문법정도만 아면 누구나 쉽게 대시보드를 구축할 수 있기 때문이다. 따라서, 현재는 대시보드 구축에 필요한 것들을 정리하고 습득하고 있는 단계이다. 이번 여름(~8월) 안에 배포하는 것이 목표이다. 

 

Dune Dashboard 예시

 

3. GA 삽입 (완료)

: 트래킹 플랜을 작성해서 추적하고 싶은 데이터를 보는 수준을 만들기에는 개발 공수에 부담이 들어 기본 지표만 추적하기로 했다. 사용자 수, 접속 국가, 접속 기기 등 간단한 지표 정도는 확인할 수 있어서 우리 웹서비스를 사용하는 고객에 대한 이해도를 높였다. 

 

GA 보고서

 

4. Redash (개발 대기 중)

: Redash 구축은 개발자분의 도움이 필요한 것 같아 개발 착수 기간을 연말로 잡아두고 대기하고 있는 상태이다. 1주일도 안 걸리는 작업으로 판단되지만 개발 우선순위가 많이 밀려 늦게 완성될 것 같다. 몰론, 조직한테 데이터 효능감을 체감시키지 못해 우선 순위 조정 설득에 실패한 내 잘못도 있긴 하지만 급하게 생각하지는 않는다. 

 

위와 같은 액션들이 취하면 우리 조직도 내가 설정한 Level 2에 도달할 수 있을 것이라고 생각한다. 그렇게 된다면 지금보다 데이터 인프라에 대한 중요성을 느끼고 데이터 기반의 의사결정을 할 수도 있을 것 같은 기분이 든다. 

 

마무리,

작년에는 데이터 역량을 키우고 싶은 마음만 있었을 뿐 행동을 취하지 않았다. 그러한 점이 정말 후회스럽다. 조금이라도 빨리 했으면 더 나은 선택과 행동을 취할 수 있었을 것만 같은 마음이 든다. 만약, 이 글을 읽고 '나 혼자는 불가능이야'라고 생각하는 사람이 있다면 생각이 다시 정리하고 혼자라도 움직여보자.