인사이트
데이터 분석이 점점 중요해지는 이유
2023-09-04
✏️ 이런 분들은 꼭 읽어보세요!
- 데이터 분석을 어떻게 활용하는지 알고 싶은 분
- 다양한 유형의 데이터 분석을 정리하고 싶은 분
💡 데이터 분석, 선택이 아닌 필수
데이터 분석, 듣기만 해도 어렵고 높은 벽이 느껴지지 않나요? 어떤 분들은 막연한 두려움을 느끼실 텐데요. 예전에는 데이터 분석가라는 직종 자체도 생소했어요. 분석을 위한 데이터를 수집하는 방법도 상당히 폐쇄적이었고요. 또한, 그런 데이터를 다루는 툴도 많지 않았죠. 그러다 보니 접근하기 어려운 분야로 인식되었는데요, 하지만, 요즘 데이터 분석의 트렌드는 많이 변화하였습니다.
- 요즘 데이터가 매우 많아졌습니다.
- 서비스•기업에서 수집•관리하는 데이터가 많아졌습니다.
- 웹과 APP에서 제공되는 서비스들이 다양해졌습니다.
- 이용자에게 요구하는 권한이 많아지고 있습니다.
이처럼 서비스가 다양해지고 고객 행동 데이터의 복잡도가 증가하면서 자연스레 데이터가 많아지고 있는데요. 그만큼 기업들이 수집하는 데이터가 많아지고 있는 것이죠.
- 데이터를 관리하는 장비가 발전했습니다.
- 클라우드 서비스의 확대로 소규모 기업도 데이터를 저장하는 기술을 활용하게 되었습니다
- 따라서 적은 비용으로 소프트웨어를 쓸 수 있습니다.
- 데이터가 많아져서 예전에 비해 많은 기업의 직원들이 데이터에 접근하는 기회가 많아지고 있습니다.
- 이를 적극적으로 활용하는 소프트웨어가 발전합니다.
환경이 이렇게 변화하다보니 이젠 주변에서 데이터 분석가라는 직업을 가진 사람도 어렵게 않게 마주칠 수 있습니다. 데이터 분석, 이젠 결코 생소한 분야가 아닙니다. 비즈니스를 성장시키기 위한 중요한 자원이 될 수 있습니다.
💡 데이터 분석의 다양한 유형
데이터 분석은 크게 4가지 유형으로 나누어 볼 수 있습니다.
1) 설명적 분석
여기서 가장 기본이 되는 설명적 분석은 수집된 데이터를 요약 또는 집계하여 그 결과를 도출하는 데이터 분석의 영역입니다. 예컨대 아래와 같은 내용이 될 수 있습니다.
우선 행정안전부에서 제공하는 나이별 인구 현황 데이터를 내려받습니다. 그리고 제주도에서 집계된 데이터를 파이썬이라는 개발도구를 이용하여 그래프를 그려 데이터 분석을 합니다. 이것을 바로 설명적 분석이라고 할 수 있습니다. 간단하게 말하면, 설명적 분석은 현실에 나타난 지표 그대로를 그래프로 그리고 단순하게 그 지표를 읽는 것입니다. 위 그래프에서 보듯이 나이가 많아질수록 여성 인구가 많아지고 있는 것을 알 수 있습니다.
2) 진단적 분석
그럼 진단적 분석은 어떤 데이터 분석일까요? 진단적 분석은 ‘왜 나이가 많아질수록 여성의 비율이 높아지는가?’를 예시로 들 수 있습니다. 그 이유로 어떤 데이터가 필요 할까요?
- 제주도에서 남성과 여성이 주로 어떤 일을 하는지
- 각 성별 사망 원인이 어떻게 되는지
- 다른 지역과는 어떻게 다른지
이와 같은 데이터가 있다면 진단적 분석을 할 수 있을 것 입니다. 추가적인 데이터를 이용해 왜 제주도에서는 여자가 남자보다 많고 오래 사는 것인지 진단하는 것이죠. 데이터를 통해 현상에 대한 이유를 찾는 과정이라고 할 수 있습니다.
3) 예측적 분석
여기에서 예측적 분석이 되려면 어떤 것이 더 필요할까요? 예측적 분석은 데이터를 바탕으로 앞으로의 현상에 대한 예측을 하는 것 입니다. 예를 들어 다음과 같이 진단적 분석을 했다고 가정해보겠습니다.
- 제주도의 남자들은 어업에 종사하는 경우가 많다,
- 바다에서 발생하는 사고가 많고, 남성들의 사망률이 높다.
- 그러나 최근 들어 선박 기술의 발전과 어업 방식의 변화로 추세가 꺾여 사망률이 눈에 띄게 줄었다.
그렇다면 우리는 이러한 예측적 분석을 할 수 있게 됩니다.
- 현재 제주도에 여성 인구 비율이 높다.
- 하지만 서서히 타 지역과 비슷한 비율로 변화하고 있다.
- 약 15년 이후에는 그 차이가 거의 없을 것으로 보인다.
이렇게 예측적 분석 결과를 내놓을 수 있을 겁니다. 그러기 위해서는 당연한 이야기지만 예측을 뒷받침 할 만한 데이터와 이를 보기좋게 시각화한 그래프가 필요할 겁니다.
4) 처방적 분석
마지막 네 번째는 처방적 분석 입니다. 예를 들어 다음과 같은 데이터가 있다고 가정 해보겠습니다.
위 두 개의 데이터를 보고 설명적 분석과 진단적 분석을 할 수 있을 것입니다. 그렇다면 여기서 어떻게 하면 예측적 분석과 처방적 분석으로 넘어갈 수 있을까요?
예측적 분석을 한다면 앞으로 특정 범죄에 대해서 어떤 유형의 범인이 더 많이 있을지를 예측할 수 있을 것입니다. 반면 처방적 분석을 한다면 다음과 같이 할 수 있을 것입니다. 성 풍속 범죄나 폭력행위와 관련된 범죄는 미혼인 사람들이 많이 저지른다는 데이터가 있으므로 이를 바탕으로 미혼자들이 많은 집단, 즉, 미혼자들이 많은 대학생이나 예비군 훈련 등에 성 풍속에 관련된 교육을 더 보강해야한다고 주장 할 수 있는 근거가 되는 처방적 분석을 할 수 있습니다.
모든 데이터 분석을 위에서 언급한 설명적, 진단적, 예측적, 처방적 분석 4단계를 해야 하는건 아닙니다. 어떤 데이터냐, 어떤상황이냐, 어떤 목적이냐에 따라서 분석의 방법이 달라지는 것이죠. 적재적소에 알맞은 분석 기법으로 분석하여 많은 사람들이 봤을때 쉽게 이해 할 수 있는 유의미한 결과를 도출해 내는것이 중요하다고 볼 수 있습니다.
database전문가
프리랜서 히어로(크몽 블로그 필진)
저는 DBA, DA, 그리고 SQL 강사로 활동 중인 한종구입니다.
SQL 강의와 DB 관련 프로젝트들을 의뢰 받아 활동하고 있습니다.
SQL 관련된 책도 출간했습니다.