데이터 분석

EDA 핵심 5가지와 데이터 분석 기초 총정리 中..

⋆。゚☁︎ 돋이 ⋆☾ ゚。 2025. 2. 20. 23:37
728x90
반응형

어휴 오늘 총망라 정리 하려고 했는데 그냥 제 3시간만 순삭됐네요^^^.. 주말을 노려봅니다.. 수업듣느랴 정리하느라 정신이 없네요 😭 사실 매일 블로그 쓰는것도 기적이 아닐까 싶다..ㅎ

에너지 레벨 '' 어제 푹잤더니 충전은 완충인데 오늘도 수업 따라기에는 꽤나 벅찼다... 전력질주 하고있는데 무슨일이지 ㅎㅎㅎ

 

그로스 마케팅에서 빠질수없는 EDA의 주요 목적, 총 5가지의 목적을 배웠다.

  • 데이터의 기본 정보 파악(=테이블ionfo()): 데이터 크기, 컬럼 수, 데이터 타입 등을 확인.
  • 결측치 및 이상치 탐색(isnull보다 그래프가 찾기 편함): 누락된 값과 비정상적인 값을 찾아 적절한 처리 방안을 결정.
  • 기술통계를 이용한 데이터 요약: 평균, 중앙값, 표준편차 등 주요 통계량을 분석.
  • 데이터의 분포 확인: 데이터가 정규분포를 따르는지 여부 등을 시각적으로 확인.
  • 변수 간 관계 분석: 변수 간 상관관계를 분석하여 데이터의 패턴을 이해.

 

matplotlib의 표 그리프를 열심히 실습하기 위해 우선 한글 패치( koreanize-matplotlib 라이브러리 사용) 부터 해주고 시작하였다.

초보코더로써,, 하나 하나 설명 달지 않으면 불안한 병을 가지고 있다 꺄 😆
구글 코랩에서 한글 라이브러리 설치 완료.

 

그리고 바로 예제 실습!

라이브러리 임포트 해주고~ 박스플롯 그래프로 실습 GO.

 

바로 실습부터 해보는 오전시간..! 그래도 이젠 익숙해졌다. 어제 한번 훑어 봤기에 조금 더 친해진 기분~.~

쓰임도 다시 한번 정확히 익히고 지나갔다.

 

시나리오도 오늘은 찬찬히 설명해주셔서 재밌었다.

 

보통 인터넷쇼핑몰(이커머스)가 가지고 있을만한 데이터는 고객ID,신규고객여부,이탈여부,광고채널,총구매금액등이다. (실제 나도 마이페이지에서 많이 봤던 목록들!) 그리고 LTV와 소득은 보통 데이터가 없는데, 없는데이터를 만들때 비용산정이 필요하다고 한다.

 

한 삼일전부터 느끼는 바이지만,, 간단한 예제는 액셀실습도 해보면 좋지 않을까 싶긴하다.

보통 개발을 한다고 하면 이커머스는 PHP로 많이 쓰는데 자바 배우는격으로 느껴짐 😥

 

물론,, 나는 엑셀이 없기에 구글시트 이용해야 되지만..ㅎ 몇몇 기능 빼면 구글시트에 있는 엑셀도 실습은 할만했다. (사전강의 완료하고 느낀 기준)

 

그리고 오늘 강의는 내기준 처음으로 step by step으로 나가주셔서 따라잡음... 그동안 너무 숨가빴는데...😭 럭키비키니시티~!

덕분에 보고서를 작성했는데

 

대략적으로 각 채널의 특성은 알지만 문제는 내가 그래프보는게 서툴다는것...! ㅎㅎㅎ 

아이고,,, 모르겠습니다.. 잘 알려면 2일전엔가 pandas로 비율이랑 수계산하는 코드 돌려서 하나씩 빼봐야 알것같은데 다른분들은 어떻게 해결 하고 계신지 궁금하다.

 

결국 또 GPT행

 

그래프 보는법은 안알려주네,,, 🥲

 

EDA를 할때의 순서

① 컬럼본다 ②  통계적 특성(평균값,중간값) -> 그래프로 봄 ③ 보고서쓸준비 ④ 보고서를쓴다.

 

EDA를 할때의 순서알려주시고 그다음에 실습시간 가졌는데 ㅎㅎㅎ 억지로라도 해보려고했지만 나는 끝끝내 하질 못했다.. 일단 해답을 보긴했는데 그걸로 하는건 완벽히 알지 못한다는 죄책감? 빈느낌(어휴 배울때 이러면 망하는데)이 들어서 모르는 개념 짚어보다 끝났는데 왜 오늘 하루도 또 복습하다 끝났을까 ㅎㅎ

 

괜찮아! 나는 데이터 분석가는 안할거라고ㅎㅎㅎ 위로는 하고있지만 애는 쓰고있다.

하... 

 

노션 파이썬과 pandas& SQL을 지나왔다.

 

여기까지는 엉성하게라도 한장 정리는 완료했다.

 

이번주.......이해한게 뭐냐..대체...

 

문제가 여기... 아 실습예제 나오면서 보고서 들어갔는데 나..너무 힘들어요ㅠㅜㅠㅜㅠ

 

물음표 살인마가 될것같음... 물음표가 너무 많음.

 

오늘안에 보고서 쓰고 내려고했는데 개념정리가 우선이라 실패했다.

우선순위라는게 있는거니까... 다시 충전을 위해 자러가야겠다. 🌈

반응형