본문 바로가기

초보 pandas 기초! 데이터 그룹화 정리 학습일지

728x90
반응형

주5일이 이렇게 폭풍같이 지나갈줄은 몰랐다..!

항상 수업 진도가 몰아치기 때문에 혼자 공부하면서 알게 된것들을 소소하게 올린다.

 

나는 그로스 마케팅을 준비중이고 마케팅에 맞는 데이터 분석을 공부하고있어서 예시들도 그에 맞춰져 있는 점을 아시고 보시면 편하시리라 생각한다.

 

 

Python에서 pandas_하드코딩된 Google Analytics 장치 및 지역 분석 데이터 (10일)

 

value_counts() 메서드

value_counts메서드는 고유한 행의 갯수를 반환한다. 그래서 숫자가 아닌 특정 칼럼의 값 갯수를 알고싶을때 쓴다.

 

ex) 광고 시청 여부별 응답자 수 확인

'객체이름' = df["광고_시청"].value_counts()
print("타이틀:\n", '객체이름')

 

reset_index() 메서드

reset_index()는 행의 인덱스를초기화 시킨다. 도저히 말로는 이해가 안갔는데.

ex)  기기 유형별 방문 횟수를 계산하세요.

① value_counts() 만 써줬을때 결과.
② reset_index() 같이 써줬을때 결과.

 

이런식으로 달라지는것...! 일단 없던 인덱스 칼럼이 생성되었다. (파이썬이라 0부터 시작) 그리고 맨 마지막에 나오는 데이터 타입이 생략된 정도의 변화가 있었다.

 

노션에 질문리스트를 만들어서 질문 남기려고했는데 공부하다 보니 많이 스스로 해결했다.

내 질문리스트 노션 페이지 귀엽죠?

지금 멋쟁이 사자 그로스 마케팅반이 온라인 강의라서 거의 독학 하는 기분이 들지만 혼자 하는것과 차이가 뭐겠는가..! 바로 인증된 강사에게 질문을 할수있는게 제일 큰 다른점이 아니겠는가. 그럼 최대한 혜택을 많이 활용해야 한다고 생각한다.

 

그리고 수업 내용을 쭉 정리해 보는데 강의자료에는 없지만 내게 꼭 필요한 부분이 있었다.

'데이터를 통계를 위한 도수분포표(기초 최빈 메서드)' 바로 ㅋㅋㅋ 주로 쓰이는 메서드들 처음에 제목 정하는게 쉽지 않았는데 통계에서 나오는 용어인 '최빈값'에서 최빈을 가져와서 쓰기로했다.

 

음식점에 베스트 메뉴같은 녀석들이니까..ㅋㅋ

 

모든 코드가 아직 눈에 익지 않아서 데이터 그룹화를 해주는 groupby() 의 개념부터 정리해주었다.

 

확실히 코드 실습을 해보면서 출력결과를 확인하는 방식으로 배우니 이해가 착착됐다. 처음에 value_counts() 메서드의 뜻도 어려웠는데 그냥 행에 몇개 있는지 갯수 세주는 애로 이해하고 reset_index()메서드도 인덱스 초기화로 이해 하기 보다는 뒤에 나오는 columns메서드의 역활을 돕기 위해서 쓰는 친구로 같이 쓰임을 보니까 더 편안했다.

reset_index()메서드로 원래 가지고 있는 칼럼값을 초기화 시켜버리면 columns메서드가 그럼 내가 이름 바꿔줄게!! 하는것. 그림도 흰백지에 그리지 무지개 안에 또 다른 색을 넣을순 없으니까 말이다.

 

그렇게 이해해 버림.

 

pandas의 문법에도 좀 익숙해졌다. 언어 배우는거라고 생각하니 좀 손쉬웠던듯, 영어 배울때도 단어로 구성되있는 문단씩 골라서 띄어 읽어야 쉬운것처럼 파이썬도 어디까지가 한묶음이고 여기부터는 어떤 역활에 매서드가 관여하는 구나가 눈에 들어온다.

 

items()메서드도 분명 쓸때는 아 그렇구나 하고 넘어갔는데 다시보니까... 

이렇게 낯설수가 없다... 누구냐 넌 😂

 

그래서 필기를 거슬러 파이썬까지 다시 감 ㅋㅋㅋㅋ

나중에 "분리시켜 주려고 쓰는 메서드"라고만 띡 보니까 "엥??????"스러웠음 ㅋㅋㅋㅋ

 

그냥 다시 키,값을 쌍으로 가져온다고 공식처럼 외우고 넘어갑니다..

 

나머지는 다음주에 나에게 맡긴다... 아디오스!

반응형