금요일부터 4일동안 배운 수업 내용을 한장 정리하느라 주말이 순삭되었다...😵
완전 수업때 못짚고 넘어간게 지점들이 많아서 '이게 맞나...' 싶었다.. ㅋㅋㅋ
오늘 에너지 레벨 ' ■ '
Pandas 라이브러리를 쓰면 그로스 마케팅의 강점인 데이터의 그룹화와 정렬을 필터링하여 원하는 특정 부분만 집중적으로 볼수있다는 것이다.
그중에서도 4일차 수업때는 정령과 그룹화 및 집계를 배웠다.
1️⃣Pandas 데이터 정렬 (Sorting :정렬)
일단 정렬화를 하려면 sort_values( )라는 메서드를 알아야한다.
이 매서드는 값을 기준으로 레이블을 정렬하는 매서드이다. 이친구로는 두가지가 가능하다.
① 단일 열 기준 정렬 ② 여러 열기준 정렬
① 단일 열 정렬 sort_values()를 활용
# 매출액 기준 오름차순 (작은 값 → 큰 값)
df_sorted_asc = df.sort_values(by="매출액", ascending=True)
print(df_sorted_asc)
# 매출액 기준 내림차순 (큰 값 → 작은 값)
df_sorted_desc = df.sort_values(by="매출액", ascending=False)
print(df_sorted_desc)
② 여러 열정렬 by=["값1", "값2"] 와 sort_values()를 함께 활용
# 먼저 매출액을 내림차순 정렬한 후, 동일한 매출액 내에서 클릭수를 오름차순 정렬
df_sorted_multi = df.sort_values(by=["매출액", "클릭수"], ascending=[False, True])
print(df_sorted_multi)
그리고 두번째는 Pandas의 필터링이다.
2️⃣ Pandas 데이터 필터링 (Filtering)
① boolean indexing과 ② query()를 활용
블리언 인덱싱에 잘몰라서 보충자료로 공부를 해봤는데 데이터값을 백터로 받는다고 한다. 그래서 계속 써왔던 논리 연산자로 코드를 쓰면 오류가 난다. (전달할 객체가 boolean vector이기 때문이다.)
간단하게 & = AND 연산, | = OR 연산로 이해하면 된다.
블리언이랑 쿼리중 택1해서 쓰면 되므로 나는 블리언보다 쿼리를 더 많이 쓸것같다.
3️⃣번은 그외로 정리해 보았다.
isin( ) : 문자열을 포함하는 데이터 필터링
str.contains( ) : 특정 단어가 포함된 데이터를 찾기
between( ) : 특정 범위 내에 있는 값을 필터링
강사님이 정해리해신 표,, 표로 보니까 정말 편하네요 감사해요💌
나...1,2번 배울때까지는 쉽네!!! 하다가 그뒤로 좀 정신을 잃었다....
나 계속 뭔가 아예 구조를 모르는느낌이라, 누구한테라도 물어보고싶은데
어디서부터 뭘 묻지?? 나는 구조를 모르는데..? 이런기분 ㅠㅜㅠㅜ 드문드문 알고 패턴 파악이 안된다..
일단 기권.. 자주 살펴보는것으로 목표를 잡고 할수있는것만 해야겠다..
나 잘할수있을까.. 싶다.
마음속으로 울보가 되었다...... 엉엉엉...... 울면서 하는중... 주말 동안 개념정리를 하면서 질문리스트를 만들었다.
그리고 나를 도와줄 직장인도 모셨다..
로컬 경로는 컴퓨터에 특정 파일이 저장된 위치라고 하고, Pandas 내부모델은 '데이터 처리 방식을 의미'하여 다른 개념!!
이궁금증은 강사님이 'from 이 없으니까 내부 모델이겠네요?' 이한마디에서 시작됨.. 이어지는 궁금증 '외부모델도 있어?' 라고 물어 보았다.
GPT 덕분에 요렇게 깔끔하게 정리 할수있었다.
그리고 바로 람다 함수를 물어보았다.
그래도 대,,,충,,, 개념은 잡아놓고 간다.. 클래스도 잘 이해가 안가서 보충자료를 찾아보고 최대한 익혀 보려고 한다.
알찬 주말이긴한데 아직도 나 잘 할수있을까 걱정됨.. 아직 예시 코드를 못들여다 봐서 😭
일단 강사님 믿고,, 남은 일요일 저녁은 좀 쉬어야 겠다.. 끝!
'데이터 분석' 카테고리의 다른 글
Python과 SQL 연동 과정과 실습기록 (4) | 2025.02.13 |
---|---|
SQL MariaDB 실습 & 터미널 사용법 총정리 (꿀팁있어요💕) (8) | 2025.02.12 |
MariaDB와 SQL 실습 일지 ( 실수 투성이~ ) (0) | 2025.02.11 |
구글 클라우드에서 VM 생성하고 SSH 연결 설정하는 법 (SQL 실습) (8) | 2025.02.10 |
아주 간략한 Pandas의 특징과 실습 일지. (0) | 2025.02.06 |