외부 CSV 파일 불러오기부터 분석, 저장까지 실전 예제 완전 정복
0. 이 글은 무엇을 위한 글인가요?CSV 파일을 불러와서 정리하고 싶다!정리된 데이터를 분석하고 시각화해보고 싶다!결과를 다시 파일로 저장하고 싶다!이번 글에서는 실제 실무처럼 파일 불러오기 → 분석 → 저장 흐름을 실습합니다.1. 분석 시나리오: 학생 성적 데이터데이터: 학생 이름, 국어, 영어, 수학 점수목표: 평균 계산, 최고점 확인, 시각화 및 저장2. 가상의 CSV 파일 준비하기메모장을 열고 아래 내용 복사students.csv로 저장 (인코딩: UTF-8)이름,국어,영어,수학김민지,82,91,78이준호,90,85,88박지우,74,79,92최수연,88,87,85정우진,95,94,89한예린,67,75,803. CSV 파일 불러오기import pandas as pddf = pd.read_csv('..
2025. 3. 28.
실제 데이터 분석 프로젝트 시작하기 - 인구수 & 평균소득 분석 (기초 예제)
0. 이 글은 무엇을 위한 글인가요?실제 데이터를 분석하려면 뭘 먼저 해야 하죠?데이터를 어디서 구하고, 어떻게 처리하고, 무엇을 보면 되나요?지금까지 배운 Pandas & 시각화 기초를 실제로 적용해보고 싶어요!이 글에서는 가상의 데이터를 이용해 실제 분석 흐름을 익히는 입문 프로젝트를 진행합니다.1. 프로젝트 개요목표: 도시별 인구수, 평균소득 데이터를 분석해 인사이트 얻기분석 질문:도시별 인구는 얼마나 다를까?소득이 높은 도시가 인구도 많은가?어떤 도시가 상대적으로 소득 대비 인구가 많은가?2. 데이터 수집 (예제 생성)import pandas as pddata = { '도시': ['서울', '부산', '대구', '인천', '광주', '대전', '울산'], '인구수(만명)': [973, ..
2025. 3. 27.
Pandas로 그룹 분석과 통계 요약 완전 정복! (groupby, describe)
0. 이 글은 누구를 위한 글인가요?“부서별 평균 점수를 보고 싶어요!”“지역별로 몇 명이 있는지 알고 싶어요.”“통계를 한 번에 요약할 수 없을까요?”groupby와 describe는 이런 작업을 단 몇 줄로 가능하게 해줍니다.이 글을 보면 당신도 통계 요약 고수!1. 예제 데이터 만들기import pandas as pddata = { '이름': ['Alice', 'Bob', 'Charlie', 'David', 'Ella', 'Frank', 'Grace'], '부서': ['영업', '기획', '영업', '개발', '기획', '개발', '영업'], '점수': [88, 75, 90, 95, 77, 85, 92], '근무연차': [2, 1, 3, 5, 2, 4, 1]}df = pd.Da..
2025. 3. 25.
Pandas로 원하는 데이터만 쏙쏙 뽑기! - 데이터 선택 & 필터링 완전 정복
0. 이 글은 누구를 위한 글인가요?“표에서 특정 열만 보고 싶어요.”“나이가 30살 이상인 사람만 골라내고 싶어요!”“열 이름으로, 번호로, 조건으로 어떻게 추출하죠?”Pandas에서 원하는 데이터만 정확히 골라내는 방법, 아주 친절하게 알려드릴게요!1. 예제 데이터 먼저 만들기import pandas as pddata = { '이름': ['Alice', 'Bob', 'Charlie', 'David', 'Ella'], '나이': [24, 30, 18, 45, 29], '도시': ['서울', '부산', '대구', '서울', '부산'], '점수': [85, 90, 75, 88, 95]}df = pd.DataFrame(data)print(df)출력 예시: 이름 나이 도시..
2025. 3. 24.
Python Pandas로 데이터 전처리 완전 정복! (결측치, 중복, 정렬)
0. 이 글은 누구를 위한 글인가요?“데이터를 불러왔는데 뭔가 지저분해요…”“빈칸도 있고, 중복도 있고, 정리하기 너무 어려워요…”“정리된 데이터로 분석을 시작하고 싶어요!”이런 분들을 위해, 데이터를 ‘깨끗하게’ 정리하는 방법을 알려드립니다.1. 데이터 전처리란?전처리 = 분석 전에 데이터를 정리, 정제, 정렬하는 작업결측치 처리: 값이 비어 있는 셀 처리중복 제거: 똑같은 행 삭제정렬: 나이순, 날짜순 정렬열 이름/자료형 정리: 분석하기 좋게 정리2. 예제 데이터 준비하기import pandas as pdimport numpy as npdata = { '이름': ['Alice', 'Bob', 'Charlie', 'David', 'Alice', None], '나이': [24, np.nan, ..
2025. 3. 23.