1. 왜 이걸 해야 할까?
회사에서는 부서별, 팀별로 파일을 따로 관리하는 경우가 많습니다.
하지만 모든 파일을 하나하나 열어 필요한 데이터만 추리는 건,
- 시간이 너무 오래 걸리고
- 사소한 실수가 발생할 위험도 큽니다.
파이썬으로 자동화하면 조건에 맞는 데이터만 쏙쏙 뽑아서
몇 초 만에 통합 파일을 완성할 수 있습니다!
---
2. 어떤 상황에서 유용할까?
- 각 부서별 보고서 파일에서 '성과등급 A'만 모아야 할 때
- 여러 지점 매출 파일 중 1억 이상 매출만 통합할 때
- 특정 조건에 맞는 직원/고객만 따로 관리할 때
조건 데이터 추출 통합은 실무 자동화의 핵심입니다. ---
3. 준비물
- Python 설치
pandas
와openpyxl
설치- 여러 개의 샘플 엑셀 파일 준비
설치 방법:
pip install pandas openpyxl
---
4. 본격 실습: 여러 파일에서 조건 데이터 추출 후 통합하기
4-1. 폴더 구조 준비
- 모든 엑셀 파일을 하나의 폴더에 모아주세요.
- 예시 경로:
C:/Users/YourName/Desktop/엑셀모음
- 파일명은 아무거나 상관없습니다.
예시 폴더 안 파일:
- sample1.xlsx
- sample2.xlsx
- sample3.xlsx
(※ sample1.xlsx를 복제해서 여러 개 만들어도 됩니다.) ---
4-2. 코드 작성
import os
import pandas as pd
# 폴더 경로 설정 (※ 슬래시는 / 사용!)
folder_path = 'C:/Users/YourName/Desktop/엑셀모음'
# 통합할 데이터 저장 리스트
df_list = []
# 폴더 안 모든 파일 읽기
for file in os.listdir(folder_path):
if file.endswith('.xlsx'):
file_path = os.path.join(folder_path, file)
df = pd.read_excel(file_path)
# ✅ 조건: 성과등급이 A인 경우만 추출
if '성과등급' in df.columns:
filtered = df[df['성과등급'] == 'A']
df_list.append(filtered)
# 모든 필터링된 데이터 합치기
merged_df = pd.concat(df_list, ignore_index=True)
# 결과 저장
output_path = os.path.join(folder_path, '조건_통합결과.xlsx')
merged_df.to_excel(output_path, index=False)
print("✅ 조건 통합 완료! 결과 파일:", output_path)
---
4-3. 실행 결과
- 폴더 안에 조건_통합결과.xlsx 파일이 새로 생성됩니다.
- 성과등급이 'A'인 데이터만 모여있습니다.
✅ 수십 개 파일이라도 단 몇 초면 자동으로 정리됩니다!
이름 | 부서 | 직급 | 입사년도 | 매출액 | 성과등급 | 프로젝트수 | 근무지역 |
백서준 | 개발부 | 사원 | 2021 | 2306411 | A | 7 | 부산 |
서도윤 | 개발부 | 차장 | 2014 | 1657953 | A | 5 | 광주 |
최수아 | 영업부 | 사원 | 2022 | 2874495 | A | 7 | 광주 |
전지아 | 마케팅부 | 차장 | 2017 | 2211980 | A | 6 | 대전 |
손예은 | 영업부 | 사원 | 2010 | 1071208 | A | 4 | 부산 |
차세아 | 인사부 | 과장 | 2022 | 1981193 | A | 4 | 광주 |
고윤우 | 개발부 | 차장 | 2010 | 1768097 | A | 8 | 서울 |
강서우 | 영업부 | 대리 | 2022 | 2627752 | A | 1 | 광주 |
서성민 | 마케팅부 | 과장 | 2012 | 2628586 | A | 5 | 부산 |
박소율 | 영업부 | 사원 | 2013 | 2122760 | A | 10 | 서울 |
배시윤 | 개발부 | 대리 | 2022 | 2749056 | A | 6 | 광주 |
---
5. 📢 여기서 주의사항!
- 폴더 경로는 슬래시(
/
) 방향으로 입력하세요. - 엑셀 파일 포맷은 반드시 .xlsx 여야 합니다.
- 열 이름('성과등급')이 정확히 맞아야 필터링이 가능합니다.
- 조건은 자유롭게 변경할 수 있습니다. (예: 매출액 1억 이상)
---
6. 실무 적용 꿀팁
- 성과등급뿐만 아니라, 매출, 부서명, 입사일 등 다양한 조건 필터링이 가능합니다.
- 매일 폴더에 새 파일이 추가되어도 자동으로 통합할 수 있습니다.
- 자동화 스케줄러로 매일 아침 9시에 실행되게 설정할 수도 있습니다.
---
7. 요약
항목 | 요약 |
---|---|
기능 | 여러 엑셀 파일 조건 데이터 추출 + 통합 |
효과 | 수작업 시간 절약 + 정확성 향상 |
준비물 | Python + pandas + openpyxl + 폴더 정리 |
독자 | 초보자 OK (복붙 실습 가능) |
주의사항 | 경로 슬래시 / 사용, 열 이름 정확히 입력 |
---
✨ 다음편 예고
[7편] 특정 조건으로 통합한 데이터를 자동으로 분류하여 저장하기
: 예를 들어 부서별로 따로 파일을 자동 저장하는 방법을 배웁니다!
'Python - 자동화' 카테고리의 다른 글
[8편] 엑셀 파일 이름 일괄 변경하기 - 폴더 내 자동 리네이밍! (0) | 2025.05.08 |
---|---|
[7편] 특정 조건으로 데이터를 나눠서 자동 저장하기 - 부서별로 다른 파일로 자동 저장하기 (0) | 2025.05.07 |
[5편] 엑셀 데이터로 차트 자동 생성하기 - 파이썬으로 막대그래프, 꺾은선그래프 그리기 (0) | 2025.05.05 |
[4편] 엑셀 파일에서 특정 조건에 맞는 행만 추출하기 - 성과등급 A인 직원 자동으로 뽑아내기 (0) | 2025.05.04 |
[3편] 여러 엑셀 파일을 하나로 합치기 - 대량 통합 작업 자동화하기 (0) | 2025.05.03 |