본문 바로가기
Python - 자동화

[6편] 여러 엑셀 파일에서 조건 데이터 추출 후 통합하기 - 실무 자동화의 시작!

by ramzee 2025. 5. 6.

1. 왜 이걸 해야 할까?

회사에서는 부서별, 팀별로 파일을 따로 관리하는 경우가 많습니다.

하지만 모든 파일을 하나하나 열어 필요한 데이터만 추리는 건,

  • 시간이 너무 오래 걸리고
  • 사소한 실수가 발생할 위험도 큽니다.

파이썬으로 자동화하면 조건에 맞는 데이터만 쏙쏙 뽑아서
몇 초 만에 통합 파일을 완성할 수 있습니다!

---

2. 어떤 상황에서 유용할까?

  • 각 부서별 보고서 파일에서 '성과등급 A'만 모아야 할 때
  • 여러 지점 매출 파일 중 1억 이상 매출만 통합할 때
  • 특정 조건에 맞는 직원/고객만 따로 관리할 때

조건 데이터 추출 통합은 실무 자동화의 핵심입니다. ---

3. 준비물

  • Python 설치
  • pandasopenpyxl 설치
  • 여러 개의 샘플 엑셀 파일 준비

설치 방법:

pip install pandas openpyxl

---

4. 본격 실습: 여러 파일에서 조건 데이터 추출 후 통합하기

4-1. 폴더 구조 준비

  • 모든 엑셀 파일을 하나의 폴더에 모아주세요.
  • 예시 경로: C:/Users/YourName/Desktop/엑셀모음
  • 파일명은 아무거나 상관없습니다.

예시 폴더 안 파일:

  • sample1.xlsx
  • sample2.xlsx
  • sample3.xlsx

(※ sample1.xlsx를 복제해서 여러 개 만들어도 됩니다.) ---

4-2. 코드 작성

import os
import pandas as pd

# 폴더 경로 설정 (※ 슬래시는 / 사용!)
folder_path = 'C:/Users/YourName/Desktop/엑셀모음'

# 통합할 데이터 저장 리스트
df_list = []

# 폴더 안 모든 파일 읽기
for file in os.listdir(folder_path):
    if file.endswith('.xlsx'):
        file_path = os.path.join(folder_path, file)
        df = pd.read_excel(file_path)

        # ✅ 조건: 성과등급이 A인 경우만 추출
        if '성과등급' in df.columns:
            filtered = df[df['성과등급'] == 'A']
            df_list.append(filtered)

# 모든 필터링된 데이터 합치기
merged_df = pd.concat(df_list, ignore_index=True)

# 결과 저장
output_path = os.path.join(folder_path, '조건_통합결과.xlsx')
merged_df.to_excel(output_path, index=False)

print("✅ 조건 통합 완료! 결과 파일:", output_path)

---

4-3. 실행 결과

  • 폴더 안에 조건_통합결과.xlsx 파일이 새로 생성됩니다.
  • 성과등급이 'A'인 데이터만 모여있습니다.

✅ 수십 개 파일이라도 단 몇 초면 자동으로 정리됩니다!

이름 부서 직급 입사년도 매출액 성과등급 프로젝트수 근무지역
백서준 개발부 사원 2021 2306411 A 7 부산
서도윤 개발부 차장 2014 1657953 A 5 광주
최수아 영업부 사원 2022 2874495 A 7 광주
전지아 마케팅부 차장 2017 2211980 A 6 대전
손예은 영업부 사원 2010 1071208 A 4 부산
차세아 인사부 과장 2022 1981193 A 4 광주
고윤우 개발부 차장 2010 1768097 A 8 서울
강서우 영업부 대리 2022 2627752 A 1 광주
서성민 마케팅부 과장 2012 2628586 A 5 부산
박소율 영업부 사원 2013 2122760 A 10 서울
배시윤 개발부 대리 2022 2749056 A 6 광주

---

5. 📢 여기서 주의사항!

  • 폴더 경로는 슬래시(/) 방향으로 입력하세요.
  • 엑셀 파일 포맷은 반드시 .xlsx 여야 합니다.
  • 열 이름('성과등급')이 정확히 맞아야 필터링이 가능합니다.
  • 조건은 자유롭게 변경할 수 있습니다. (예: 매출액 1억 이상)

---

6. 실무 적용 꿀팁

  • 성과등급뿐만 아니라, 매출, 부서명, 입사일 등 다양한 조건 필터링이 가능합니다.
  • 매일 폴더에 새 파일이 추가되어도 자동으로 통합할 수 있습니다.
  • 자동화 스케줄러로 매일 아침 9시에 실행되게 설정할 수도 있습니다.

---

7. 요약

항목 요약
기능 여러 엑셀 파일 조건 데이터 추출 + 통합
효과 수작업 시간 절약 + 정확성 향상
준비물 Python + pandas + openpyxl + 폴더 정리
독자 초보자 OK (복붙 실습 가능)
주의사항 경로 슬래시 / 사용, 열 이름 정확히 입력

---

✨ 다음편 예고

[7편] 특정 조건으로 통합한 데이터를 자동으로 분류하여 저장하기
: 예를 들어 부서별로 따로 파일을 자동 저장하는 방법을 배웁니다!