철학과 학생의 개발자 도전기
패스트캠퍼스 환급챌린지 5일차 : 10개 프로젝트로 한 번에 끝내는 MLOps 파이프라인 구현 초격차 패키지 Online. 강의 후기 본문
패스트캠퍼스 환급챌린지 5일차 : 10개 프로젝트로 한 번에 끝내는 MLOps 파이프라인 구현 초격차 패키지 Online. 강의 후기
Younghun 2025. 3. 9. 16:29본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
봄맞이 특급 혜택 '하나 더 봄'🌸 1+1 이벤트 (3/4~3/9) | 패스트캠퍼스
당신의 성장도 피어날 거예요. 1+1 쿠폰으로 강의 보고 또 보고!
fastcampus.co.kr
수강 인증




수강 후기
안녕하세요. 환급챌린지 5일차 포스팅입니다.
오늘은 학습 데이터 준비 실습을 구글 코랩을 통해 진행했습니다.
이론으로만 배우던 내용을 직접 실습하면서 이해도를 높일 수 있는 시간이었습니다. 먼저 구글 드라이브를 마운트하여 데이터 파일을 불러오는 과정을 경험했습니다. 데이터를 다룰 때, 로컬이 아닌 클라우드 환경에서 데이터를 관리하는 것이 얼마나 편리한지 다시금 느낄 수 있었습니다.
그다음으로 데이터 유형에 따른 로드 및 확인을 진행했습니다. CSV, JSON, Excel 등 다양한 형식의 데이터를 로드하고, head(), info(), describe() 같은 함수를 활용해 데이터 구조를 파악했습니다. 데이터를 분석할 때 가장 기본적인 과정이지만, 데이터마다 처리 방식이 다를 수 있기 때문에 익숙해질 필요가 있다고 느꼈습니다.
실습의 핵심은 Data Sampling과 Class Imbalance 처리였습니다. 데이터 양이 방대할 경우 전체 데이터를 사용하기 어려울 수 있기 때문에, 일부 데이터를 샘플링하여 빠르게 분석하는 과정이 중요합니다. 랜덤 샘플링과 계층적 샘플링을 비교하면서, 단순히 데이터를 무작위로 선택하는 것보다 데이터의 분포를 유지하는 것이 중요하다는 점을 배웠습니다.
또한, Class Imbalance 문제 해결 방법을 직접 적용해 보았습니다. 이전 강의에서 배운 SMOTE 기법을 실습하면서, 기존 데이터를 단순히 복제하는 것이 아니라 새로운 데이터를 생성하는 방식이 매우 흥미로웠습니다. 실제 데이터를 다루면서 Class Imbalance 문제를 해결하는 다양한 접근법을 경험할 수 있었습니다.
실습을 진행하면서 단순히 코드를 실행하는 것이 아니라, 각 과정이 왜 필요한지를 고민하는 것이 중요하다는 것을 다시금 느꼈습니다. 다음 강의에서는 전처리된 데이터를 활용해 본격적으로 모델 학습을 진행할 것 같은데, 점점 실전과 가까운 경험을 쌓아가는 것 같아 기대됩니다.