철학과 학생의 개발자 도전기

패스트캠퍼스 환급챌린지 19일차 : 10개 프로젝트로 한 번에 끝내는 MLOps 파이프라인 구현 초격차 패키지 Online. 강의 후기 본문

패스트캠퍼스

패스트캠퍼스 환급챌린지 19일차 : 10개 프로젝트로 한 번에 끝내는 MLOps 파이프라인 구현 초격차 패키지 Online. 강의 후기

Younghun 2025. 3. 23. 22:57

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

https://bit.ly/4hTSJNB

 

커리어 성장을 위한 최고의 실무교육 아카데미 | 패스트캠퍼스

성인 교육 서비스 기업, 패스트캠퍼스는 개인과 조직의 실질적인 '업(業)'의 성장을 돕고자 모든 종류의 교육 콘텐츠 서비스를 제공하는 대한민국 No. 1 교육 서비스 회사입니다.

fastcampus.co.kr

 

수강 인증

공부시작
공부끝
클립수강
필기

수강 후기

안녕하세요. 환급챌린지 19일차 포스팅입니다.
오늘은 MLOps 인프라 요소 중 Storage와 Computing에 대해 배웠습니다.


모델 이전에 데이터를 담을 ‘기반’이 먼저다

머신러닝을 실무에 적용할수록 느끼는 건, 모델 성능보다 중요한 건 ‘데이터를 다루는 방식’과 ‘운영 환경’이라는 점이다.
오늘 강의는 그런 관점에서 Storage와 Computing의 중요성을 다뤘고,
단순히 기술적인 개념을 넘어, 모델이 안정적으로 운영되기 위한 기반을 어떻게 구성해야 하는지에 대해 고민하게 만들었다.


Storage: 데이터를 쌓는 방식이 곧 모델의 운명이다

Storage는 단순히 데이터를 저장하는 공간이 아니라,
📌 얼마나 오래 보존할 수 있는가,
📌 얼마나 빠르게 접근할 수 있는가,
📌 데이터가 커져도 잘 확장되는가,
이 세 가지 관점이 모두 중요하다는 걸 배웠다.

클라우드 스토리지나 데이터 레이크처럼 확장성과 유연성을 갖춘 구조가 중요한 이유는,
머신러닝이 한 번 학습하고 끝나는 게 아니라 데이터가 쌓이고 모델이 반복적으로 학습되어야 하기 때문이다.
특히, 실시간 데이터 분석이나 대용량 로그 데이터를 다룰 땐 분산 파일 시스템이나 웨어하우스의 필요성이 크게 느껴졌다.

예전엔 “어디에 저장하든 되겠지”라고 생각했다면,
이제는 “어디에, 어떻게, 얼마나 오래, 어떤 속도로 접근할 수 있는가”가 더 중요하다는 걸 깨달았다.


Computing: 아무리 좋은 모델도 실행할 리소스가 없다면 무용지물

모델 학습을 반복적으로 돌리고, 실시간 추론까지 하려면 결국 컴퓨팅 자원이 받쳐줘야 한다.
오늘 강의에서 소개된 다양한 컴퓨팅 환경(GPU/TPU, 서버리스, 컨테이너 기반 등)을 보며,
✔ 비용,
✔ 성능,
✔ 유연성
이 세 가지를 어떻게 조화롭게 설계할지가 관건이라는 생각이 들었다.

특히 컨테이너 기반 컴퓨팅 환경은 요즘처럼 모델을 다양한 환경에서 일관되게 재현해야 하는 상황에서 더 중요해지고 있다.
또한 서버리스 컴퓨팅을 통해 예측이나 데이터 전처리 같은 단발성 작업을 필요할 때만 유연하게 실행할 수 있다는 점도 굉장히 실용적으로 느껴졌다.

이제는 단순히 모델만 고민할 게 아니라,
“이 모델을 어디에서, 어떤 자원 위에서, 얼마나 효율적으로 돌릴 것인가?”를 항상 함께 고민해야 한다.


오늘 강의를 통해 얻은 인사이트

 모델을 학습시키고 운영하기 위한 기반은 결국 Storage와 Computing이다.
 데이터 저장의 방식과 접근성이 바뀌면, 전체 ML 파이프라인의 설계까지 달라진다.
 컴퓨팅 자원의 선택은 비용, 성능, 운영 편의성의 균형을 고려해야 한다.
 실제 모델 운영은 코드가 아니라, 인프라가 결정한다.

오늘 강의를 들으며 MLOps에서 인프라의 역할을 다시 한 번 실감했다.
앞으로 모델을 만들 땐, 그것이 어떤 환경에서 어떻게 움직일지까지 미리 그려보는 습관을 길러야겠다.