머신러닝에 도전하게 된 계기
회사에서 고객 데이터를 분석하는 업무를 하면서 항상 한계를 느꼈어요. 단순한 엑셀 분석으로는 고객의 구매 패턴이나 이탈 위험성을 제대로 예측할 수 없었거든요.
특히 마케팅 예산을 어디에 투자해야 효과적일지 판단하기 어려웠는데, 그때 머신러닝으로 고객 세분화와 예측 모델을 만들 수 있다는 걸 알게 되었습니다. 데이터 사이언티스트까지는 아니어도, 업무에 활용할 수 있는 수준까지는 배워보자고 결심했어요.
코세라 Andrew Ng 강의 선택 과정
여러 플랫폼 비교 검토
처음엔 어디서 배울지 고민이 많았어요. 유데미, edX, 코세라 등을 비교해본 결과 Andrew Ng 교수의 “Machine Learning” 코스를 선택했습니다.
선택 이유:
– Andrew Ng: 스탠포드 교수, 머신러닝 분야 권위자
– 체계적인 커리큘럼: 기초부터 고급까지 단계별 구성
– 실습 중심: 매주 프로그래밍 과제 포함
– 영어 학습 병행: 글로벌 기술 트렌드 파악 가능
– 인증서 제공: 링크드인 프로필에 추가 가능
수강료와 수강 방식
코세라 플러스 월 구독료는 $59(약 8만원)였어요. 6개월 과정이니 총 48만원 정도 투자했습니다.
강의 구성:
– 총 11주 과정
– 주당 학습량: 5-7시간 권장
– 프로그래밍 언어: Octave/Matlab (Python 옵션도 제공)
– 최종 프로젝트 1개
6개월간의 상세한 학습 여정
1개월차: 선형 회귀의 벽
첫 달은 정말 고생했어요. 선형 대수학 기초가 부족해서 행렬 연산부터 막혔거든요.
학습 스케줄:
– 평일 저녁: 2시간 (이론 학습)
– 주말 오전: 4시간 (실습과 과제)
– 주당 총 14시간 투자
가장 어려웠던 개념:
– 비용 함수(Cost Function)
– 그라디언트 디센트(Gradient Descent)
– 편미분과 최적화
수학 기초를 다시 공부하느라 칸아카데미 선형대수학 강의도 병행했어요.
2개월차: 로지스틱 회귀와 분류
두 번째 달부터는 분류 문제를 다루기 시작했습니다. 로지스틱 회귀가 어떻게 확률을 예측하는지 이해하는 데 3주가 걸렸어요.
첫 번째 실습 프로젝트: 대학 입학 예측 모델
– 데이터: 학생들의 시험 점수 2개
– 목표: 합격/불합격 예측
– 정확도: 89% 달성
이때 처음으로 “내가 머신러닝 모델을 만들었다!”는 성취감을 느꼈어요.
3-4개월차: 신경망의 늪
세 번째 달부터는 신경망(Neural Networks)을 본격적으로 배우기 시작했는데, 이게 정말 어려웠어요.
신경망에서 배운 핵심 개념:
– 퍼셉트론과 다층 신경망
– 순전파(Forward Propagation)
– 역전파(Backpropagation)
– 활성화 함수들
손글씨 숫자 인식 프로젝트:
– 데이터셋: 5000개의 20×20 픽셀 이미지
– 정확도: 97.5% 달성
– 소요 시간: 프로젝트 완성까지 2주
역전파 알고리즘을 이해하는 데만 한 달이 걸렸는데, 미분의 연쇄법칙을 시각적으로 그려가며 공부했어요.
5개월차: 고급 최적화와 정규화
다섯 번째 달에는 overfitting 문제와 정규화 기법들을 배웠습니다.
학습한 주요 기법들:
– 편향-분산 트레이드오프(Bias-Variance Tradeoff)
– L1, L2 정규화
– 교차 검증(Cross Validation)
– 학습 곡선 분석
실습 프로젝트: 선형 회귀 정규화
– 물의 온도에 따른 댐 수위 예측
– 다항식 피처를 이용한 비선형 모델링
– 정규화를 통한 과적합 방지
6개월차: 실전 프로젝트와 무감독 학습
마지막 달에는 K-평균 클러스터링, PCA, 이상 탐지 등을 배웠어요.
최종 프로젝트: 이메일 스팸 분류기
– 데이터 전처리: 텍스트 정제, 단어 벡터화
– 특성 선택: TF-IDF 가중치 적용
– 모델링: SVM 알고리즘 적용
– 최종 성능: 98.2% 정확도
이 프로젝트가 가장 뿌듯했는데, 실제로 사용 가능한 수준의 모델을 만들었다는 실감이 났어요.
업무 적용 성과
고객 세분화 모델 구축
회사 고객 데이터에 K-means 클러스터링을 적용해서 고객을 5개 그룹으로 분류했어요.
분석 결과:
– 충성고객(25%): 높은 구매빈도, 고액 구매
– 신규고객(30%): 최근 가입, 구매 패턴 관찰 필요
– 휴면위험고객(20%): 구매 간격 증가
– 가격민감고객(15%): 할인 시에만 구매
– 이탈고객(10%): 3개월 이상 비활성
이 분석으로 타겟 마케팅 효율이 35% 향상되었어요.
매출 예측 모델 개발
선형 회귀를 이용해 월별 매출 예측 모델을 만들었습니다.
사용한 특성들:
– 계절성 요인 (월별 더미 변수)
– 마케팅 예산
– 경쟁사 프로모션 여부
– 경제 지표 (소비자 신뢰도)
예측 정확도: MAPE 12.3% (평균절대오차백분율)
학습 과정의 어려움과 극복
수학적 기초 부족
가장 큰 어려움은 수학이었어요. 특히 다변수 미적분학과 선형대수학이 약했거든요.
해결 방법:
– 3Blue1Brown YouTube 채널로 직관적 이해
– Khan Academy 수학 강의 병행 수강
– 수식보다는 개념 위주로 접근
– 코딩 구현을 통한 체감적 학습
영어 강의의 부담
Andrew Ng 교수님 발음은 명확하지만, 전문 용어가 많아서 어려웠어요.
극복 과정:
– 영어 자막 활용, 모르는 용어 정리
– 머신러닝 용어사전 별도 작성
– 한국어 보충 자료 찾아서 학습
– 영어 강의 속도 0.75배로 조정
실습 환경 구축
처음엔 Octave를 사용했는데, 나중에 Python으로 전환하면서 혼란이 있었어요.
환경 설정:
– Anaconda로 Python 환경 구축
– Jupyter Notebook 활용
– scikit-learn, numpy, matplotlib 라이브러리 숙달
6개월 후의 변화
기술적 성장
이제는 기본적인 머신러닝 문제는 혼자서도 해결할 수 있게 되었어요.
현재 가능한 작업들:
– 회귀/분류 문제 모델링
– 데이터 전처리 및 시각화
– 모델 성능 평가 및 튜닝
– 클러스터링을 통한 고객 분석
– 간단한 추천 시스템 구현
업무 영향도
데이터 기반 의사결정이 가능해지면서 업무 효과성이 크게 향상되었어요.
구체적 성과:
– 마케팅 ROI 35% 향상
– 고객 이탈률 예측 정확도 85%
– 재고 최적화로 비용 15% 절감
– 사내 ‘데이터 분석 전문가’로 인정
투자 대비 효과
직접 비용
총 투입 비용:
– 코세라 구독료: 480,000원 (6개월)
– 수학 보충 강의: 50,000원
– 참고서적: 120,000원
– 총 650,000원
경제적 효과
6개월간의 성과:
– 업무 효율성 향상으로 인한 시간 절약
– 승진 및 연봉 협상에서 가산점
– 데이터 분석 컨설팅 부업 기회 (월 50만원)
– 이직 시 우대 조건
연간 추가 수익: 약 600만원
투자 수익률: 약 900%
FAQ – 자주 묻는 질문들
Q1. 수학을 못해도 머신러닝을 배울 수 있나요?
A1. 미적분학과 선형대수학 기초는 필요해요. 하지만 깊은 수준까지는 아니고, 개념적 이해 정도면 충분합니다. 저도 문과 출신이에요.
Q2. 6개월이 꼭 필요한가요?
A2. 개인차가 있지만, 기초부터 실무 적용까지는 최소 5-6개월은 필요해요. 수학 기초가 탄탄하면 더 빨리 할 수도 있어요.
Q3. Python을 모르는데 가능할까요?
A3. 강의에서는 Octave를 사용하지만, 실무에서는 Python이 더 유용해요. Python 기초를 먼저 배우고 시작하는 걸 추천해요.
Q4. 영어가 어려운데 다른 대안이 있나요?
A4. 한국어로 된 머신러닝 강의도 많아요. 하지만 Andrew Ng 강의는 정말 체계적이라 도전해볼 만해요. 자막과 번역 도구를 적극 활용하세요.
Q5. 어떤 수학 책을 추천하시나요?
A5. “프로그래머를 위한 선형대수”, “머신러닝을 위한 수학” 정도면 충분해요. 너무 깊게 파지 마시고 필요할 때 찾아보세요.
Q6. 완주 후 어떤 공부를 더 해야 하나요?
A6. 딥러닝(Deep Learning Specialization), 자연어 처리, 컴퓨터 비전 등으로 확장할 수 있어요. 하지만 먼저 현재 업무에 적용해보세요.
Q7. 실무에서 바로 써먹을 수 있나요?
A7. 기초 수준의 데이터 분석과 예측 모델은 가능해요. 하지만 복잡한 문제는 추가 학습과 경험이 필요합니다.
Q8. 인증서가 취업에 도움이 될까요?
A8. 직접적인 도움보다는 학습 의지를 보여주는 정도예요. 포트폴리오와 실제 프로젝트 경험이 더 중요해요.
다음 학습 계획
머신러닝 기초를 마스터한 지금, 다음 단계를 계획하고 있어요:
단기 목표 (3-6개월):
1. Deep Learning Specialization 수강
2. 캐글(Kaggle) 경진대회 참여
3. 회사 데이터로 더 고도화된 모델 구축
장기 목표 (1년 이내):
1. 데이터 사이언티스트로 이직 준비
2. 개인 데이터 분석 서비스 런칭
3. 머신러닝 블로그 및 유튜브 채널 운영
마무리하며
6개월 전만 해도 “머신러닝”이라는 단어조차 어려웠는데, 지금은 실제 업무에 적용해서 성과까지 내고 있어요.
물론 쉽지 않았습니다. 수학의 벽, 영어의 벽, 그리고 무엇보다 포기하고 싶은 마음과의 싸움이 가장 어려웠어요. 하지만 작은 성공을 하나씩 쌓아가면서 자신감을 얻을 수 있었습니다.
머신러닝은 이제 선택이 아닌 필수가 되어가고 있어요. 망설이고 계신다면 지금 바로 시작해보세요. 6개월 후, 데이터로 말하는 새로운 자신을 만날 수 있을 겁니다.