기록/자격증
[ADSP] 데이터 분석 기획
skyriv
2025. 5. 8. 22:16
1. 데이터분석 기획의 이해
분석 기획 방향성 도출
- 분석 대상과 방법
- 4가지 유형을 넘나들며 분석을 수행 Known UnKnown
Known 최적화 통찰 UnKnown 솔루션 발견
- 4가지 유형을 넘나들며 분석을 수행 Known UnKnown
- 분석 기획 방안과제 중심적 접근 장기적 마스터플랜
목적 빠르게 해결 지속적 분석 원인 해결 1차 목표 speed, test accuracy, deploy 과제유형 quick, win long term view 접근방식 problem solving problem definition - 분석 기획 시 고려사항
- 가용 데이터: 분석의 기본이 되는 데이터 확보 및 파악
- 적절한 유스케이스 탐색 : 기존에 잘 구현되어 있는 유사 시나리오 활용
- 장애요소에 대한 사전계획 수립 : 조직의 역량으로 내재화
- 의사결정을 가로막는 요소
- 고정관념, 편향된 생각
- 프레이밍 효과: 동일 상황임에도 개인의 판단, 결정이 달라짐
분석 방법론
- 분석 방법론의 구성요소
- 절차, 방법, 도구와 기법, 템플릿과 산출물
- 분석 방법론 모델
- 계층적 프로세스 모델 : 단계 (Baseline으로 관리) → 태스크 → 스텝(단기간 수행 WorkPackage)
- 폭포수 모델 : 이전 단계 완료되어야 다음 단계 진행(Top-Down)
- 나선형 모델 : 여러 개발 과정 거쳐 점진적으로 완성, 위험요소 제거 초점
- 프로토타입 모델 : 일부분(프로토타입)을 우선 개발하고 보완
- 반복적 모델
- 증분형 : 전체 시스템을 작은 기능 단위로 나눠 개발
- 진화형 : 핵심 부분을 개발한 후 요구사항을 반영하여 진화
- 애자일 : 짧은 개발 주기를 가지고 고객 피드백을 지속적으로 반영하여 반복적으로 개발
- KDD 분석 방법론
- 데이터 선택 → 전처리 → 변환 → 마이닝 → 결과 평가
- 데이터 선택 : 원시데이터나 DB에서 필요한 데이터 선택
- 전처리 : 이상값, 잡음 식별 및 데이터 가공
- 변환 : 변수 선택 및 차원 축소
- 마이닝 : 알고리즘을 선택하여 분석 수행
- 결과 평가 : 결과에 대한 해석, 결과가 충족되지 않으면 절차를 반복 수행
- 데이터 선택 → 전처리 → 변환 → 마이닝 → 결과 평가
- Crisp-DM 분석 방법론
- 업무 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 → 전개
- 업무 이해 : 업무 목적 파악, 상황파악, 목표 설정, 프로젝트 계획 수립
- 데이터 이해 : 초기 데이터 수집, 기술 분석, EDA, 데이터 품질 확인
- 데이터 준비 : 데이터 셋 선택 및 정제, 통합
- 모델링 : 모델링 기법 선택, 테스트 계획 설계, 모델 작성 및 평가
- 평가 : 분석결과 평가, 모델링 과정 평가, 모델 적용성 평가
- 전개 : 전개 계획, 모니터링 및 유지보수 계획 수립, 프로젝트 종료 보고서 작성, 프로젝트 리뷰
- 평가 → 전개에서 위대한 실패(업무 이해로 다시 돌아감) 발생 가능
- 업무 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 → 전개
- SEMMA 분석 방법론
- sample → explore → modify → model → assess
- sample : 분석 대상 데이터 추출
- explore : 탐색하고 오류 확인
- modify : 데이터의 변환
- model : 알고리즘 적용
- assess : 모델의 평가 및 검증
- sample → explore → modify → model → assess
- 빅데이터 분석 방법론
- Planning → Preparing → Analyzing → Developing → Deploying
- planning
- 비즈니스 이해 및 범위 설정
- 프로젝트 정의 및 계획 수립
- 프로젝트 위험계획 수립
- preparing
- 필요 데이터 정의
- 데이터 스토어 설계
- 데이터 수집 및 정합성 점검
- analyzing
- 분석용 데이터 준비
- 텍스트 분석
- 탐색적 분석
- 모델링
- 모델 평가 및 검증
- 모델 적용 및 운영방안 수립
- developing
- 설계 및 구현
- 시스템 테스트 및 운영
- deploying
- 모델 발전 계획 수립
- 프로젝트 평가 및 보고
- planning
- Planning → Preparing → Analyzing → Developing → Deploying
- PPADD
- 분석 기획
- 비즈니스 범위 설정 : SOW - Statement of Works - 구조화된 프로젝트 정의서
- 프로젝트 위험계획 수립 : 회피, 전이, 완화, 수용
- 데이터 준비
- 데이터 스토어 설계 : 정형, 비정형,, 반정형 데이터에 따른 효율적 저장소를 설계
- 데이터 분석
- 분석용 데이터 준비 : 추가적인 데이터 확보 필요시, 데이터 준비 단계로 다시 진행
- 의사 코드 : 일반적인 언어로 프로그래밍 언어의 알고리즘을 유사한 형식으로 써 놓은 것
- 모델링 : 알고리즘 설명서는 상세히 작성
- 모델 평가 및 검증 : 성능이 저조한 모델은 튜닝 작업 수행
- 분석 기획
분석 과제 발굴
- 하향식 접근 방법
- 문제가 주어지고 해답을 찾기 위해 진행
- 문제 탐색 → 문제 정의 → 해결방안 → 타당성 검토
- 문제 탐색
- 빠짐없이 문제를 도출, 식별, 설루션 초점보다 가치 초점
- 비즈니스 모델 캔버스 단순화 측면 : 업무, 제품, 고객, 규제와 감사, 지원 인프라
- 관점
- 거시적 : STEEP ( 사회, 기술, 경제, 환경, 정치)
- 경쟁자 확대 관점 : 대체자, 경쟁자, 신규 진입자
- 시장의 니즈 탐색 관점 : 고객, 채널, 영향자
- 문제 정의
- 비즈니스 문제를 데이터 문제로 변환하여 정의
- 해결 방안
- 기존 시스템 활용, 시스템 고도화, 인적자원 확보, 아웃 소싱
- 타당성 검토
- 경제적 : 비용대비 편익 분석관점 접근
- 데이터 : 데이터 존재여부, 분석역량 필요
- 기술적 : 역량 확보 방안 사전에 수립
- 상향식 접근 방법
- 문제 정의 자체가 어려울 때, 사물을 그대로 인식하는 What 관점
- 주로 비지도 학습 활용
- 혼합 접근 방법
- 발산 : 상향식 접근 방법, 가능한 방안들을 도출
- 수렴 : 하향식 접근 방법, 도출된 방안 분석
- 디자인 싱킹
- 사용자에 공감으로 시작해서 아이디어 발산/수렴 과정을 통한 피드백으로 발전하는 과정
- 공감하기 → 문제정의 → 아이디어 도출 → 프로토타입 → 테스트
- 지도학습, 비지도 학습
- 지도학습 : 정답이 있는 데이터를 학습 → 하향식 접근법
- 분류분석, 회귀분석, 의사결정트리, KNN, SVM
- 비지도학습 : 정답이 없는 데이터를 학습 → 상향식 접근법
- 군집 분석, 차원축소, 연관규칙분석
- 지도학습 : 정답이 있는 데이터를 학습 → 하향식 접근법
분석 프로젝트 관리 방안
- 분석 과제에서 고려해야 할 5가지 요소
- 데이터 크기. 속도, 복잡도, 분석 복잡도, 정확도/정밀도
- 정확도, 정밀도는 trade-off 단계
- 데이터 크기. 속도, 복잡도, 분석 복잡도, 정확도/정밀도
- 프로젝트 관리 지식 체계 10가지
- 통합, 범위, 시간, 원가, 품질, 인적자원, 의사소통, 리스크, 조달(아웃소싱), 이해관계자
2. 분석 마스터플랜
마스터플랜 수립
- IT 프로젝트의 우선순위 선정 기준
- 중장기 마스터플랜을 수립 위하여 ISP 활용
- 전략적 중요도 : 전략적 필요성, 시급성
- 실행 용이성 : 투자 용이성, 기술 용이성
- 중장기 마스터플랜을 수립 위하여 ISP 활용
- 데이터 분석 프로젝트의 우선순위 선정 기준
- 시급성 : 비즈니스 효과 - return - value
- 난이도 : 투자비용 요소 - investment - volume, variety, velocity
분석 거버넌스 체계 수립
- 분석 거버넌스 체계 구성요소
- 조직, 프로세스, 시스템, 데이터, 분석 관련 교육 및 마인드 육성체계
- 데이터 분석 수준 진단
- 분석 준비도
- 분석적 업무파악
- 발생한 사실 분석 업무
- 예측분석 업무
- 시뮬레이션 분석업무
- 분석업무 정기적 개선
- 인력 및 조직
- 분석전문가 직무 존재 / 교육훈련 프로그램
- 관리자들의 기본적 분석능력
- 전사 분석업무 총괄 조직 존재
- 경영진 분석업무 이해능력
- 분석기법
- 업무결 적합한 분석기법 사용
- 분석업무 도입 방법론
- 분석기법 라이브러리 / 효과성 평가 / 정기적 개선
- 분석데이터
- 분석 업무를 위한 데이터 충분성 / 신뢰성 / 적시성
- 비구조적 데이터 관리
- 외부 데이터 활용 체계
- 마스터데이터 관리(MDM)
- 분석 문화
- 사실에 근거한 의사결정
- 관리자의 데이터 중시
- 회의 등에서 데이터 활용
- 경영진의 직관보다 데이터
- 데이터 공유 및 협업 문화
- IT 인프라
- 운영시스템 데이터 통합
- EAL, ETL 등 데이터 유통체계
- 분석전용 서버 및 분석 환경
- 빅데이터 분석환경
- 통계분석 환경
- 비주얼분석 환경
- 분석적 업무파악
-
- 도입 : 환경, 시스템 구축
- 활용 : 업무에 적용
- 확산 : 전사 차원 관리, 공유
- 최적화 : 혁신, 성과향상에 기여분석 성숙도 - CMMI 모델 기반
- 분석 준비도
- 데이터 분석 성숙도 모델
- 준비형 : 낮은 준비도/성숙도
- 데이터, 인력, 조직, 분석 업무, 분석 기법 적용 안되어 사전 준비 필요
- 정착형 : 낮은 준비도, 높은 성숙도
- 인력, 조직, 분석업무, 분석 기법 등을 제한적으로 사용
- 도입형 : 높은 준비도, 낮은 성숙도
- 조직 및 인력 등 준비도는 높으나, 분석업무 및 기법 부족
- 확산형 : 높은 준비도, 높은 성숙도
- 6가지 분석 구성요소를 모두 갖추고 있으며, 지속적 확산 가능
- 준비형 : 낮은 준비도/성숙도
- 분석 지원 인프라 방안 수립
- 확장성을 고려한 플랫폼 구조 적용 → 중앙 집중적 관리
- 분석 플랫폼 구성요소
- 광의의 분석 플랫폼 : 분석 서비스 제공엔진, 분석 애플리케이션, 분석 서비스 API, 하드웨어
- 협의의 분석 플랫폼 : 데이터 처리 프레임워크, 분석엔진, 분석 라이브러리
- 광의의 분석 플랫폼은 협의의 분석 플랫폼 요소들을 포함하는 개념
- 데이터 거버넌스
- 전사 차원에서 데이터에 대해 표준화된 관리 체계 수립
- 구성요소 : 원칙, 조직, 프로세스
- 중요 관리 대상 : 마스터 데이터, 메타데이터, 데이터 사전 등
- 마스터 데이터 : 자료 처리에 기준이 되는 자료
- 메타데이터 : 다른 데이터를 설명해 주는 데이터
- 데이터 사전 : DB에 저장된 정보를 요약
- 체게
- 데이터 표준화 : 메타데이터 및 사전 구축
- 데이터 관리 체계 : 효율성을 위함
- 데이터 저장소 관리 : 저장소 구성
- 표준화 활동 : 모니터링, 표준 개선 활동
- 빅데이터 거버넌스
- 데이터 거버넌스 체계 + 빅데이터 효율적 관리, 데이터 최적화, 정보보호, 데이터 카테고리 별 관리책임자 지정 등을 포함
- 조직 및 인력방안 수립 (DSCoE : 분석조직)
- 집중 구조 : 독립적인 전담 조직 구성 (중복 업무 가능성 존재)
- 기능 구조 : 해당 부서에서 직접 분석 (DSCoE가 없음)
- 분산 구조 : 분석 조직 인력을 현업 부서에 배치
https://www.youtube.com/watch?v=nZ6gpnEj-KU&list=PLWtr7MRpQi5CW-jFYgAsX4jZcSp77O3a5&index=1