기타/엑셀 기반의 데이터 분석

09.데이터 심층분석(Advanced Analysis)

moving 2019. 6. 14. 10:44
728x90

▶ 심층 분석

- 인터엑티브 분석

- 다중 데이터 모델 기반 분석

- 분석 도구 : 피벗테이블/차트(PivotTable/PivotChart), 데이터 모델링

▶ 피벗테이블

- 데이터 요약, 데이터 분석, 데이터 탐색, 데이터 발표

- 대용량의 데이터를 다이나믹하게 분석할 수 있는 강력한 도구

- 피벗테이블의 데이터 출처는 범위(Range)보다 테이블(Table)이 바람직함

- 새로운 열/행이 추가되면 자동적으로 업데이트 되기 때문

 

필터에 노선명, 행 레이블에 사용일자, 값에 승차승객수와 하차승객수를 집어넣음
값 필드 설정을 통해서 바꿀 수 있음

- 데이터 원본의 변경을 자동으로 업데이트 하지 않음

- 데이터 -> 모두 새로 고침을 선택함으로써 업데이트 할 수 있음

- 자세한 정보 표시 (DrillDown)

    · 자세항 정보는 새로운 워크시트에 작성됨

    · 데이터 원본 혹은 피벗테이블에 연결되어 있지 않음

    · 따라서 자동 업데이트가 안됨

- 피벗테이블 삭제

    · 피벗테이블 전체를 선택함 (Ctrl + A)

    · 'Delete' 키를 누름

- 계산 필드 삽입 (Calculated Field)

- 시간 데이터의 그룹화

    · 날짜/시간 데이터를 피벗테이블에 추가하면 자동적으로 데이터 그룹화

    · '사용일자'을 '행'에 추가하자 '분기', '연'이 추가되었음

- 시간 표시(Timeline) 막대 삽입

- 슬라이서(Slicer) 삽입

슬라이서 : 단수
슬라이서 : 복수

- 피벗 차트 삽입

    · '+' : 드릴다운(DrillDown) 하부의 자세한 사항 보기

    · '-' : 드릴업(DrillUp) 상부의 요약 사항 보기

드릴다운

- 파이 차트

드릴다운

▶ 데이터 모델링 : 용어 정리

- 관계형 데이터베이스 (Relational Database) : 데이터를 표의 형태로 저장

- 필드 (field) : 데이터의 최소 저장 단위

    · ex '이름', '주소'

    · 엑셀의 셀(Shell)과 동일함

- 레코드(record) : 관련된 필드의 집합

    · ex '고객'

    · 엑셀의 행(Row)과 동일함

- 테이블 (table) : 관련된 레코드의 집합

    · ex '고객명단'

    · 엑셀의 표(테이블)과 동일함

 

 

▶ 데이터 모델링 : 주요 개념

- 모델링(Modelling) : 복수의 테이블 간에 관계 설정

- 기본 키(Primary key) : 고유 값을 가진 필드 ex 고객ID

- 외래 키(Foreign key) : 연결된 테이블의 기본 키

- 관계(Relationship) : 1-to-1, 1-to-many, (many-to-many는 2개의 1-to-many로 분해함)

- 참조 무결성(Referential Integrity) : 연결된 테이블 간에 키를 공유하여야 함

▶ 데이터 모델에 데이터 추가

▶ 복수의 테이블 관계 설정

관계 -> 새로 만들기
관계 만들기
관계 관리

▶ 데이터 모델링 : 관계설정(Relationship)