기타/엑셀 기반의 데이터 분석

01.엑셀과 데이터 분석

moving 2019. 6. 7. 19:07
728x90

 

▶ 빅 데이터(Big Data) -> 비지니스 분석(Business Analytics) -> 데이터 과학(Data Science)

 

▶ 데이터 과학은 새로운 학문으로 등장 

    컴퓨터 공학, 통계학, 경영학 -> 데이터 과학

 

▶ 정보시스템(IPO: Input -> Process -> Output

                     데이터 - 처리(프로세스) - 정보   -> 의사결정

 

▶ 데이터의 종류

    - 정형 데이터(Structured data)

   행과 열에 맞추어 표(table)의 형태 혹은 관계형 데이터 베이스(Ralational Data Base: RDB)에 저장될 수 있게 정리된 데이터

    - 비정형 데이터(Unstructured data)

행과 열에 맞추어 표의 형태로 정리되어 있지 않은 혹은 할 수 없는 데이터 (ex 전자메일, 비디오, 사진, 문서 파일, 오디오 파일, 웹 페이지, 기타 

    - 반정형 데이터(Semi-structured data)

정형 데이터와 비정형 데이터의 중간 형태의 데이터

 

▶ 비정형 데이터의 급격한 증가

  비정형 데이터 - 정리 - 정형 데이터 - 분석 - 정보 -> 의사결정

  비정형 데이터 - 분석 (ex 텍스트 마이닝 등) - 정보 -> 의사결정

 

▶ 엑셀과 데이터 분석

    - 데이터 정리 : 비정형 혹은 반정형 데이터를 표의 형태로 정리, 불완전한 혹은 부적절한 데이터 제거/수정

    - 데이터 가공 : 정형 데이터를 분리/결합

    - 데이터 분석 : 기초 분석, 심화 분석

    - 데이터 시각화 : 차트, 대쉬보드(Dashboard)