기타/엑셀 기반의 데이터 분석
-
08.데이터 분석(2)기타/엑셀 기반의 데이터 분석 2019. 6. 13. 19:37
▶ 통계분석을 위한 추가 기능 설치 ▶ 기술 통계법(Descriptive Statistics) -데이터에 대한 요약 통계 보고서를 만들어 데이터에 대한 기본적 정보를 제공 ▶ 히스토그램(Histogram) - 데이터의 계급에 따른 빈도수를 차트 형식으로 표시함 ▶ 이동평균법(Moving Average) - 단순/가중 이동평균법 - 장점 : 이해가 쉽다 - 단점 : 구간(n)이 길수록 더 많은 데이터가 필요함 - 구간이 길수록 실제의 변동에 예측값이 둔감해짐 ▶ 지수평활법(Exponential Smoothing) - 이동평균법과는 달리 항상 1개의 실적 값만 필요 평활상수 : a = 0.2 감쇠인수 : 1 - a = 0.8 (0
-
07.데이터 분석(1)기타/엑셀 기반의 데이터 분석 2019. 6. 13. 18:00
▶ 데이터 분석 - 분석 : 얽혀 있거나 복잡한 것을 풀어서 개별적인 요소나 성질로 나눔 - 분석 방법 1. 정성적 방법 (Qualitative) - 직관 - 전문가 판단 - 브레인 스토밍 (Brain Storming) 2. 정량적 방법 (Quantitative) - 계량적 분석 - 통계적 분석 - 텍스트 마이닝 (Text Mining) - 분석 목적 1. 서술적 분석 (Descriptive) - 데이터를 가지고 설명하거나 이해 2. 예측 분석 (Predictive) - 데이터를 가지고 무슨 일이 일어날지 예측 3. 처방적 분석 (Prescriprive) - 예측에서 한발 더 나아가서 그러한 예측이 일어난다면 어떻게 해야하는가 처방 ▶ 부분합 (Subtotal) 계산 - 부분합 작업 후 추가된 행들로 인..
-
06.데이터 가공(Preparation)기타/엑셀 기반의 데이터 분석 2019. 6. 13. 15:44
▶ 데이터 가공 정리된 데이터를 분석할 목적에 맞게 수정, 보완함 ▶ 텍스트 형식의 숫자 변환 - 텍스트 나누기 - VALUE 함수 =VLAUE(text) ▶ 텍스트의 결합 - CONCATENATE 함수 =CONCATENATE(text1, [text2], ...) - & (ampersand) ▶ 텍스트와 숫자의 결합 - TEXT(value, format_text) =TEXT(1234.567,"\#,##0.00") -> \1,234.57 - # : 해당 자리에 숫자가 없으면 공백으로 처리 - 0 : 해당 자리에 숫자가 없으면 0을 삽입 ▶ 데이터 행/열 회전 - 복사 -> 붙여넣기 -> 바꾸기 - TRANSPOSE(array) 1. '붙여넣기'할 셀로 이동 2. '붙여넣기'할 범위 지정 3. 1 셀에 TR..
-
05.데이터 정리(Cleansing)기타/엑셀 기반의 데이터 분석 2019. 6. 13. 14:16
▶ 데이터 수집 관련 사적 데이터 공공 데이터 내부 데이터 - 기관의 정보 보호 정책 - 개인정보 보호법 (해당없음) 외부 데이터 - 개인정보 보호법 - 저작권 보호법 - 개인정보 보호법 ▶ 외부 데이터 가져오기 ▶ 3가지 다운로드 파일 형식 ▶ 텍스트 나누기(Text Parsing) ▶ 매크로(Macro) - 작업의 순서를 기록한 것 - 반복되는 작업인 경우 편리함 (단축키) - 오피스 프로그래밍 언어인 VBA(Visual Basic for Applications)의 일부 ▶ 텍스트 앞과 뒤의 공백 제거 - TRIM(text) ▶ 빈 셀 검색 - 빈 셀 검색의 3가지 이유 1. 불완전한 데이터 (입력 단계에서 유효성 확인) 2. 행/열의 전체 선택 어려움 (Ctrl + Shift + →) 3. COUN..
-
04.엑셀 기초(3) 수식과 함수기타/엑셀 기반의 데이터 분석 2019. 6. 7. 23:49
▶ 수식(formula) - 셀 참조 방법 (단축키 F4) 1. 절대 참조 : $A$1 2. 상대 참조 : A1 3. 혼합 참조 : A$1, $A1 ▶ 데이터의 형식(텍스트와 숫자) - 2개의 데이터 형식 1. 텍스트 - 사칙연산 불가 - 왼쪽부터 비교 '10' < '2' - 숫자를 텍스트로 입력할 경우는 '를 먼저 삽입 2. 숫자 - 사칙연산 가능 - 다양한 서식 (통화, %, 날짜 등) ▶ 다양한 데이터 형식(MS엑세스의 경우) - 12개의 데이터 형식 - 7개의 숫자 형식 - 데이터 형식이 많은 이유? 데이터베이스는 많은 용량의 데이터를 효율적으로 관리하기 위해서 필요한 소프트웨어임으로 대용량의 데이터를 관리하기 위해서는 좀 더 다양한 형식으로 데이터를 분류함으로써 효율적으로 효과적으로 데이터를 관..