본문 바로가기

전체 글

(5)
입지 분석 FLOW 및 입지 최적화 모델 공부 입지 분석 프로젝트 전체적인 FLOW• 현황, 수요, 추세 파악: EDA 및 시계열 분석 등 • 사용할 변수 채택: 주성분 분석(PCA), 상관분석 등 • 행정구역 선정: 군집분석(계층적, k-means, k-medoids, GMM)결과 보팅 등 • 행정구역 내 최적입지 선정: 공간최적화모델(LSCP, MCLP 알고리즘) 적용, 프로젝트의 방향성에 더 적합한 모델을 최종 모델로 채택 등 ------------------------------------------------ EDA(Exploratory Data Analysis, 탐색적 자료분석)● 간단한 그림과 수를 통해 데이터가 무엇을 말하는지 살펴보기 위해 데이터를 살펴보는 분석 ● 시각화를 통해 수집된 변수들의 경향성을 파악 및 비교 가능 시계열 분..
태블로 입문: 기본 용어 및 자주 사용하는 함수 태블로는 데이터 분석 분야에서 주로 쓰이는 데이터 시각화 및 분석 도구로, 크게 아래 4가지 프로덕트로 구분됩니다. 각각은 데이터 분석 및 시각화 과정에서 아래와 같은 end to end 시나리오로 사용됩니다. 이번 WIL에는 태블로에 처음 입문하는 사람들이 알아야 하는 용어 및 함수에 대해 간단히 정리하겠습니다. (1) 기본 용어 [측정값 vs 차원] - 측정값(measure) : 태블로에서 측정값은 우리가 관심을 가지는 숫자/값입니다. 예를 들어 매출, 수익, 배송비 등이 될 수 있습니다. - 차원(dimmension) : 태블로에서 차원은 측정값을 어던 기준으로 잘라서 볼 것인가를 의미합니다. 즉 범주형 데이터에서 지역별/연도별/성별 등이 숫자를 자르는 기준이 되므로 차원이라고 볼 수 있습니다. (..
데이터 분석 Tips: 많이 실수하는 통계 오류 유형 정리 Casual이란 인과관계가 있음을 의미하고, non-casual이란 인과관계가 없음을 의미한다. 데이터 분석의 목표 중 하나는, casual association 즉 인과관계가 있는 연관성을 나타내는 가설을 검증하려는 것이다. 하지만 인과관계를 도출해내려는 과정의 도처에 오류 발생 가능성이 잠재되어 있다. 예를 들어, 상관관계 등은 통계적으로 유의하지만 반드시 인과관계가 있다고 단정지을 수 없다. 만약 인과성이 없는 관계를 인과관계로 착각한다면, 오류가 발생한다. 쉽게 범할 수 있는 통계 오류의 유형을 아래에서 간단히 정리해보겠다. 😎 (1) Data dredging 데이터 드레징(Data Dredging)은 통계적으로 유의미한 결과를 얻기 위해, 여러 변수로 여러 번의 테스트를 시도하는 과정이다. 가설..