입지 분석 프로젝트 전체적인 FLOW
• 현황, 수요, 추세 파악: EDA 및 시계열 분석 등
• 사용할 변수 채택: 주성분 분석(PCA), 상관분석 등
• 행정구역 선정: 군집분석(계층적, k-means, k-medoids, GMM)결과 보팅 등
• 행정구역 내 최적입지 선정: 공간최적화모델(LSCP, MCLP 알고리즘) 적용, 프로젝트의 방향성에 더 적합한 모델을 최종 모델로 채택 등
------------------------------------------------
EDA(Exploratory Data Analysis, 탐색적 자료분석)
● 간단한 그림과 수를 통해 데이터가 무엇을 말하는지 살펴보기 위해 데이터를 살펴보는 분석
● 시각화를 통해 수집된 변수들의 경향성을 파악 및 비교 가능
시계열 분석
● 시점 별 추세 파악 가능
PCA(Principal Component Analysis,주성분 분석)
● 여러 변수가 간 존재하는 상관관계를 이용해 이를 대표하는 주성분을 추출. 정보의 손실을 최소화하는 방향으로 차원을 축소하는 기법.
● 각 차원의 데이터가 동일한 범위 내의 값을 갖도록 하기 위해 정규화(Normalization)를 선행
상관분석
● 두 확률변수 사이의 관련성을 자료를 이용하여 연구하는 통계적 분석방법
● 변수들이 많을 경우 상관 분석을 통해 중요도와 관계성을 파악하고 군집분석에 사용될 최종변수를 추출 가능
군집 분석
● 계층적 군집 분석
● K-means 군집 분석
● K-Medoids 군집 분석
● 가우시안 혼합 모델
최적화 모델
1) 주요 요소
- 결정변수: 결정하고자 하는 구체적인 대상
- 목적함수: 결정에 영향을 주는 최적화의 목적, 결정변수 활용 방정식으로 표현
- 제약조건식: 해당 문제와 관련된 여러 제한들로, 다양하게 정의 가능, 결정변수 활용 방정식으로 표현
2) 최적화 모델 구분
- 선형 계획법: 목적함수, 제약조건식이 선형함수만으로 구성됨.
- 비선형 계획법: 목적함수, 제약조건식에 비선형함수가 하나라도 포함됨.
- 정수 계획법: 결정변수 값을 소수값을 포함하는 실수값이 아닌 정수값으로 한정함.
➔ 공간(입지) 최적화 모델의 경우, 입지로 할지 말지에 대한 이분법적 결정이 이루어지는 문제이므로, 결정변수가 이진형 정수이면서 선형함수로 구성된 정수선형 계획법이 일반적임
공간 최적화 모델(Spatial Optimization Model)
- P-Median Problem
: 선택된 시설과 수요지 사이의 평균 가중 거리를 최소화하는 방식으로 일련의 시설물들의 위치를 선택하는 문제
- P-Center Problem
: 선택된 시설과 수요지 사이의 최대 거리를 최소화하는 방식으로 일련의 시설물들의 위치를 선택하는 문제
- Facility Location Problem(FLP)
: 수송비용과 설비 설치비용의 합을 최소화하는 방식으로 일련의 시설물들의 위치를 선택하는 문제
- Uncapacitated Facility Location Problem(UFLP)
: 목적함수와 제약식의 다양한 형태에 따라 제한용량이 없음
- Capacitated Facility Location Problem(CFLP)
: 목적함수와 제약식의 다양한 형태에 따라 제한용량이 있음
- Covering Problem
: 사전에 Covering Radius를 정하고, 선택된 시설의 Covering Area 내에 존재하는 수요자 수를 최대화하는 문제
- Location Set Covering Problem(LSCP)
: 특정한 지리적 범위 내에 모든 수요를 커버할 수 있는 최소한의 시설물 배치를 목적으로 함.
- Maximal Covering Location Problem(MCLP)
: 주어진 시설물의 개수로 지역 수요를 최대한 커버할 수 있도록 하는 것을 목적으로 함. (정해진 예산 등의 현실적인 제약 사항을 고려 가능)
*참고:
https://terms.naver.com/entry.naver?docId=6713040&cid=68053&categoryId=68053