일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- CARTO
- Spatial Data Analysis
- machine learning
- mapping
- 지도
- 우버
- map
- Mapbox
- Uber
- QGIS
- Web Mapping
- 공간데이터 분석
- Web GIS
- 플러그인
- 인스톨
- 인공지능
- 데이터 분석
- 설치
- install
- plugin
- Big data
- 데이터 시각화
- 빅데이터
- GIS
- Kepler.gl
- AI
- Data Analysis
- 웹지도
- data visualization
- 머신러닝
- Today
- Total
GIS & Spatial Analysis in KOREA
뉴욕 푸드 트럭 위치 최적화: 사이트 분석 및 수익 예측 분석 사례 본문
[Location Intelligence]
#GIS #Location Intelligence #Food Truck #Banking Transactions #Gradient Boosted Regression Tree Model
#Data Analysis #Spatial Data Analysis #Big Data #AI #Data Visualization #Interactive Map #Carto #GBRT
#빅데이터 #인공지능 #데이터 분석 #공간데이터 분석 #데이터 시각화
#지도 #위치정보 #카드소비데이터 #상권분석 #푸드트럭
[ 뉴욕 푸드 트럭 위치 최적화: 사이트 분석 및 수익 예측 분석 사례 ]
- Site Planning and Revenue Prediction: Optimizing Food Truck Locations in New York City
뉴욕의 점심 시간을 이야기 할 때 푸드 트럭을 빼놓고 이야기 할 수는 없다. 뉴욕 직장인들의 필수 방문 장소인 푸드 트럭의 위치는 위치기반의 비즈니스 모델(Geo-spatial Business Model)에 의해 작동하고 있다. 대부분의 푸드 트럭들이 비슷한 가격의 비슷한 메뉴로 음식을 판매하고 있기 때문에 위치를 장소를 잘 선정하는 것 외에 다른 푸드 트럭과 차별화하기는 어렵다. 따라서, 푸드 트럭의 위치는 사업의 성공 여부를 결정하는 중요한 요소다.
최근 푸드 트럭 수익 예측 모델을 통해 사업자들이 위치를 선정 할 수 있도록 도와준 사례가 있다. 지리공간 데이터 분석을 위해 맨해튼과 브루클린에서 운영하는 10개 푸드 트럭의 카드 결제 데이터(익명 처리됨)를 분석했다.
이 주제는 도시 내 위치의 중요성을 지적한 미국 상공 회의소 (Food Chamber of Commerce Foundation)의 프로젝트인 Food Truck Nation의 보고서가 발표 된 이 후 푸드 트럭 업계에서 매우 중요해졌다.
사실 미국 내에서 푸드 트럭을 운영하려는 지역이 넓어지면 여러 다른 관할 구역이 포함될 수 있으며, 사업자는 각 관할 구역의 자격 조건을 만족 시켜야 하기도 하며, 돈을 내고 허가증을 발급받아야 하기도 한다. 때문에 최소비용으로 최대 이익을 얻는 장소를 찾아내는 것은 매우 중요하다.
이 프로젝트를 진행한 데이터 분석가에 따르면 인구 센서스 데이터와 일반적인 위치 데이터(POI) 외에 카드 결제 데이터 및 유동인구 데이터와 같은 새로운 데이터와 융합 분석 했을 때 더욱 정확한 예측 모델 구축을 할 수 있었다고 한다. 정확한 수익 예측 모델은 푸드 트럭 사업자의 성과를 판단하는데도 이용되기도 했지만, 이 예측 모델은 식품 재고를 적절하게 관리하면서 간접 비용을 줄이는데도 활용 할 수 있었다.
뉴욕시의 푸드 트럭의 매출을 최적화하기 위한 주요 요인은 유동인구, 요일, 거래빈도 등이었으며, 놀랍게도 총인구와 주변 임대료가 덜 중요한 요인으로 판명되었다. 또한, 푸드 트럭이 평균 $11,000 매출을 올렸지만, 수익 패턴은 시간과 푸드 트럭 별로 다르다는 것을 발견했다. 예를 들어 웨스트 빌리지(West Village)의 푸드 트럭은 주당 $5,234, 퀸즈 주 코로나 공원의 푸드 프럭은 주당 평균 $6,128로 매출이 예측됐다.
성과 측정
판매 촉진을 위해 어디에 푸드 트럭을 위치시켜야 할지 예측하기 이전에 기초적인 탐색적 분석을 먼저 진행했고, 그 중 현재 성과를 측정하는 방법에 대해 알아야 했다.
1. 시간대별 - 푸드 트럭별 데이터를 집계해 시간당 평균 지출을 측정했다. 아래 그래프에 따르면 각 푸드 트럭의 시간당 수익은 아침, 점심 시간에 급증했으며, 특히 점심 시감에 최고 매출을 찍었다.
또, 각 푸드 트럭 2. 지점별 매출액을 버블(상대적 크기)로 표현해 지도로 시각화했다. 예상대로 그랜드 센트럴역, 소호, 타임스퀘어 등 차량 교통량이 많은 지역에 위치해 있었다.
최적 위치 선정
매출 예측 모델에서 예측 변수 역할을 할 수 있는 푸드 트럭 주변의 변수들을 잘 파악해야 한다. 전통적으로 이러한 예측 변수들은 ① 인구 센서스 데이터나 ② POI(Points of Interest) 데이터를 많이 활용한다.
인구 센서스 데이터를 통해 얻을 수 있는 인구학적 정보는 대상 고객을 세분화하고 공간적으로 분류하는데 유용하지만, 한계를 가지고 있다. 인구 센서스 데이터는 사람들의 주거(사는 곳)에 대한 데이터로, 뉴욕의 명소를 방문하는 관광객이나 시내로 통근하는 근로자들이 이동하는 정보를 제공하지는 못한다. 따라서 인구 센서스 데이터는 푸드 트럭 분석에서는 상대적으로 적은 통찰력을 제공한다.
POI 데이터는 수익이 높은 푸드 트럭 주변 인근 랜드마크 패턴을 찾는데 유용하게 이용했다. 아래 첫번째 지도는 맨해튼과 브루클린 지역의 POI 데이터를 시각화한 지도다. 어떤 명소가 있는지 파악하기 어렵기 때문에 푸드 트럭을 기준으로 2~3분 내에 도보로 걸어서 도달할 수 있는 거리인 200m 내외의 랜드마크를 분석했다.
민간데이터(유동인구/카드소비데이터)를 이용한 매출예측모델 만들기
푸드 트럭 위치 선정 관련 Gradient Boosted Regression Tree Model (GBRT Model) 을 만들기 위한 준비가 끝났다. GBR Model은 푸드 트럭이 위치를 선정할 때 고려해야 할 중요도에 따라 예측 변수에 순위를 부여 할 수 있다.
우선 매출 예측은 인구 센서스 데이터 및 POI 데이터와 같은 전통적인 데이터 소스를 이용했다. GBRT Model을 통해 R-Squared의 값은 0.38였으며, 모델을 개선하기 위해 카드 소비 데이터를 추가해 모델링 할 경우 R-Squared 값이 증가하는지 확인했다.
카드 소비 데이터는 익명 처리된 데이터로 사람들이 언제, 어디서, 어떻게 사용하는지 집계한 데이터로 가맹점 단위로 제공된다. 구체적으로 백분위 점수는 중요도가 높은 빈도 측정 값을 제공한다. 대부분의 푸드 트럭들이 비슷한 가격에 비슷한 종류의 음식을 제공하기 때문에 빈도 측정 모델은 각 트럭에 대한 고객에 대한 정보를 제공한다.
백분위 점수가 증가 함에 따라 산점도 그래프에서 점들 사이의 분포가 넓어 짐을 알 수 있다. 그러나 R-Squared 값이 큰 편으로 유동인구 데이터가 모델에 추가 됐다.
유동인구 데이터를 추가하자 R-Squared 값이 0.18 증가했다. 이는 큰 의미를 지니며 푸드 트럭이 유동 인구 수에 영향을 많이 받는다는 가정을 POI 분석과 함께 더욱 확실해 졌다.
다른 유의미한 데이터를 추가할수록 R-Squared 값이 어떻게 변하는지 분석함으로써 푸드 트럭의 위치 선정에 유의미한 변수들을 선정 할 수 있다. 아래 순서는 통계적으로 유의미한 12개의 변수를 중요도 순으로 나열한 것이다. 그 중 4개 변수가 위치를 선정하는데 가장 중요한 변수로 선택 되었다. (1. 이전 시간의 유동인구, 2. 현재 시간의 유동인구, 3. 요일, 4. 카드소비 데이터 빈도 점수)
수익 예측
100m x 100m (뉴욕시 1블럭 크기) 그리드를 이용해 뉴욕시 전역에 선택된 예측인 자를 지도로 시각화했다. 그리고 히스토그램을 이용해 도시 전역의 판매 분포를 살표본 다음 푸드 트럭 당 매주 판매 평균 금액을 약 $2,786로 계산했다.
분석 목표는 판매 수익을 높일 수 있는 새로운 위치를 찾는 것으로 수익 패턴의 꼭지점을 선택한 다음 이를 매출 수익 영역으로 묶었다. 모델의 R-Squared의 값이 0.63으로 정확한 위치를 찾는 것에 확신은 없었으나, 대신 수익을 높일 수 있는 가능성이 높은 지역을 찾을 수 있었으며 아래 지도처럼 클러스터를 이루고 있었다. 아래 이미지는 이러한 각각의 작업들을 통해 산출된 지도들로 최종적으로 매출이 높을 것으로 예측되는 지역이 6곳 나타났다. 각 위치별로 주별 판매 평균에 따라 순위를 책정했다.
1. Corona Park: 주당 평균 $6,128
2. Penn Station: 주간 판매 평균 $5,975
3. SoHo: 주당 평균 판매액 $5,911
4. Grand Central Station: 매주 평균 $5,766
5. West Village: 주당 평균 판매액 $5,234
6. DUMBO: 주당 평균 판매액 $5,193
대부분(Penn Station, Grand Central Station 등) 이미 매출이 높은 것을 알고 있는 장소도 있었지만, Corona Park가 매출이 높은 것으로 예측 된 것은 놀라웠다. 인근 관광 명소와 인구 밀도 등을 고려했을 때 의미 있는 결과로 판단된다.
** 원문: https://carto.com/blog/optimizing-food-truck-locations/ (본문의 내용을 좀더 이해하기 쉽게 의역해 놓았습니다.)
- 끝 -
'Location Intelligence' 카테고리의 다른 글
지리공간 마케팅 전략 수립을 위한 5가지 우선 순위 (0) | 2018.09.17 |
---|---|
'14년 여름 스페인 관광여행 소비유형 데이터 분석 (0) | 2018.08.02 |
위치 정보와 데이터들을 이용한 소매 분야 옴니채널 성공 (0) | 2018.07.27 |