Uploaded by 송민석

sdasdsad

advertisement
DS응용_과제1_202104329_송민석
DS응용 과제1 - Data mining 의 실제 활용 사례 조사
기업: 스타벅스
주제: 스타벅스의 매장 위치 선정과 그에 대한 데이터 활용
스타벅스의 위치 매장 위치 선정이 좋다는 것은 많이들 알려져 있는 이야기다. 나도 스
타벅스가 특정 위치에 지어지면 그것이 좋은 상권이라는 의미라 다른 카페 브랜드가 들
어오기도 그리고 그 상권이 좀 더 살아나기도 한다는 이야기를 들었다. 이렇듯 좋은 위
치를 판단하는 스타벅스의 능력은 데이터 과학이 일조하였다는 사실이 있다. 위치 판단
뿐만이 아니라 로열티 프로그램으로 고객들의 주문 데이터를 토대로 신제품을 만드는 것
에도 이용하고 집에서 먹는 가정용 용품을 만드는 것에도 이용이 된다. 또한 각 나라별
매장 현지의 날씨, 시간과 같은 데이터로도 제품을 출시, 판매하는 것에 쓰인다. 뿐만이
아니라 음료를 만드는 데에 필요한 다양한 장비들을 관리하는데도 쓰인다. 장비의 고장
예측뿐만이 아니라 새로운 장비 개발에도 쓰인다. 이렇듯 다양한 분야에 쓰이지만, 어쩌
면 혁신과는 거리가 있어 보이는 활용으로 보일 수 있다. 허나 훌륭한 데이터 기술의 활
용을 하는 것은 확실해 보인다. 이번 과제에서는 스타벅스의 위치 선정에 대해서 조사하
였다. 또 스타벅스는 Esri라는 기업과 협업을 한다. 스타벅스의 성공의 이유 중 하나인 좋
은 매장 위치 선점에는 데이터 분석 기업인 Esri와의 협업이다. Esri는 위치 분석 분야에
서 뛰어나는 기업이며 지도나 공간 등의 분석 솔루션을 제공한다. 스타벅스는 Esri와의
긴밀한 협업을 통해 좋은 위치 선정을 하는 것에 큰 도움을 받고 있다. 이 때 인구 밀도,
평균 수입, 교통 패턴 등의 다양한 데이터가 쓰인다. 또 Esri가 개발한 Atlas라는 기술에
도 도움을 받는데 이를 통해서 인구, 소득 수준, 트래픽, 경쟁사 입지, 다른 스타벅스 매
장 위치와의 근접성 등의 변수들을 평가가 가능하다. 이렇게 전문적인 회사와의 협업으
로 스타벅스는 훌륭한 위치를 판단해서 매장을 입점시킬 확률이 늘어나고 현재의 우리가
가지고 있는 스타벅스는 위치 선정을 잘한다는 이미지가 생기는 것에 일조를 하였다.
본격적으로 스타벅스의 데이터 분석에 대해서 알아보겠다.
우선 데이터 분석을 했을 때 스타벅스는 나라의 단위에서부터 위치 선정을 하는 것으로
보였다. 해외 시장의 진출에 대해서는 막대한 투자가 필요하기에 굉장히 신중할 필요가
있다. 이때 분석하는 데이터 중 하나는 현지의 경제 상황이다. 그 경제 상황을 나타내는
정보 중 하나인 GDP 데이터와의 연관성을 보자
GDP, 인구, 1인당 GDP의 차이를 비교해보면 스타벅스 매장이 있는 국가와 스타벅스 매
장이 없는 국가는 앞서 말한 지표에서 차이를 보인다 기본적으로 스타벅스 매장이 없는
국가의 지표들은 스타벅스 매장이 있는 국가들 보다 낮은 것을 볼 수 있고, 이는 스타벅
스가 경제적인 규모가 있는 국가에 진출하는 것을 선호하는 것으로 볼 수도 있다.
다음으로 다른 경제 지표와 매장수의 관계를 알아보자
좌측의 그래프를 보면 1개 매장이 제공하는 인구수와 1인당 GDP는 삼점도에서 음의 상
관관계를 확인할 수 있다. 1인당 GDP의 증가에 따라 매장이 제공하는 평균 인구수는 감
소하는데 이를 통해서 부유한 지역에서는 스타벅스가 더 많은 매장을 여는 경향을 확인
할 수 있다. 우측 그래프에 산점도를 색상을 통해서 대륙을 구분하면 또 다른 정보를 확
인할 수 있다. 아시아 국가는 직선의 아래에 분포하는 경향 유럽은 위에 분포하는 경향
을 볼 수 있다. 이는 인구 1인당 GDP 국가들의 사이에서도 아시아에는 더욱 많은 매장
을 입점하는 것으로 분석이 가능하다. 또한 앞서 분석한 경향에서도 그 경향을 따라가지
않는 데이터들에서도 분석할 거리들이 있다. 이탈리아와 같은 커피 문화와 연이 깊은 나
라가 그 예시 중 하나가 될 수 있을 것이다.
다음으로 매장의 소유 형태에 따른 분석도 가능하다 표 오른쪽에 나타나는 것처럼 다양
한 형태의 매장 소유형태가 있다. 회사의 관점에서는 방해요소가 없다면 모든 것을 회사
가 모든 매장을 단독으로 소유하는 형태가 가장 이상적인 형태일 것이다 그럼에도 다른
형태의 소유 형태가 있는 것은 각 나라의 정책과 같은 요소가 원인일 가능성이 있습니
다. 이를 이용해서 부패 같은 요소들을 관찰할 수도 있다. 하지만 이러한 정보는 나라들
의 데이터를 대륙과 같은 큰 단위로 묶어서 평균을 내면 이러한 요소들을 관찰하기 힘들
다.
영국의 매장 분포에 관한 자료를 보면 특정 패턴을 발견이 가능하다.
짙은 녹색은 회사 소유 매장, 검은색은 프렌차이즈, 연튼 녹색은 라이선스 매장이다. 지
도에서 짙은 녹색은 런던에 모여 있고 나머지는 전국에 퍼져 있다. 아까 나라들을 대륙
단위로 묶으면 관측하기 힘든 정보들이 했었다. 이번엔 지역들을 나라의 단위로 묶으면
관측하기 힘든 정보를 볼 수 있다. 그렇다고 끝없이 작은 단위로 쪼개면 무조건 좋을까?
물론 아니다 각 묶음의 단위별로 우리가 볼 수 있는 찾을 수 있는 정보들이 다른 것이
다. 또한 무한정 작게 쪼개면 데이터를 구하는 것에 어려움이 있고 또 그에 들어가는 다
양한 비용에 부담이 있을 것이다. 이렇게 어쩌면 단순하게 보면 음료 굳이 더 하자면 디
저트를 팔 뿐인 카페의 매장 데이터를 통해 다양한 관점을 얻을 수 있는 것 같다. 데이
터를 분석해서 매장을 입점한 스타벅스 그리고 실제 사업을 진행하다 보면 데이터 분석
이 틀린 결과 맞는 결과의 영향으로 통해 매장에 대한 데이터는 변화가 될 것이다. 그것
을 또 스타벅스가 아닌 제3자의 입장에서 분석해서 다양한 정보를 이끌어낼 수 있다. 그
3자가 필요한 정보는 비단 카페에 관련된 것뿐만이 아닐 것이다. 다른 형태의 카페 혹은
음식점 혹은 아예 다른 분야의 사업 혹은 사업이 목적이 아닌 사람들 까지도 이러한 데
이터를 활용해서 각각 자신들에게 유용한 정보들을 얻어낼 수 있다.
다음 분석으로 도시 내 점포 간의 평균 거리에 대한 데이터가 있다. 이 데이터는 더 많
은 매장을 입점할 수 있는 잠재력을 평가하는 지표가 될 수 있다. 물론 지표 중 하나일
뿐이다. 이렇게 매장에 관한 데이터를 다양하게 다뤄봤다. 복잡한 수식이 없어도 이렇게
도 꽤나 유용한 정보들을 얻어낼 수 있었다. 당연한 말이지만 적절한 곳에 복잡한 수식
이든 필요한 수식들을 활용하면 훨씬 더 다양한 곳에 도움을 주거나 더 큰 도움을 줄 수
있다. 이 데이터 분석들을 보면서 하나 알게 된 것은 복잡하고 어려운 수식만이 중요한
것이 아닌 데이터를 유연하게 다루는 것에 따라 정보들을 얻어낼 수 있는 것이다. 시각
화, 분류 등의 방법 또 그 방법들의 방향성, 정도 등에 따라서도 데이터에서 얻어낼 수
있는 정보의 분야, 양 모두 엄청나게 크게 달라질 수 있다는 것을 느낄 수 있었다. 단순
히 매장에 대한 정보만으로도 이렇게 다양한 정보를 얻을 수 있어 신기하였다. 하지만
아무래도 그렇게 깊은 분석은 아니다 보니 여기서 얻어낸 정보들이 얼마나 의미가 있을
지 얼마나 활용할 수 있을지는 모르겠다. 허나 데이터 분석에 대한 시야를 넓히는 것과
흥미를 높이는 것에는 도움을 줄 수 있을 것 같다. 다른 방식의 시각화는 어떠한 정보를
더 줄 수 있을지, 다른 데이터는 어떠한 다양한 정보를 줄 수 있을지, 분석으로 얻어낸
정보들은 어떻게 쓰일지 등 다양한 궁금증을 유발했다.
인용 자료
https://www.bloter.net/news/articleView.html?idxno=31668
https://nycdatascience.com/blog/r/starbucks-store-location-analysis/
강의 자료
Download