일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- GIS
- 인공지능
- Data Analysis
- 설치
- CARTO
- Big data
- 빅데이터
- mapping
- Spatial Data Analysis
- AI
- 데이터 시각화
- 인스톨
- 지도
- plugin
- QGIS
- data visualization
- 웹지도
- install
- 플러그인
- machine learning
- Kepler.gl
- 우버
- Uber
- 공간데이터 분석
- 머신러닝
- Web GIS
- 데이터 분석
- Mapbox
- map
- Web Mapping
- Today
- Total
GIS & Spatial Analysis in KOREA
라돈 - 04 데이터 분석 및 시각화(1) 본문
[Spatial Analysis]
#GIS #QGIS #Spatial Data Analysis #Big Data #Data #Map #Radon #School #EDA #CDA #QDA
#공간데이터 분석 #빅데이터 #라돈 #발암물질 #학교 #실내공기질 #데이터 #지도
#탐색적 데이터 분석 #확증적 데이터 분석 #질적 데이터 분석
[ 04 데이터 분석 및 시사점 도출(1) ]
가장 중요한 분석용 데이터(전국 초/중/고등학교 및 라돈 검출 학교 데이터)를 앞선 장 ‘03 분석용 데이터로 재구축’을 통해 재구축 했다. 분석에 가장 기본이 되고 중요한 데이터를 완성한 것이다. 데이터 과학에서 분석 프로세스는 위 도표처럼 ① 문제를 정의하고, ② 관련 데이터를 수집하고, ③ 목적에 맞는 분석용 데이터로 재구축하고, ④ 분석을 통해 의사결정에 도움을 주는 시사점을 도출하고, ⑤ 결과를 보완하고 실행 방안을 수립해야 한다고 얘기한다. 하지만, 처음 분석을 시작하는 분석 초보자 단계에서는 다음으로 무엇을 해야 할지 방향을 잡기 매우 어렵다.
데이터 분석(Data Analysis)이란 위키피디아에 따르면,
“Data analysis is a process of inspecting, cleansing, transforming, and modeling data with the goal of discovering useful information, informing conclusions, and supporting decision-making.”
라고 정의되어 있으며, 의사결정을 뒷받침하기 위한 어떤 정보에 대한 결론을 도출할 목적으로 프로세스를 거쳐 데이터를 분석하는 것이라고 되어 있다. 즉, 데이터 분석은 의사결정(Decision Making)에 영향을 줄 수 있어야 한다는 의미가 내포되어 있다. 데이터 분석(Data Analysis)은 데이터 분석 범위, 목적, 초점 등에서 데이터 마이닝(Data Mining)과는 구별된다. 데이터 마이닝 담당자는 데이터를 통해 아직 밝혀지지 않은 데이터 내의 패턴을 정의하고 숨겨진 관계를 찾아내기 위해 프로그램 등을 이용하여 대량의 데이터 셋을 정렬하는 작업을 주로 한다. 하지만, 데이터 분석가는 결론을 도출해내는 것에 초점을 둔다.
이를 위해 학문에서는 데이터 분석을 아래와 같이 3가지로 분류하고 있다.
EDA(Exploratory Data Analysis) - 탐색적 데이터 분석
CAD(Confirmatory Data Analysis) - 확증적 데이터 분석
QDA(Qualitative Data Analysis) - 질적 데이터 분석
하지만 많은 기업들은 자신들의 데이터 분석을 정확히 구분하기 쉽지 않기 때문에 통칭해 데이터 분석(Data Analysis)이라 부르고 있다.
결국, 데이터 분석의 목적은 데이터를 정확히 이해하는 것이다. 분석 목적을 위해서 가장 기본이 되는 것은 질문을 잘 만들어 데이터 탐색 과정을 통해 결국 데이터를 표현하는 적절한 모형, 시각화 결과물, 다음 분석을 위한 데이터를 생성해 내는 것이다. 데이터 분석 경험을 통해 알게 된 것은 질문의 질을 높이는 방법은 결국 질문을 많이 하는 것이다. 즉, 질문의 질은 질문의 양에 비례한다는 것이다. 데이터에 대해 아는 것이 거의 없기 때문에 주어진 기간 내에 질문의 질을 높이기 위해서는 한정된 시간 동안 가능한 많은 질문을 만들고, 데이터 탐색 과정을 거쳐 최대한 좋은 질문으로 다듬어 가는 것이다.
아래 질문은 질문의 질은 높지 않지만 알고 싶은 부분에 대해 작성한 질문들이다.
A. 2017년 라돈으로 학생들이 위험한 학교는 어디인가?
라돈의 농도가 높은 학교의 위치
학생수 대비 라돈의 농도가 높은 학교
라돈 농도가 높은 학교가 밀집한 지역(시도/시군구/읍면동/국가기초구역/밀집도)
B. 2017년 라돈 농도가 높은 학교의 특징은 무엇인가?
학교들이 위치한 지질과 라돈 농도와의 연관성
학교들의 지리적 위치(도심/농어촌)와 라돈 농도의 연관성
학교들 건축 연도에 따른 라돈 농도의 연관성
다른 환경 오염 시설과 라돈 농도의 연관성
다음 장에서는 본 질문들을 바탕으로 데이터 분석을 진행해 보고자 한다.
- 끝 -
'Spatial Analysis > 01 전국 라돈 검출 학교' 카테고리의 다른 글
라돈 - 05 데이터 분석 및 시각화(2) (0) | 2018.07.16 |
---|---|
라돈 - 03 공간 분석용 데이터로 재구축 (0) | 2018.06.25 |
라돈 - 02 공간분석 활용데이터 정의 및 수집 구축 (0) | 2018.06.20 |