Project

Hadoop/HIVE를 활용 Project

구자룡 2021. 6. 14. 11:36

프로젝트명 : 

Hadoop/HIVE를 활용한 아파트 시세 분석.

 

수행기간 : 

2021.05.31. ~ 2021.06.07.

 

사용 환경 :

Hadoop/HIVE , R

 

수행목표 :

2006년부터 2020년까지의 아파트 거래 및물가 데이터를 토대로 지역별 아파트 최고, 최저 거래 구역을 추출하고 지도 시각화.

도출된 결과를 통해 어떤 원인이 있었는지 분석.

 

Hadoop/HIVE : 아파트 거래량, 아파트 실 거래 가격 및 가격 지수, 물가 지수에 대한 데이터를 정형화 시켰습니다.

물가지수, 아파트 부동산 거래량, 아파트 실 거래 가격 데이터 파일은 HIVE를 활용하여 테이블 생성 및 쿼리문을 사용하여 데이터를 도출하였습니다.

 

R : R을 사용한 분석은 데이터 파일을 읽어와 각 행정구역의 지도를 shapefile을 사용하여 생성 후 지도를 좌표계로 변환 지역 이름이 아닌 지역 id값으로 기준을 선정. 각 지역번호 중 가장 큰 수 이하로 하여 원하는 지역을 선정하고 ggmap을 사용하여 데이터의 좌표계 위, 경도 값을 가져와 지도상의 표시 후 행정 구역별 아파트 최고 및 최저 거래량과 거래 가격 지수를 지도 시각화 했습니다.

 

분석결과 : 

 

Hadoop_project_1조(김형창_구자룡_김도아_김민지).pptx
4.39MB