공공데이터활용
-
R을 이용해서 공공데이터를 읽어보기Programming/R programming 2019. 11. 1. 21:32
오늘 한 실습은 공공데이터를 가져와서 R에서 간단한 전처리를 거친 후에 데이터를 시각화하는 것이었다. 저번 학기 데이터베이스 수업 이후 오랜만에 들어가본 서울 열린데이터광장.. (https://data.seoul.go.kr/) 오늘 사용한 데이터는 서울시 주민등록인구(구별) 통계자료이다. 0. 데이터준비 다운받은 엑셀파일은 내가 작성하는 R 코드파일이 위치한 workspace에 저장해둔다. 참고) 열린데이터광장은 서울시와 관련된 공공데이터를 제공하는 사이트인데, DB를 다뤄야 할 일이 있을 때 사용하면 좋다. 1. 데이터 읽어오기 원래는 csv 파일을 사용하면 좋지만, 가끔 깨지는 경우가 있어 xls 파일을 다운받았다. csv 파일을 읽어올 때는 패키지 설치없이 위에 주석처럼 read.csv("파일명.c..