data science
-
R을 이용해서 공공데이터를 읽어보기Programming/R programming 2019. 11. 1. 21:32
오늘 한 실습은 공공데이터를 가져와서 R에서 간단한 전처리를 거친 후에 데이터를 시각화하는 것이었다. 저번 학기 데이터베이스 수업 이후 오랜만에 들어가본 서울 열린데이터광장.. (https://data.seoul.go.kr/) 오늘 사용한 데이터는 서울시 주민등록인구(구별) 통계자료이다. 0. 데이터준비 다운받은 엑셀파일은 내가 작성하는 R 코드파일이 위치한 workspace에 저장해둔다. 참고) 열린데이터광장은 서울시와 관련된 공공데이터를 제공하는 사이트인데, DB를 다뤄야 할 일이 있을 때 사용하면 좋다. 1. 데이터 읽어오기 원래는 csv 파일을 사용하면 좋지만, 가끔 깨지는 경우가 있어 xls 파일을 다운받았다. csv 파일을 읽어올 때는 패키지 설치없이 위에 주석처럼 read.csv("파일명.c..
-
R이란 무엇인가? - R 소개, R 설치, R studioProgramming/R programming 2019. 11. 1. 20:39
오늘 운이 좋게도, R 프로그래밍을 배울 수 있는 기회가 생겨 교육에 다녀왔다. 그 전에 내가 R에 대해 알고 있는 것은 통계쪽에서 많이 쓰인다? 빅데이터와 관련된다? 이런 정도였다. 궁금하기는 했지만.. 찾아보지도 않다가 어제 처음으로 R studio를 설치했다. 오늘 배운 부분을 리뷰하기 전에 R에 대해 써보려고 한다. 'R'이란 무엇인가? R는 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경이다.[2] 뉴질랜드 오클랜드 대학의 로버트 젠틀맨(Robert Gentleman)과 로스 이하카(Ross Ihaka)에 의해 시작되어 현재는 R 코어 팀이 개발하고 있다. R는 GPL 하에 배포되는 S 프로그래밍 언어의 구현으로 GNU S라고도 한다. R는 통계 소프트웨어 개발과 자료 분석에 널리..