Package này tập hợp các function giúp giải quyết công việc xử lý dữ liệu thường ngày. Để ứng dụng R có hiệu quả vào công việc, thân mời bạn tham gia khóa học R ở www.tuhocr.com
giúp trang bị kiến thức R vững chắc.
Hướng dẫn cài đặt
Cài đặt package tuhocr
theo cách sau.
# install.packages("devtools")
devtools::install_github("tuhocr/tuhocr", force = TRUE)
Lưu ý: Thông thường khi cài đặt package thì R sẽ đề nghị bạn update các package khác có liên quan. Để đảm bảo hệ thống ổn định thì bạn không cần thiết phải update nhé.
Các chức năng chính
Function dùng làm sạch dataset
Trong package này có function clean_spss()
giúp import file SPSS (.sav) vào trong R. Sau đó các cột có label sẽ được chuyển thành factor, cũng như làm sạch các thông tin liên quan đến SPSS để ta có data frame sạch. Tương tự cho function clean_stata()
.
# Các bạn download các file SPSS (.sav) example này về.
# http://spss.allenandunwin.com.s3-website-ap-southeast-2.amazonaws.com/data-files.html
# Thực hiện dòng lệnh. Ta thu được data frame sạch để phân tích dữ liệu.
library(tuhocr)
data <- clean_spss("https://tuhocr.netlify.app/experim.sav")
head(data[, 1:6])
#> id sex age group fost1 confid1
#> 1 4 male 23 confidence building 50 15
#> 2 10 male 21 confidence building 47 14
#> 3 9 male 25 maths skills 44 12
#> 4 3 male 30 maths skills 47 11
#> 5 12 male 45 confidence building 46 16
#> 6 11 male 22 maths skills 39 13
str(data)
#> 'data.frame': 30 obs. of 18 variables:
#> $ id : num 4 10 9 3 12 11 6 5 8 13 ...
#> $ sex : Factor w/ 2 levels "male","female": 1 1 1 1 1 1 1 1 1 1 ...
#> $ age : num 23 21 25 30 45 22 22 26 23 21 ...
#> $ group : Factor w/ 2 levels "maths skills",..: 2 2 1 1 2 1 2 1 2 1 ...
#> $ fost1 : num 50 47 44 47 46 39 32 44 40 47 ...
#> $ confid1 : num 15 14 12 11 16 13 21 17 22 20 ...
#> $ depress1: num 44 42 40 43 44 43 37 46 37 50 ...
#> $ fost2 : num 48 45 39 42 45 40 33 37 40 45 ...
#> $ confid2 : num 16 15 18 16 16 20 22 20 23 25 ...
#> $ depress2: num 44 42 40 43 45 42 36 47 37 48 ...
#> $ fost3 : num 45 44 36 41 43 39 32 32 40 46 ...
#> $ confid3 : num 14 18 19 20 20 22 23 26 26 27 ...
#> $ depress3: num 40 40 38 43 43 38 35 42 35 46 ...
#> $ exam : num 52 55 58 60 58 62 59 70 60 70 ...
#> $ mah_1 : num 0.57 1.659 3.54 2.454 0.944 ...
#> $ DepT1gp2: Factor w/ 2 levels "not depressed",..: 1 1 1 1 1 1 1 2 1 2 ...
#> $ DepT2Gp2: Factor w/ 2 levels "not depressed",..: 1 1 1 1 2 1 1 2 1 2 ...
#> $ DepT3gp2: Factor w/ 2 levels "not depressed",..: 1 1 1 1 1 1 1 1 1 2 ...
Làm bài tập R
Mình định kỳ có upload các bài tập củng cố kiến thức R ở chuyên mục Bài Tập R. Các file này chạy online trên server RStudio (Shiny app) tuy nhiên đôi khi sẽ bị chậm, vì vậy bạn có thể render local trên máy tính bằng dòng lệnh learnr::run_tutorial(name = "hack1", package = "tuhocr")
với hack1
là codename tương ứng của từng bài tập.
Trích xuất dữ liệu từ FAOSTAT
Áp dụng function extract_faostat()
và filter_faostat()
để trích xuất dữ liệu nông sản từ FAOSTAT theo thứ hạng và thời gian. Hướng dẫn chi tiết
# vignette(topic = "filter_faostat", package = "tuhocr")
Thông tin package
Bản quyền
Các function trong package tuhocr
được viết theo giấy phép GNU General Public License (version 3) cho phép phân phối hoàn toàn miễn phí đến người sử dụng. Ở vai người dùng, bạn được quyền chỉnh sửa function và tái phân phối lại hoàn toàn tự do.
Mặc dù mình (Duc Nguyen) đã kiểm tra rất kỹ hoạt động của package để đảm bảo kết quả chính xác, tuy nhiên vẫn sẽ có sai sót, có gì bạn email báo lỗi trực tiếp cho mình qua email để kịp thời chỉnh sửa lại nhé.
Chỉ là bạn cần nắm rõ: Bởi vì package này sử dụng giấy phép GNU nên việc áp dụng các function trong package tuhocr
vào công việc của bạn nếu có sai sót gì phát sinh thì hoàn toàn là do bạn. Không có bất kỳ bảo hành hay chịu trách nhiệm gì về phía mình (là người viết package này).
# This program comes with ABSOLUTELY NO WARRANTY; for details type 'show w'.
# This is free software, and you are welcome to redistribute it
# under certain conditions.