Skip to contents

Function này giúp import file SPSS (.sav) vào trong R. Sau đó các cột có label sẽ được chuyển thành factor, cũng như làm sạch các thông tin liên quan đến SPSS để ta có data frame sạch.

Báo lỗi function: tuhocr.com@gmail.com

Usage

clean_spss(input_data, ...)

Arguments

input_data

File SPSS (.sav)

...

Tham số này của lệnh haven::read_sav()

Examples

# Các bạn download các file SPSS (.sav) example này về.
# http://spss.allenandunwin.com.s3-website-ap-southeast-2.amazonaws.com/data-files.html
# Thực hiện dòng lệnh. Ta thu được data frame sạch để phân tích dữ liệu.
data <- clean_spss("https://tuhocr.netlify.app/experim.sav")
head(data[, 1:6])
#>   id  sex age               group fost1 confid1
#> 1  4 male  23 confidence building    50      15
#> 2 10 male  21 confidence building    47      14
#> 3  9 male  25        maths skills    44      12
#> 4  3 male  30        maths skills    47      11
#> 5 12 male  45 confidence building    46      16
#> 6 11 male  22        maths skills    39      13
str(data)
#> 'data.frame':	30 obs. of  18 variables:
#>  $ id      : num  4 10 9 3 12 11 6 5 8 13 ...
#>  $ sex     : Factor w/ 2 levels "male","female": 1 1 1 1 1 1 1 1 1 1 ...
#>  $ age     : num  23 21 25 30 45 22 22 26 23 21 ...
#>  $ group   : Factor w/ 2 levels "maths skills",..: 2 2 1 1 2 1 2 1 2 1 ...
#>  $ fost1   : num  50 47 44 47 46 39 32 44 40 47 ...
#>  $ confid1 : num  15 14 12 11 16 13 21 17 22 20 ...
#>  $ depress1: num  44 42 40 43 44 43 37 46 37 50 ...
#>  $ fost2   : num  48 45 39 42 45 40 33 37 40 45 ...
#>  $ confid2 : num  16 15 18 16 16 20 22 20 23 25 ...
#>  $ depress2: num  44 42 40 43 45 42 36 47 37 48 ...
#>  $ fost3   : num  45 44 36 41 43 39 32 32 40 46 ...
#>  $ confid3 : num  14 18 19 20 20 22 23 26 26 27 ...
#>  $ depress3: num  40 40 38 43 43 38 35 42 35 46 ...
#>  $ exam    : num  52 55 58 60 58 62 59 70 60 70 ...
#>  $ mah_1   : num  0.57 1.659 3.54 2.454 0.944 ...
#>  $ DepT1gp2: Factor w/ 2 levels "not depressed",..: 1 1 1 1 1 1 1 2 1 2 ...
#>  $ DepT2Gp2: Factor w/ 2 levels "not depressed",..: 1 1 1 1 2 1 1 2 1 2 ...
#>  $ DepT3gp2: Factor w/ 2 levels "not depressed",..: 1 1 1 1 1 1 1 1 1 2 ...