Dữ liệu này gồm 90 observations of 8 variables. Paper
Nghiên cứu này khảo sát mối quan hệ giữa rich (độ đa dạng thực vật) với các yếu tố khác như distance (khoảng cách từ khu rừng đến bờ biển), elev (độ cao so với mực nước biển), … trong chủ đề kiểm soát cháy rừng ở California.
distance: Distance to coast
elev: Elevation from sea level
abiotic: Abiotic favorability
age: Age of stand before fire
hetero: Plot heterogeneity
firesev: Severity of fire
cover: Cover of plants
rich: Plant species richness
2 So sánh kết quả giữa chạy SEM bằng lavaan và linear regression
Đầu tiên, ta khảo sát mối quan hệ giữa age độ tuổi của thực vật với firesev mức độ dễ cháy. Dễ nhìn ra, cây có độ tuổi càng cao thì thân và vỏ cây càng khô, dễ mục và từ đó dễ bắt lửa. Vì vậy biến X = age, biến Y = firesev.
Ta mô tả quan hệ giữa hai biến này như sau. Chiều mũi tên, cho thấy nguyên nhân age tác động đến kết quả firesev [biến nội sinh, endogenous (response) variable].
plot(firesev ~ age,data = keeley,las =1,main ="Mối quan hệ giữa firesev và age")fit <-lm(firesev ~ age, data = keeley)abline(fit, col ="red")
var(keeley$age)
[1] 157.9112
var(keeley$firesev)
[1] 2.73025
cov(keeley$age, keeley$firesev)
[1] 9.423989
cor(keeley$age, keeley$firesev)
[1] 0.4538654
2.1 Phân tích theo kiểu SEM
Bản chất mối quan hệ này, ta có thể phân tích theo kiểu hồi quy tuyến tính để tìm ra tác động của biến age với biến firesev, và đó cũng là một mô hình SEM (về cơ bản SEM là mô hình hồi quy tuyến tính).
The package to fit the SEM using covariance-based methods is called lavaan (for LAtent VAriable ANalysis, which we will delve into in a later chapter).
keeley_sem1 <-sem(keeley_formula1, data = keeley)summary(keeley_sem1)
lavaan 0.6-20 ended normally after 1 iteration
Estimator ML
Optimization method NLMINB
Number of model parameters 2
Number of observations 90
Model Test User Model:
Test statistic 0.000
Degrees of freedom 0
Parameter Estimates:
Standard errors Standard
Information Expected
Information saturated (h1) model Structured
Regressions:
Estimate Std.Err z-value P(>|z|)
firesev ~
age 0.060 0.012 4.832 0.000
Variances:
Estimate Std.Err z-value P(>|z|)
.firesev 2.144 0.320 6.708 0.000