Phần này nhóm Thạc Sĩ sẽ cung cấp một cái nhìn tổng quan gọn gàng về một số ví dụ kiểm định thống kê thịnh hành cơ bạn dạng trong Stata.Các lệnh được áp dụng là:
ttesttabulate , chi2 exactcorrelatepwcorrdrop ifregressonewayHãy thực hiện file dữ liệu auto cho những ví dụ .
Bạn đang xem: Kiểm định chi bình phương trong stata
sysuse auto
Lệnh ttest
Sử dụng t-test để đối chiếu số dặm miles bên trên một xăng gallon (mpg) thân xe hơi trong nước và xe khá nhập khẩu.Ở phía trên nói thêm đó là đơn vị giám sát ở Mĩ, một gallon =3.7854 lít , còn một dặm miles bởi 1.6 kilometttest mpg , by(foreign)Two-sample t demo with equal variances
Như chúng ta thấy trong tác dụng ở trên, xe vào nước gồm mpg rẻ hơn đáng chú ý (19,8) so với xe nước ngoài (24,7). Tức là xe nội địa chạy hau xăng rộng xe quốc tế nhập khẩu.
Kiểm định chi bình phương Chi-square stata
Hãy so sánh xếp hạng thay thế sửa chữa (rep78) của ô tô quốc tế và xe hơi trong nước. Chúng ta cũng có thể làm một bảng chéo crosstab của rep78 cùng foreign. Chúng ta cũng có thể muốn hỏi liệu những biến này có tự do hay không. Bạn cũng có thể sử dụng tùy lựa chọn chi2 để yêu cầu một kiểm định chi-bình phương về tính độc lập giữa hai đổi mới đồng thời biểu đạt bảng chéo cánh crosstabtabulate rep78 foreign, chi2
Pearson chi2(4) = 27.2640 lăng xê = 0.000Giá trị pr =0.000 chứng minh có mối quan hệ giữa rep78 và foreign. Nghĩa là 2 biến này sẽ không độc lập.Chi-square không đích thực hợp lệ khi bạn có những ô trống. Một trong những trường hòa hợp như vậy khi bạn có các ô trống hoặc các ô có tần số nhỏ, bạn cũng có thể yêu cầu kiểm định “Fisher’s exact test” cùng với tùy lựa chọn exact.tabulate rep78 foreign, chi2 exact
Do hiệu quả Fisher's exact = 0.000, đề nghị ta vẫn kết luận có mối quan hệ giữa hai giá trị biến đổi này nhé.Tương quan correlation
Chúng ta hoàn toàn có thể sử dụng lệnh đối sánh tương quan correlation để lấy tương quan giữa những biến. Hãy chăm chú mối đối sánh tương quan giữa price mpg weight và rep78. (Sử dụng rep78 trong côn trùng tương quan tuy vậy nó không liên tục, nghĩa là số liệu bị thiếu hụt missing value, nhằm minh họa điều gì sẽ xảy ra khi ta áp dụng mối đối sánh với những biến có dữ liệu bị thiếu.)correlate price mpg weight rep78
Lưu ý rằng kết quả ở trên đã nói (số quan gần kề obs = 69). Lệnh đối sánh tương quan xóa drop tài liệu theo nguyên tắt listwise, có nghĩa là nếu ngẫu nhiên biến nào bị thiếu tài liệu ở chiếc quan sát đó, thì toàn cục quan tiếp giáp ở cái đó có khả năng sẽ bị bỏ qua khỏi phân tích tương quan.Chúng ta rất có thể sử dụng pwcorr (tương quan tiền theo từng cặp pairwise correlations) nếu họ muốn có được các tương quan xóa tài liệu bị thiếu thốn trên cửa hàng từng cặp pairwise thay bởi vì cơ sở theo list listwise. Nói đơn giản, vì đối sánh là xét mối quan hệ giữa nhị biến, ví như hai biến chuyển đó có vừa đủ số liệu không trở nên thiếu thì đưa tấ cả các quan liền kề vào để chạy tương quan, mặc kệ 1 trở nên khác bị thiếu. Bọn họ sẽ áp dụng tùy chọn obs nhằm hiển thị số lượng quan giáp được áp dụng để đo lường và thống kê mỗi côn trùng tương quan.pwcorr price mpg weight rep78, obs
Lưu ý rằng các đối sánh tương quan liên quan cho rep78 có con số quan tiếp giáp N là 69 đối với các đối sánh tương quan khác bao gồm N là 74. Điều này là vì rep78 tất cả 5 quý giá bị thiếu, bởi vì vậy nó chỉ bao gồm 69 quan liền kề hợp lệ, nhưng những biến khác không có dữ liệu bị thiếu bắt buộc đã tất cả 74 quan cạnh bên hợp lệ.Hồi Quy
Hãy coi xét triển khai phân tích hồi quy vào Stata. Đối với lấy một ví dụ này, hãy thải trừ các ngôi trường hợp mà lại rep78 là 1 hoặc 2 hoặc bị thiếu.
drop if (rep78 (15 observations deleted)Bây giờ, hãy dự kiến mpg từ chi tiêu price với trọng lượng weight. Như các bạn thấy mặt dưới, trọng lượng là 1 trong yếu tố dự đoán đáng nhắc về mpg, tuy vậy giá thì không( căn cứ vào p value của price và weight, dòng nào regress mpg price weight
Điều gì sẽ xẩy ra nếu ta cũng muốn dự đoán mpg tự rep78. Rep78 thực sự là 1 biến phân các loại hơn là 1 trong biến liên tục. Để chuyển nó vào hồi quy, chúng ta nên biến hóa rep78 thành những biến giả. Suôn sẻ thay, Stata làm cho những biến giả dễ dàng dàng bằng phương pháp sử dụng tabulate. Tùy lựa chọn gen (đại diện) cho Stata biết rằng bọn họ muốn tạo các biến mang từ rep78 và chúng ta muốn gốc của những biến giả là đại diện.tabulate rep78, gen(rep)
Stata đã chế tác rep1 (mang cực hiếm 1 giả dụ rep78 là 3), rep2 (mang quý giá 1 giả dụ rep78 là 4) và rep3 (mang quý giá 1 giả dụ rep78 là 5) như hình trênBây giờ bạn cũng có thể bao tất cả rep1 cùng rep2 dưới dạng những biến trả trong mô hình hồi quy.regress mpg price weight rep1 rep2Phân tích phương không đúng Analysis of variance
Nếu bạn muốn thực hiện phân tích phương không nên để chú ý sự khác hoàn toàn trong mpg giữa tía nhóm sửa chữa, bạn có thể sử dụng lệnh oneway để tiến hành việc này.oneway mpg rep78Analysis of Variance
Nếu bạn bao hàm tùy lựa chọn tabulation, các bạn sẽ nhận được vừa đủ mpg cho ba nhóm rep78, điều này cho biết nhóm tất cả xếp hạng sửa chữa tốt nhất (rep78= 5) cũng có mpg tối đa (27,3).oneway mpg rep78, tabulate