Chuyên đề Tin học 12 Bài 7 (Cánh diều): Kiểm định giả thuyết thống kê và phân tích tương quan tuyến tính

Với giải bài tập Chuyên đề Tin học 12 Bài 7: Kiểm định giả thuyết thống kê và phân tích tương quan tuyến tính sách Cánh diều hay nhất, chi tiết giúp học sinh dễ dàng làm bài tập Chuyên đề học tập Tin học 12 Bài 7.

1 83 13/08/2024


Giải Chuyên đề Tin học 12 Bài 7: Kiểm định giả thuyết thống kê và phân tích tương quan tuyến tính

Khởi động trang 84 Chuyên đề Tin học 12: Bảng tính ở Hình 1 thể hiện hai dãy điểm thi sức bền của hai nhóm học sinh A và B sau cùng một thời gian rèn luyện theo hai phương pháp khác nhau: nhóm A theo phương pháp chạy bộ truyền thống, nhóm B theo phương pháp mới là bơi lội. Một người nói rằng: "Chênh lệch điểm trung bình giữa hai nhóm A và B là không đáng kể (7.696 - 7.173 = 0.523), nên có thể nói rằng phương pháp mới không làm thay đổi hiệu quả rèn luyện sức bền khi so với phương pháp truyền thống". Em có đồng ý với ý kiến này không và tại sao?

Bảng tính ở Hình 1 thể hiện hai dãy điểm thi sức bền của hai nhóm học sinh A và B

Lời giải:

Bảng tính ở Hình 1 thể hiện hai dãy điểm thi sức bền của hai nhóm học sinh A và B sau cùng một thời gian rèn luyện theo hai phương pháp khác nhau: nhóm A theo phương pháp chạy bộ truyền thống, nhóm B theo phương pháp mới là bơi lội. Chênh lệch điểm trung bình giữa hai nhóm A và B không đủ để kết luận rằng phương pháp mới không làm thay đổi hiệu quả rèn luyện sức bền so với phương pháp truyền thống. Nhận định trên là một phần của cách đánh giá sự thay đổi trong hiệu quả rèn luyện và cần phải xem xét các yếu tố khác nữa, vì một số lý do sau: Độ tin cậy của dữ liệu, Sự phân tán của dữ liệu, Yếu tố ngoại cảnh…

Hoạt động 1 trang 85 Chuyên đề Tin học 12: Hãy sử dụng Excel tạo bảng tính như ở Hình 1 và thực hiện các yêu cầu sau:

1) Tính toán thống kê: Tính số trung bình và độ lệch chuẩn của hai mẫu A và B. Từ đó, hãy nhận xét về tính đại diện của các số trung bình.

2) Kiểm định giả thuyết thống kê: Hãy thực hiện phép kiểm định giả thuyết thống kê phù hợp để cho biết nhận xét của người nói trong Hoạt động khởi động có đúng về mặt thống kê hay không?

Lời giải:

1) Tính toán thống kê: Sử dụng hàm AVERAGE VÀ STDEV.P để tính điểm trung bình và tính độ lệch chuẩn cho các mẫu A và B.

2) Kiểm định giả thuyết thống kê: So sánh hai trung bình của hai mẫu độc lập A và B như sau:

- Bước 1: Thực hiện kiểm định F để só sánh phương sia của hai mẫu ( sử dụng lệnh Data Analysis > F-Test Two-Sample for Variance > OK

- Bước 2: Từ các kết quả thực hành ở bước 1, thực hiện kiểm định t - Test để đánh giá giả thuyết Ho.

Hoạt động 2 trang 89 Chuyên đề Tin học 12: Bảng tính ở Hình 5 là dữ liệu vẻ chiếu cao (CC) và cần nặng (CN) của một nhóm người (một mẫu) được rút trích từ một cơ sở dữ liệu điều tra sức khỏe toàn dân (tổng thể) của Bộ Y tế. Em hãy sử dụng Excel nhập dữ liệu đã cho và phần tích dủ liệu để trả lời các câu hỏi sau: Liệu giữa chiều cao và cần nặng có mỗi tương quan với nhau không? Nếu có thì mức độ tương quan giữa chiếu cao và căn nặng là bao nhiêu?

Bảng tính ở Hình 5 là dữ liệu vẻ chiếu cao (CC) và cần nặng (CN) của một nhóm người

Lời giải:

Bảng tính ở Hình 5 là dữ liệu vẻ chiếu cao (CC) và cần nặng (CN) của một nhóm người (một mẫu) được rút trích từ một cơ sở dữ liệu điều tra sức khỏe toàn dân (tổng thể) của Bộ Y tế. Các bước phân tích tương quan tuyến tính như sau:

- Bước 1. Trong dải lệnh Data, chọn Data Analysis, chọn Correlation

- Bước 2. Trong hộp thoại Correlation, thực hiện như sau: Trong hộp Input Range, nhập địa chỉ các cột số liệu cần kiểm tra tương quan. Tại Grouped By, chọn Columns (vì dãy số liệu được trình bày theo cột). Tại Output options, nhập ô tinh là vị trí bắt đầu đưa ra kết quả thực hiện lệnh.

- Bước 3. Đọc kết quả phân tích.

Vận dụng trang 90 Chuyên đề Tin học 12: Hãy sử dụng Excel dể thực hiện các công việc sau:

1) Nhập số gam tinh bột (Gluxit), chất đạm (Protein) và chi số đường huyết (Gluco) của một người như ở Hình 7.

2) Kiểm tra và cho biết từng dãy số liệu (Gluxit và Protein) có dược xem là phân phối chuẩn không.

3) Nếu các dãy số liệu trên có phân phối chuẩn, hãy thực hiện phép kiểm định cần thiết để cho biết giá trị trung bình của hai dãy số liệu có khác biệt về mặt thống kê hay không.

4) Kiểm tra và cho biết giữa tinh bột và chất đạm, chất nào ảnh hưởng đến chỉ số dường huyết nhiều hơn.

Hãy sử dụng Excel dể thực hiện các công việc sau Nhập số gam tinh bột (Gluxit)

Lời giải:

Các bước chi tiết khái quát cho từng bước sử dụng Excel để thực hiện các công việc:

1) Nhập dữ liệu:Mở một tệp Excel mới. Tạo các tiêu đề cho các cột dữ liệu: "Gluxit", "Protein", "Gluco". Nhập dữ liệu tương ứng vào các ô trong cột Gluxit, Protein và Gluco.

2) Kiểm tra xem giữa tinh bột và chất đạm, chất nào ảnh hưởng đến chỉ số dường huyết nhiều hơn.

Chọn một ô trống để hiển thị kết quả kiểm tra phân phối chuẩn.

Sử dụng hàm Excel =NORM.DIST() để kiểm tra xem dãy dữ liệu có phân phối chuẩn hay không.

Sử dụng công thức sau:

=NORM.DIST(A2, AVERAGE(Hãy sử dụng Excel dể thực hiện các công việc sau Nhập số gam tinh bột (Gluxit)), STDEV(Hãy sử dụng Excel dể thực hiện các công việc sau Nhập số gam tinh bột (Gluxit)), TRUE)

Trong đó:

A2 là giá trị cần kiểm tra. Hãy sử dụng Excel dể thực hiện các công việc sau Nhập số gam tinh bột (Gluxit) là dãy dữ liệu trong cột Gluxit (tương tự cho cột Protein).

AVERAGE(Hãy sử dụng Excel dể thực hiện các công việc sau Nhập số gam tinh bột (Gluxit)) và STDEV(Hãy sử dụng Excel dể thực hiện các công việc sau Nhập số gam tinh bột (Gluxit)) lần lượt là giá trị trung bình và độ lệch chuẩn của dãy dữ liệu Gluxit (tương tự cho cột Protein).

Kéo công thức xuống dưới để áp dụng cho tất cả các giá trị trong cột Gluxit và Protein.

Nếu giá trị trả về gần với 0.5 (khoảng từ 0.4 đến 0.6), dãy dữ liệu có thể được coi là phân phối chuẩn.

3) Kiểm định giá trị trung bình

Sử dụng phép kiểm định t dựa trên hàm T.TEST() trong Excel.

Chọn một ô trống để hiển thị kết quả kiểm định giá trị trung bình.

Sử dụng công thức sau: =T.TEST(A2:A100, B2:B100, 2, 2)

Trong đó:

A2:A100 và B2:B100 là dãy dữ liệu Gluxit và Protein.

2 đại diện cho loại kiểm định (2-tailed).

2 đại diện cho loại phân phối (2-sample equal variance).

Giá trị trả về sẽ là p-value. Nếu p-value nhỏ hơn một ngưỡng nhất định (ví dụ: 0.05), ta có thể kết luận rằng giá trị trung bình của hai dãy số liệu có sự khác biệt đáng kể.

4) Phân tích ảnh hưởng

Sử dụng hàm CORREL() để tính toán hệ số tương quan giữa Gluxit, Protein và Gluco.

Sử dụng công thức sau:

=CORREL(A2:A100, C2:C100) Và =CORREL(B2:B100, C2:C100) để tính toán hệ số tương quan giữa Gluxit và Gluco, và giữa Protein và Gluco.

So sánh giá trị tương quan của Gluxit với Gluco và Protein với Gluco để xác định chất nào ảnh hưởng nhiều hơn đến chỉ số đường huyết.

Câu hỏi tự kiểm tra trang 90 Chuyên đề Tin học 12: Trong các câu sau về kiểm định giá thuyết thống kê, những câu nào đúng?

a) Độ tin cây của một phép kiểm dịnh giá thuyết thống kê lên đến 99% nếu xác suất mắc sai lầm là 1%.

b) Trong kiểm định F, nếu F Critical one-tail < F < 1 thi bác bỏ giả thuyết H

c) Trong kiểm dịnh t - Test, nếu t Stat nằm trong khoảng (-t Critical two-tail, t Critical two-tail) thì chấp nhận H.

d) Phân tích tương quan tuyển tính giúp kiểm tra dược hai biến ngẩu nhiên có mỗi quan hệ phụ thuộc lẫn nhau hay không.

Lời giải:

a) Sai. Độ tin cậy của một phép kiểm định thống kê 99% nghĩa là xác suất mắc sai lầm (alpha) là 1% (0.01), không phải là 1%.

b) Sai. Trong kiểm định F, nếu giá trị F nằm trong khoảng giữa F Critical one-tail và 1 thì không thể kết luận được gì về việc bác bỏ giả thuyết H. Cần so sánh giá trị F với giá trị F Critical two-tail để kết luận.

c) Sai. Trong kiểm định t-Test, nếu giá trị t Stat nằm trong khoảng (-t Critical two-tail, t Critical two-tail) thì không thể kết luận được gì về việc chấp nhận hoặc bác bỏ giả thuyết H. Cần so sánh giá trị t Stat với giá trị t Critical two-tail để kết luận.

d) Đúng. Phân tích tương quan tuyến tính được sử dụng để kiểm tra mối quan hệ tuyến tính giữa hai biến ngẫu nhiên.

1 83 13/08/2024


Xem thêm các chương trình khác: