1. Ý nghĩa phương sai và độ lệch chuẩn trong mẫu số liệu ghép nhóm
- Phương sai (độ lệch chuẩn) của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho phương sai (độ lệch chuẩn) của mẫu số liệu gốc. Chúng được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm xung quanh số trung bình của mẫu số liệu. Phương sai và độ lệch chuẩn càng lớn thì dữ liệu càng phân tán.
- Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu.
- Chú ý: Với các mẫu số liệu ghép nhóm có cùng số trung bình (hoặc xấp xỉ nhau), ta thường sử dụng phương sai và độ lệch chuẩn để so sánh mức độ phân tán của các mẫu số liệu đó.
2. Công thức tính phương sai và độ lệch chuẩn
Xét mẫu số liệu ghép nhóm cho bởi bảng sau:
Nhóm [u1;u2) [u2;u3) ... [uk;uk+1) Giá trị đại diện c1 c2 ... ck Tần số n1 n2 ... nk- Phương sai của mẫu số liệu ghép nhóm, kí hiệu là s2, được tính bởi công thức:
$large s^{2}=frac{1}{n}[n_{1}(c_{1}-overline{x})^{2}+n_{2}(c_{2}-overline{x})^{2}+...+n_{k}(c_{k}-overline{x})^{2}]$
Trong đó: n = n1 + n2 + ... + nk là cỡ mẫu;
$large overline{x}=frac{1}{n}(n_{1}c_{1}+n_{2}c_{2}+...+n_{k}c_{k})$ là số trung bình.
- Độ lệch chuẩn của mẫu số liệu ghép nhóm, kí hiệu là s, là căn bậc hai số học của phương sai, nghĩa là: $large s=sqrt{s^{2}}$
- Chú ý:
+ Phương sai của mẫu số liệu ghép nhóm có thể được tính theo công thức sau:
$large s^{2}=frac{1}{n}(n_{1}c_{1}^{2}+n_{2}c_{2}^{2}+...+n_{k}c_{k}^{2})-overline{x}^{2}$
+ Trong thống kê, người ta còn dùng đại lượng sau để đo mức độ phân tán của mẫu số liệu thống kê:
$large widehat{s}^{2}=frac{1}{n-1}[n_{1}(c_{1}-overline{x})^{2}+n_{2}(c_{2}-overline{x})^{2}+...+n_{k}(c_{k}-overline{x})^{2}]$
3. Bài tập về phương sai và độ lệch chuẩn toán 12
3.1 Bài tập về phương sai và độ lệch chuẩn toán 12 kết nối tri thức
Bài 3.4 trang 84 sgk toán 12/1 kết nối tri thức
a) Chọn giá trị đại diện cho mẫu số liệu ta có:
Nhóm số liệu
[48,5; 49)
[49; 49,5)
[49,5; 50)
[50; 50,5)
[50,5; 51)
[51; 51,5)
Số bao xi măng
6 2 4 4 6 8b)
Mẫu số liệu gốc
Giá trị trung bình là:
$large overline{x}=(49,5+48,9+51,4+51,1+49,3+48,7+50,8+50,7+51,2+50,2+48,8+50,6+48,7+49,8+50,9+49,6+48,8+49,2+51,3+51,2+50,7+51,4+50,4+51,1+50,1+50,0+48,6+50,5+51,2+49,6).frac{1}{30}$
$large overline{x}=frac{15043}{300}$
Ta có bảng phương sai sau:
Tổng bình phương độ lệch là: $large frac{78461}{3000}$
Khi đó phương sai: $large s^{2}=frac{78461}{3000}.frac{1}{30}=frac{78461}{90000}$
Độ lệch chuẩn là: $large s=sqrt{frac{784461}{90000}}approx 0,934$
Mẫu số liệu ghép nhóm
Chọn giá trị đại diện cho mẫu số liệu ta có:
Nhóm số liệu
[48,5; 49)
[49; 49,5)
[49,5; 50)
[50; 50,5)
[50,5; 51)
[51; 51,5)
Giá trị đại diện
48,75
49,25
49,75
50,25
50,75
51,25
Số bao xi măng
6 2 4 4 6 8Giá trị trung bình là:
$large overline{x}=frac{48,75.6+49,25.2+49,75.4+50,25.4+50,75.6+51,25.8}{30}=frac{3011}{30}$
Phương sai:
$large s^{2}=frac{48,75^{2}.6+49,25^{2}.2+49,75^{2}.4+50,25^{2}.4+50,75^{2}.6+51,25.8}{30}-left ( frac{3011}{60} right )^{2}=frac{194}{225}$
Độ lệch chuẩn: $large s=sqrt{frac{194}{225}}approx 0,929$
Giá trị mẫu số liệu gốc là chính xác, giá trị mẫu số liệu ghép nhóm là xấp xỉ.
Bài 3.5 trang 84 sgk toán 12/1 kết nối tri thức
Chọn giá trị đại diện cho mẫu số liệu ta có:
Tuổi thọ (năm)
[1,5; 2)
[2; 2,5)
[2,5; 3)
[3; 3,5)
[3,5; 4)
Giá trị đại diện
1,75
2,25
2,75 3,253,75
Số linh kiện của phân xưởng 1
4 9 13 8 6Số linh kiện của phân xưởng 2
2 8 20 7 3Tuổi thọ trung bình của các linh kiện của phân xưởng 1 là:
$large overline{x_{1}}=frac{4.1,75+9.2,25+13.2,75+8.3,25+6.3,75}{4+9+13+8+6}=2,7875$
Tuổi thọ trung bình của các linh kiện của phân xưởng 2 là:
$large overline{x_{2}}=frac{2.1,75+8.2,25+20.2,75+7.3,25+3.3,75}{2+8+20+7+3}=2,7625$
Phương sai và độ lệch chuẩn của các linh kiện của phân xưởng 1 là:
$large s_{1}^{2}=frac{4.1,75^{2}+9.2,25^{2}+13.2,75^{2}+8.3,25^{2}+6.3,75^{2}}{4+9+13+8+6}-(2,7875)^{2}approx 0,355$
Phương sai và độ lệch chuẩn của các linh kiện của phân xưởng 2 là:
$large s_{2}^{2}=frac{2.1,75^{2}+8.2,25^{2}+20.2,75^{2}+7.3,25^{2}+3.3,75^{2}}{2+8+20+7+3}-(2,7625)^{2}approx 0,219$
$large Rightarrow s_{2}=sqrt{0,219}approx 0,47$
Đối với mẫu số liệu này thì phương sai và độ lệch chuẩn nhỏ nên độ phân tán của số liệu thấp. Do đó các giá trị của mẫu số liệu tập trung quanh giá trị trung bình.
Bài 3.6 trang 84 sgk toán 12/1 kết nối tri thức
Chọn giá trị đại diện cho mẫu số liệu ta có:
Kết quả đo (μm)
[4,5; 5)
[5; 5,5)
[5,5; 6)
[6; 6,5)
Giá trị đại diện
4,75
5,25
5,75
6,25
Số học sinh
3 8 7 2a) $large overline{x}=frac{4,75.3+5,25.8+5,75.7+6,25.2}{20}=5,45$
$large s^{2}=frac{4,75^{2}.3+5,25^{2}.8+5,75^{2}.7+6,25^{2}.2}{20}-5,45^{2}=0,185$
$large s=sqrt{0,185}approx 0,43$
b) Dữ liệu cho thấy đường kính của các nhân tế bào có mức độ biến động nhỏ và gần giá trị trung bình. Điều này có thể thấy được mức độ đồng đều trong kích thước của các nhân tế bào hoặc quy trình đo lường được thực hiện một cách chính xác.
Bài 3.7 trang 84 sgk toán 12/1 kết nối tri thức
Chọn giá trị đại diện cho mẫu số liệu ta có:
Thời gian (giây)
[10; 10,3)
[10,3; 10,6)
[10,6; 10,9)
[10,9; 11,2)
Giá trị đại diện
10,15
10,45
10,75
11,05
Số lần chạy của A
2 10 5 3Số lần chạy của B
3 7 9 6Thời gian chạy trung bình của A là:
$large overline{x}_{A}=frac{10,15.2+10,45.10+10,75.5+11,05.3}{20}=10,585$
Thời gian chạy trung bình của B là:
$large overline{x}_{B}=frac{10,15.3+10,45.7+10,75.9+11,05.6}{25}=10,666$
Phương sai và độ lệch chuẩn của A là:
$large s_{A}^{2}=frac{10,15^{2}.2+10,45^{2}.10+10,75^{2}.5+11,05^{2}.3}{20}-10,585^{2}approx 0,067$
$large Rightarrow s_{A}=sqrt{0,067}approx 0,26$
Phương sai và độ lệch chuẩn của B là
$large s_{B}^{2}=frac{10,15^{2}.3+10,45^{2}.7+10,75^{2}.9+11,05^{2}.6}{20}-10,666^{2}approx 0,083$
$large Rightarrow s_{B}=sqrt{0,083}approx 0,29$
Vận động viên A có độ lệch chuẩn nhỏ hơn so với vận động viên B. Điều này cho thấy thời gian chạy tập luyện của vận động viên A ít biến động hơn so với vận động viên B. Do đó vận động viên A có thành tích luyện tập ổn định hơn so với vận động viên B.
Bài 3.8 trang 84 sgk toán 12/1 kết nối tri thức
a) Có thể sử dụng vì chất lượng hai trường là tương đương.
b) Không thể sử dụng vì có thể không phản ánh đúng bản chất của dữ liệu do doanh thu thường không đồng đều và có nhiều yếu tố ảnh hưởng đến doanh thu của từng siêu thị.
Đăng ký ngay để được các thầy cô ôn tập kiến thức và xây dựng lộ trình ôn thi THPT Quốc gia sớm và phù hợp nhất với bản thân
3.2 Bài tập về phương sai và độ lệch chuẩn toán 12 chân trời sáng tạo
Bài 1 trang 82 sgk toán 12/1 Chân trời sáng tạo
Ta có bảng sau:
Cự li (m)
[19; 19,5)
[19,5; 20)
[20; 20,5)
[20,5; 21)
[21; 21,5)
Giá trị đại diện
19,25
19,75
20,25
20,75
21,25
Tần số
13 45 24 12 6Cỡ mẫu là n = 13 + 45 + 24 + 12 + 6 = 100.
Số trung bình của mẫu số liệu ghép nhóm là:
$large overline{x}=frac{13.19,25+45.19,75+24.20,25+12.20,75+6.21,25}{100}=20,015$
Phương sai của mẫu số liệu ghép nhóm là:
$large s^{2}=frac{13.19,25^{2}+45.19,75^{2}+24.20,25^{2}+12.20,75^{2}+6.21,25^{2}}{100}-20,015^{2}approx 0,277$
Độ lệch chuẩn của mẫu số liệu ghép nhóm là: $large s=sqrt{s^{2}}=sqrt{0,277}approx 0,526$
Bài 2 trang 82 sgk toán 12/1 Chân trời sáng tạo
a) Từ biểu đồ ta thấy có 2 máy vi tính có thời gian sử dụng pin từ 7,2 đến dưới 7,4 giờ.
b) Từ biểu đồ, ta có bảng thống kê sau:
Thời gian (giờ)
[7,2; 7,4)[7,4; 7,6)
[7,6; 7,8)
[7,8; 8,0)
Giá trị đại diện
7,37,5
7,7
7,9
Số máy vi tính 2 4 7 5Cỡ mẫu là n = 2 + 4 + 7 + 5 = 18.
Số trung bình của mẫu số liệu ghép nhóm là:
$large overline{x}=frac{2.7,3+4.7,5+7.7,7+5.7,9}{18}approx 7,667$
Phương sai của mẫu số liệu ghép nhóm là:
$large s^{2}=frac{2.7,3^{2}+4.7,5^{2}+7.7,7^{2}+5.7,9^{2}}{18}- 7,667^{2}approx 0,032$
Độ lệch chuẩn của mẫu số liệu ghép nhóm là: $large s=sqrt{s^{2}}=sqrt{0,032}approx 0,179$
Bài 3 trang 82 sgk toán 12/1 Chân trời sáng tạo
a) Mẫu số liệu đã cho đã được xếp theo thứ tự không giảm.
Khoảng biến thiên của mẫu số liệu là:
R = 61,1 - 42 = 19,1 (km/h).
Cỡ mẫu n = 20.
Tứ phân vị thứ nhất là trung vị của mẫu số liệu:
42 43,4 43,4 46,5 46,7 46,8 47,5 47,7 48,1 48,4
Do đó: $large Q_{1}=frac{46,7+46,8}{2}=46,75$
Tứ phân vị thứ ba là trung vị của mẫu số liệu:
50,8 52,1 52,7 53,9 54,8 55,6 57,5 59,6 60,3 61,1
Do đó: $large Q_{3}=frac{54,8+55,6}{2}=55,2$
Khoảng tứ phân vị của mẫu số liệu là:
∆Q = Q3 - Q1 = 55,2 - 46,75 = 8,45.
Số trung bình của mẫu số liệu là:
$large overline{x}=frac{42+43,4+43,4+46,5+...+60,3+61,1}{20}=50,945$
Phương sai của mẫu số liệu là:
$large s^{2}=frac{42^{2}+43,4^{2}+43,4^{2}+46,5^{2}+...+60,3^{2}+61,1^{2}}{20}-50,945^{2}approx 32,2$ Độ lệch chuẩn của mẫu số liệu là: $large s=sqrt{s^{2}}=sqrt{32,2}approx 5,675$
b) Ta lập được bảng tần số ghép nhóm như sau:
Tốc độ (km/h)
[42; 46)
[46; 50)
[50; 54)
[54; 58)
[58; 62)
Số xe
3 7 4 3 3c) Khoảng biến thiên của mẫu số liệu ghép nhóm là:
R' =62 - 42 = 20 (km/h).
Gọi x1; x2; …; x20 là mẫu số liệu gốc về tốc độ của 20 xe hơi đi qua một trạm kiểm tra tốc độ được xếp theo thứ tự không giảm.
Ta có x1; x2; x3 ∈ [42; 46), x4; …; x10 ∈ [46; 50), x11; …; x14 ∈ [50; 54), x15; …; x17 ∈ [54; 58), x18; x19; x20 ∈ [58; 62).
Tứ phân vị thứ nhất của mẫu số liệu gốc là: $large frac{1}{2}(x_{5}+x_{6})in [46;50)$
Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là:
$large Q'_{1}=54+frac{frac{3.20}{4}-(3+7+4)}{3}.(58-54)=frac{166}{3}$
Khoảng tứ phân vị của mẫu số liệu ghép nhóm là:
$large Delta '_{Q}=Q'_{3}-Q'_{1}=frac{166}{3}-frac{330}{7}=frac{172}{21}approx 8,19$
Từ bảng tần số ghép nhóm, ta có bảng sau:
Tốc độ (km/h)
[42; 46)
[46; 50)
[50; 54)
[54; 58)
[58; 62)
Giá trị đại diện
44 48 52 56 60Số xe
3 7 4 3 3Số trung bình của mẫu số liệu ghép nhóm là:
$large overline{x}'=frac{3.44+7.48+4.52+3.56+3.60}{20}=51,2$
Phương sai của mẫu số liệu ghép nhóm là:
$large s'^{2}=frac{3.44^{2}+7.48^{2}+4.52^{2}+3.56^{2}+3.60^{2}}{20}-51,2^{2}=26,56$
Độ lệch chuẩn của mẫu số liệu là: $large s'=sqrt{s'^{2}}=sqrt{26,56}approx 5,154$
Bài 4 trang 82 sgk toán 12/1 Chân trời sáng tạo
a) Ta có bảng sau:
Đường kính (cm)
[30; 32)
[32; 34)
[34; 36)
[36; 38)
[38; 40)
Giá trị đại diện
31 33 35 37 39Số cây trồng ở địa điểm A
25 38 20 10 7Số cây trồng ở địa điểm B
22 27 19 18 14Cỡ mẫu: nA = 25 + 38 + 20 + 10 + 7 = 100; nB = 22 + 27 + 19 + 18 + 14 = 100.
Đường kính trung bình của thân cây xoan đào trồng tại địa điểm A là:
$large overline{x}_{A}=frac{25.31+38.33+20.35+10.37+7.39}{100}=33,72$
Đường kính trung bình của thân cây xoan đào trồng tại địa điểm B là:
$large overline{x}_{B}=frac{22.31+27.33+19.35+18.37+14.39}{100}=34,5$
Vì $large overline{x}_{A}< overline{x}_{B}$ nên đường kính trung bình của thân cây xoan đào trồng tại địa điểm A nhỏ hơn tại địa điểm B.
b) Phương sai của mẫu số liệu ghép nhóm về đường kính của thân cây xoan đào trồng tại địa điểm A là:
$large s_{A}^{2}=frac{25.31^{2}+38.33^{2}+20.35^{2}+10.37^{2}+7.39^{2}-33,72^{2}}{100}approx 5,402$
Độ lệch chuẩn mẫu số liệu ghép nhóm về đường kính của thân cây xoan đào trồng tại địa điểm A là:
$large s_{A}=sqrt{s_{A}^{2}}=sqrt{5,402}approx 2,324$
Phương sai của mẫu số liệu ghép nhóm về đường kính của thân cây xoan đào trồng tại địa điểm B là:
$large s_{B}^{2}=frac{22.31^{2}+27.33^{2}+19.35^{2}+18.37^{2}+14.39^{2}-34,5^{2}}{100}approx 7,31$
Độ lệch chuẩn mẫu số liệu ghép nhóm về đường kính của thân cây xoan đào trồng tại địa điểm A là:
$large s_{B}=sqrt{s_{B}^{2}}=sqrt{7,31}approx 2,704$
Vì SA ≈ 2,324 < SB ≈ 2,704 nên nếu so sánh theo độ lệch chuẩn thì cây trồng tại địa điểm A có đường kính đồng đều hơn.
Đăng ký ngay combo sổ tay kiến thức các môn học để nhận ưu đãi cực hấp dẫn từ vuihoc nhé!
3.3 Bài tập về phương sai và độ lệch chuẩn toán 12 cánh diều
Bài 1 trang 92 sgk toán 12/1 Cánh diều
a) Đáp án đúng là: B
Số trung bình cộng của mẫu số liệu ghép nhóm được cho bởi Bảng 18 là:$large overline{x}=frac{4.42,5+14.47,5+8.52,5+10.57,5+6.62,5+2.67,5}{44}approx 53,2$
Vậy phương sai của của mẫu số liệu ghép nhóm được cho bởi Bảng 18 là:
$large s^{2}=frac{[4.(42,5-53,2)^{2}+14.(47,5-53,2)^{2}+8.(52,5-53,2)^{2}+10.(57,5-53,2)^{2}+6.(62,5-53,2)^{2}+2.(67,5-53,2)^{2}]}{44}=frac{2029,56}{44}approx 46,1$
b) Đáp án đúng là: A
Độ lệch chuẩn của mẫu số liệu ghép nhóm trên là: $large s=sqrt{46,1}approx 6,8$ (chục nghìn đồng).
Bài 2 trang 92 sgk toán 12/1 Cánh diều
a) Số trung bình cộng của mẫu số liệu ghép nhóm biểu diễn mức lương của công ty A được cho bởi Bảng 19 là:
$large overline{x}_{A}=frac{15.12,5+18.17,5+10.22,5+10.27,5+5.32,5+2.37,5}{60}=frac{1240}{60}approx 20,67$ (triệu đồng)
Vậy phương sai của của mẫu số liệu ghép nhóm biểu diễn mức lương của công ty A được cho bởi Bảng 19 là:
$large s_{A}^{2}=frac{15.(12,5-20,67)^{2}+18.(17,5-20,67)^{2}+10.(22,5 -20,67)^{2}+10.(27,5-20,67)^{2}+5.(32,5-20,67)^{2}+2.(37,5-20,67)^{2}}{60}$ $large =frac{2948,334}{60}approx 49,14$
Độ lệch chuẩn của mẫu số liệu ghép nhóm trên là: $large s_{A}=sqrt{49,14}approx 7,01$ (triệu đồng).
- Số trung bình cộng của mẫu số liệu ghép nhóm biểu diễn mức lương của công ty B được cho bởi Bảng 20 là:
$large overline{x}_{B}=frac{25.12,5+15.17,5+7.22,5+5.27,5+5.32,5+3.37,5}{60}=frac{1047,5}{60}approx 17,46$ (triệu đồng)
Vậy phương sai của của mẫu số liệu ghép nhóm biểu diễn mức lương của công ty B được cho bởi Bảng 20 là:
$large s_{B}^{2}=frac{25.(12,5-20,67)^{2}+15.(17,5-20,67)^{2}+7.(22,5 -20,67)^{2}+5.(27,5-20,67)^{2}+5.(32,5-20,67)^{2}+3.(37,5-20,67)^{2}}{60}$ $large =frac{3632,696}{60}approx 60,54$
Độ lệch chuẩn của mẫu số liệu ghép nhóm trên là: $large s_{B}=sqrt{60,54}approx 7,78$ (triệu đồng).
b) Do sA ≈ 7,01 < sB ≈ 7,78 nên công ty A có mức lương đồng đều hơn công ty B.
Bài 3 trang 92 sgk toán 12/1 Cánh diều
Số trung bình cộng của mẫu số liệu ghép nhóm được cho bởi Bảng 21 là:
$large overline{x}=frac{25.25+20.35+20.45+15.55+14.65+6.75}{100}=frac{4410}{100}approx 44$
Vậy phương sai của của mẫu số liệu ghép nhóm được cho bởi Bảng 21 là:
$large s^{2}=frac{25.(25-44)^{2}+20.(35-44)^{2}+20.(45-44)^{2}+15.(55 -44)^{2}+14.(65-44)^{2}+6.(75-44)^{2}}{100}$ $large =frac{24420}{100}=244,2$
Độ lệch chuẩn của mẫu số liệu ghép nhóm trên là: $large s=sqrt{244,2}approx 16,5$
Trên đây là toàn bộ bài học Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm chương trình toán 12. Hi vọng bài viết này sẽ giúp cho các bạn học sinh nắm vững cách tính phương sai và độ lệch chuẩn để giải quyết các dạng bài tập liên quan. Các bạn hãy truy cập nền tảng Vuihoc.vn để ôn tập kiến thức Toán 12 và đăng ký những khóa học bổ ích, hấp dẫn nhất nhé!
>> Mời bạn tham khảo thêm:
- Lý thuyết tọa độ của vectơ trong không gian toán 12
- Lý thuyết và bài tập về biểu thức tọa độ của vectơ toán 12
- Khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm