Ở bài trước, ta đã xét một số quy luật phân phối xác suất thông dụng nhất của biến ngẫu nhiên rời rạc. Sau đây, ta sẽ xét một số quy luật phân phối xác suất cơ bản của các biến ngẫu nhiên liên tục, vì nhiều đại lượng cần nghiên cứu trong thực tế là các biến ngẫu nhiên liên tục. Do đó, việc hiểu biết các quy luật phân phối xác suất của chúng cho phép tiến hành phân tích một cách sâu sắc, cụ thể và chính xác hơn các hiện tượng này.
QUY LUẬT PHÂN PHỐI XÁC SUẤT THÔNG DỤNG
CỦA BIẾN NGẪU NHIÊN LIÊN TỤC
I. Quy luật phân phối đều – :
Phân phối đều là quy luật phân phối xác suất đơn giản nhất trong các quy luật phân phối xác suất của biến ngẫu nhiên liên tục. Nếu biến ngẫu nhiên X có thể nhận bất kỳ giá trị nào trên khoảng với a và b là các số thực và ứng với mỗi giá trị là một mật độ xác suất như nhau thì biến X sẽ có phân phối đều. Như vậy, trong khoảng
, hàm mật độ xác suất của biến ngẫu nhiên phải bằng một giá trị xác định, tức là
với
. Từ đó, theo tính chất của hàm mật độ xác suất, ta có:
. Từ đó:
, suy ra:
. Ta có định nghĩa dưới đây.
1. Định nghĩa:
Biến ngẫu nhiên liên tục X gọi là phân phối theo quy luật đều trong khoảng nếu hàm mật độ xác suất của nó có dạng:
Đồ thị hàm có dạng như sau:
[đồ thị – trang 141 – GT LTXS&TKT]
2. Các tham số đặc trưng của quy luật phân phối đều:
– Kỳ vọng toán:
– Phương sai:
– Độ lệch chuẩn:
Quy luật phân phối đều có ứng dụng rộng trong thống kê toán. Nó có ý nghĩa to lớn trong các phương pháp phi tham số. Khái niệm phân phối đều đôi khi còn được sử dụng trong lý thuyết các ước lượng thống kê. Trong một số lý thuyết kết luận thống kê, người ta thường xuất phát từ quy tắc sau đây: Nếu ta không biết gì về giá trị của tham số cần ước lượng thì mỗi giá trị có thể có của tham số đó là đồng khả năng. Điều đó dẫn đến việc quan niệm tham số cần ước lượng như một biến ngẫu nhiên tuân theo quy luật phân phối đều.
II. Quy luật phân phối lũy thừa – :
1. Định nghĩa:
Biến ngẫu nhiên liên tục X gọi là phân phối theo quy luật lũy thừa (quy luật mũ) nếu hàm mật độ xác suất của nó có dạng:
Trong đó là một hằng số dương. Đồ thị của hàm
có dạng như sau:
[đồ thị – trang 144 – GT LTXK&TKT]
Hàm phân bố xác suất của quy luật phân phối lũy thừa tương ứng với hàm mật độ xác suất trên là:
2. Các tham số đặc trưng của quy luật phân phối lũy thừa:
– Kỳ vọng toán:
– Phương sai:
– Độ lệch chuẩn:
Như vậy, trong quy luật lũy thừa, kỳ vọng toán và độ lệch chuẩn đều bằng . Đây chính là tính chất đặc biệt của quy luật lũy thừa. Nó có thể được sử dụng để kiểm tra xem một biến ngẫu nhiên mà ta nghiên cứu trong thực tế có phân phối theo quy luật lũy thừa hay không.
Xác suất để biến ngẫu nhiên X phân phối theo quy luật lũy thừa nhận giá trị trong khoảng là:
Quy luật phân phối lũy thừa có ứng dụng trong nhiều lĩnh vực khác nhau. Người ta chứng minh được rằng: thời gian giữa hai lần xuất hiện yêu cầu của một dòng yêu cầu tối giản trong các hệ thống phục vụ công cộng phân phối theo quy luật lũy thừa. Trong các hệ thống kỹ thuật, thời gian làm việc liên tục của máy móc thiết bị giữa hai lần sửa chữa cũng thường phân phối theo quy luật lũy thừa. Khi áp dụng quy luật lũy thừa để giải quyết các bài toán nảy sinh trong thực tế, ngoài ưu điểm là đơn giản (nó chỉ phụ thuộc vào 1 tham số là ) nó còn có một tính chất rất quan trọng sau đây: Xác suất hoạt động liên tục của thiết bị trong khoảng thời gian t không phụ thuộc vào quãng thời gian hoạt động trước đó mà chỉ phụ thuộc vào độ dài của khoảng thời gian t mà thôi. Người ta chứng minh được rằng chỉ có quy luật phân phối lũy thừa mới có tính chất này. Đó cũng là tiêu chuẩn để nhận biết quy luật này trong thực tế.
III. Quy luật phân phối chuẩn –
1. Định nghĩa:
Biến ngẫu nhiên liên tục X nhận các giá trị trong khoảng gọi là phân phối theo quy luật chuẩn với các tham số
và
, nếu hàm mật độ xác suất của nó có dạng:
Nếu tiến hành khảo sát hàm số trên và vẽ đồ thị của nó ta sẽ thu được các kết luận sau đây:
a. Hàm số xác định trên toàn trục Ox.
b. Với mọi giá trị của x, hàm số luôn luôn dương, như vậy, đồ thị của nó luôn nằm cao hơn trục Ox.
c. Khi thì
, tức trục Ox là đường tiệm cận ngang.
d. Ta tìm đạo hàm bậc nhất: .
Dễ dàng thấy rằng: khi
,
khi
,
khi
. Như vậy, khi
, hàm số có cực đại bằng
.
e. Hiệu trong biểu thức của hàm
nằm trong dạng bình phương, tức là hàm số đối xứng qua đường thẳng
.
g. Ta tìm đạo hàm bậc hai: .
Dễ dàng thấy rằng: khi và
, đạo hàm bậc hai bằng 0 và đi qua hai điểm đó nó đổi dấu. Tại cả hai điểm đó, hàm số đều bằng
. Như vậy, hàm
có các điểm uốn là:
và
Đồ thị hàm và đồ thị sự thay đổi của
theo
:
[2 đồ thị – trang 151 – GT LTXS&TKT]
Hai tham số và
có ý nghĩa quan trọng trong phân phối chuẩn. Khi
và
thay đổi, dạng đồ thị của hàm mật độ xác suất
cũng thay đổi như sau: Khi
thay đổi thì dạng của đường cong
không thay đổi, song nó sẽ chuyển dịch sang phải hoặc sang trái theo trục Ox. Khi
tăng lên thì đồ thị sẽ dịch sang phải, còn khi
giảm thì đồ thị sẽ dịch sang trái. Trái lại, khi
thay đổi, dạng của đồ thị sẽ thay đổi theo. Nếu
tăng lên thì đồ thị sẽ thấp xuống và phình ra, còn khi
giảm thì đồ thị sẽ cao lên và nhọn thêm.
Hàm phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật chuẩn:
2. Các tham số đặc trưng của quy luật chuẩn:
– Kỳ vọng toán:
– Phương sai:
– Độ lệch chuẩn:
Phân phối chuẩn được ký hiệu là . Có liên quan mật thiết với phân phối chuẩn là quy luật phân phối chuẩn hóa. Giả sử biến ngẫu nhiên X phân phối chuẩn với kỳ vọng toán
và độ lệch chuẩn
. Xét biến ngẫu nhiên:
. Trong thống kê, việc biến đổi này thường gọi là phép chuẩn hóa biến ngẫu nhiên X. Phần tiếp theo sẽ đề cập đến quy luật phân phối chuẩn hóa
của biến ngẫu nhiên U.
IV. Quy luật phân phối chuẩn hóa –
1. Định nghĩa:
Biến ngẫu nhiên U nhận các giá trị trong khoảng gọi là tuân theo quy luật phân phối chuẩn hóa nếu hàm mật độ xác suất của nó có dạng:
Đồ thị của hàm có dạng như dưới đây:
[đồ thị – trang 154 – GTLTXS&TKT]
Đặc điểm của đồ thị này là nó lấy trục tung làm trục đối xứng. Hàm phân bố xác suất của biến ngẫu nhiên U phân phối theo quy luật chuẩn hóa có dạng:
2. Các tham số đặc trưng của quy luật chuẩn hóa:
– Kỳ vọng toán:
– Phương sai:
– Độ lệch chuẩn:
Phân phối chuẩn hóa được ký hiệu là . Ngoài các tham số đặc trưng là kỳ vọng toán và phương sai, trong phân phối chuẩn hóa còn có một tham số khác với nhiều ứng dụng thực tế là giá trị tới hạn chuẩn.
3. Giá trị tới hạn chuẩn:
Giá trị tới hạn chuẩn mức , ký hiệu là
, là giá trị của biến ngẫu nhiên U có phân phối chuẩn hóa, thỏa mãn điều kiện:
.
Vì U chuẩn hóa nên hàm mật độ của U là: .
Theo tính chất hàm mật độ thì: .
Do đó: . Cho trước
, dựa vào biểu thức này có thể tính được
và ngược lại. Trên đồ thị, giá trị tới hạn chuẩn
là giá trị sao cho diện tích phần giới hạn bởi đường cong phân phối chuẩn hóa, trục OU và đường thẳng
bằng
.
[đồ thị – trang 156 – GTLTXS&TKT]
Giá trị tới hạn chuẩn có tính chất sau đây: .
Sau đây là một số công thức có nhiều ứng dụng trong việc giải các bài toán thực tế.
1) Công thức xác suất để biến ngẫu nhiên X phân phối chuẩn nhận giá trị trong khoảng :
Trong đó: , và Z ở đây là biến mới được chuẩn hóa từ biến ngẫu nhiên X:
.
Hàm có các tính chất sau:
+
+ Với mọi thì
.
Các tính chất trên được vận dụng khi tra bảng giá trị hàm .
2) Xác suất của sự sai lệch giữa biến ngẫu nhiên và kỳ vọng toán của nó:
Trong thực tế, nhiều khi ta phải tính xác suất để biến ngẫu nhiên X phân phối chuẩn nhận giá trị sai lệch so với kỳ vọng toán của nó về giá trị tuyệt đối nhỏ hơn một số dương cho trước, tức là ta phải tìm xác suất để xảy ra bất đẳng thức: .
Ngoài ra, ta có mối liên hệ giữa hàm của phân phối chuẩn hóa và hàm
trong các công thức trên là:
.
4. Quy tắc hai xích ma và ba xích ma:
– Quy tắc hai xích ma: .
Theo quy tắc hai xích ma, xác suất để biến ngẫu nhiên phân phối chuẩn nhận giá trị trong khoảng là 0.9544 hay: 95.44% các giá trị của X sẽ nằm trong khoảng nói trên.
– Quy tắc ba xích ma: .
Theo quy tắc ba xích ma, xác suất để biến ngẫu nhiên phân phối chuẩn nhận giá trị trong khoảng là 0.9973 hay: 99.73% các giá trị của X sẽ nằm trong khoảng nói trên.
Trong thực tế, hai quy tắc trên được áp dụng như sau: Nếu quy luật phân phối xác suất của biến ngẫu nhiên được nghiên cứu chưa biết, song nó thỏa mãn điều kiện của quy tắc hai xích ma hoặc ba xích ma thì có thể xem như biến ngẫu nhiên đó phân phối chuẩn.
[đồ thị – trang 162 – GTLTXS&TKT]
5. Phân phối xác suất của tổng các biến ngẫu nhiên độc lập tuân theo cùng một quy luật:
Giả sử và
là hai biến ngẫu nhiên độc lập,
tuân theo quy luật chuẩn với kỳ vọng toán
và phương sai
, còn
tuân theo quy luật chuẩn với kỳ vọng toán
và phương sai
. Lúc đó, tổng của chúng là biến ngẫu nhiên
cũng phân phối theo quy luật chuẩn với kỳ vọng
và phương sai
. Tính chất này cũng có thể mở rộng cho một số bất kỳ các biến ngẫu nhiên độc lập lẫn nhau và cúng phân phối chuẩn.
Mở rộng: Nếu là n biến ngẫu nhiên độc lập lẫn nhau và cũng tuân theo một quy luật phân phối xác suất nào đó (không nhất thiết là quy luật chuẩn) với các kỳ vọng toán
và các phương sai
đã biết, thì biến ngẫu nhiên
sẽ phân phối xấp xỉ chuẩn với
và
khi n khá lớn (
). Tính chất này thường được gọi là định lý giới hạn trung tâm của Liapunốp [sẽ được đề cập đến trong các bài sau].
6. Sự hội tụ của quy luật nhị thức và quy luật Poisson về quy luật chuẩn:
Khi sử dụng quy luật nhị thức, nếu n khá lớn thì việc tính toán theo công thức Bernoulli sẽ gặp khó khăn. Lúc đó, nếu p nhỏ đến mức thì có thể dùng quy luật Poisson thay thế cho quy luật nhị thức. Song nếu p lại không nhỏ (
) thì không thể dùng quy luật Poisson để thay thế được. Lúc đó, có thể dùng quy luật chuẩn để thay thế cho quy luật nhị thức. Trong thực tế, quy luật chuẩn có thể thay thế cho quy luật nhị thức nếu thỏa mãn đồng thời hai điều kiện là:
và
Lúc đó, biến ngẫu nhiên X phân phối theo quy luật nhị thức có thể coi như phân phối xấp xỉ chuẩn với kỳ vọng toán và phương sai
. Từ đó ta có:
+ Định lý địa phương Laplace:
+ Định lý tích phân Laplace:
Đối với quy luật Poisson, quá trình hội tụ về quy luật chuẩn sẽ diễn ra khi trở lên lớn hơn 20. Vì vậy, nếu X phân phối Poisson, song
thì có thể xem là X phân phối xấp xỉ chuẩn với kỳ vọng toán
và phương sai
.
7. Ứng dụng của quy luật chuẩn:
Quy luật chuẩn là quy luật phân phối xác suất được áp dụng rất rộng rãi trong thực tế. Trong nhiều lĩnh vực của khoa học và đời sống, ta đều gặp các biến ngẫu nhiên phân phối chuẩn. Lý do của sự phổ biến đó không những đã được giải thích trong định lý giới hạn trung tâm như đã xét ở trên mà còn từ hệ quả của định lý đó: Nếu biến ngẫu nhiên X là tổng của một số lớn các biến ngẫu nhiên độc lập và giá trị của mỗi biến chỉ chiếm vị trí nhỏ trong tổng đó thì X sẽ có phân phối xấp xỉ chuẩn. Trong thực tế, ta gặp chính các biến ngẫu nhiên như vậy. Chẳng hạn, trong công nghiệp, người ta đã xác định được rằng: kích thước của các chi tiết do các nhà máy sản xuất ra sẽ phân phối chuẩn nếu quá trình sản xuất diễn ra bình thường. Trong nông nghiệp, năng suất của cùng một loại cây trồng tại các thửa ruộng khác nhau cũng phân phối chuẩn. Năng suất lao động của các công nhân có cùng tay nghề và làm cùng một công việc như nhau cũng phân phối chuẩn. Nhu cầu về các loại hàng hóa khác nhau cũng phân phối chuẩn …vv. Người ta ghi nhận rằng: các năng lực về trí tuệ và thể lực của con người cũng phân phối theo quy luật chuẩn. Thậm chí cả một số chỉ tiêu về sinh lý của những người cùng giới (chẳng hạn: chiều cao, vòng ngực, chiều dài cánh tay …vv) cũng phân phối theo quy luật chuẩn. Sự nhận biết này cho phép lập kế hoạch sản xuất quần áo may sẵn sản xuất hàng loạt sao cho đáp ứng một cách hợp lý nhất kích cỡ của người mua, tránh tình trạng thừa, thiếu do không vừa kích cỡ …vv. Tóm lại, khó có thể liệt kê được hết các hiện tượng và lĩnh vực trong đó có thể áp dụng quy luật phân phối chuẩn.
IV. Quy luật khi bình phương –
1. Định nghĩa:
Biến ngẫu nhiên liên tục gọi là phân phối theo quy luật khi bình phương với n bậc tự do nếu hàm mật độ xác suất của nó được xác định bằng biểu thức sau:
Trong đó: là hàm Gamma. Nếu n là một số nguyên thì:
.
Đồ thị của hàm của quy luật khi bình phương:
[đồ thị – trang 166 – GTLTXS&TKT]
Khi số bậc tự do n tăng lên, quy luật khi bình phương sẽ xấp xỉ với quy luật chuẩn (cụ thể là n tăng đến khi nào?)
2. Các tham số đặc trưng của quy luật khi bình phương:
– Kỳ vọng toán:
– Phương sai:
– Độ lệch chuẩn:
Ngoài ra, trong quy luật khi bình phương, giá trị tới hạn cũng là tham số được sử dụng nhiều. Giá trị tới hạn khi bình phương mức
được ký hiệu là
: là giá trị của biến ngẫu nhiên
tuân theo quy luật phân phối khi bình phương với n bậc tự do thỏa mãn điều kiện:
Quy luật khi bình phương có tính chất sau đây: Nếu và
là các biến ngẫu nhiên độc lập cùng phân phối theo quy luật khi bình phương với số bậc tự do tương ứng là
và
thì tổng của chúng là biến ngẫu nhiên:
cũng phân phối theo quy luật khi bình phương với số bậc tự do là
. Trong thực tế, quy luật khi bình phương thường được sử dụng trong trường hợp sau đây: Giả sử có các biến ngẫu nhiên
(
) độc lập, cùng phân phối theo quy luật chuẩn hóa, tức là có kỳ vọng toán bằng 0 và độ lệch chuẩn bằng 1. Nếu xét tổng bình phương của các biến ngẫu nhiên nói trên ta có:
. Biến ngẫu nhiên
sẽ phân phối theo quy luật khi bình phương với bậc tự do n.
V. Quy luật Student –
1. Định nghĩa:
Biến ngẫu nhiên liên tục T gọi là phân phối theo quy luật Student với n bậc tự do nếu hàm mật độ xác suất của nó được xác định bằng biểu thức sau:
Trong đó: là hàm Gamma.
Đồ thị của hàm có dạng như sau:
[đồ thị – trang 169 – GT LTXS&TKT]
2. Các tham số đặc trưng của quy luật Student:
– Kỳ vọng toán:
– Phương sai:
– Độ lệch chuẩn:
Giá trị tới hạn Student, ký hiệu là , là giá trị của biến ngẫu nhiên T phân phối theo quy luật Student với n bậc tự do, thỏa mãn điều kiện:
. Giá trị tới hạn Student có tính chất:
.
Khi số bậc tự do n tăng lên, phân phối Student sẽ hội tụ rất nhanh về phân phối chuẩn hóa. Do đó, nếu n khá lớn (n>30), có thể dùng phân phối chuẩn hóa thay thế cho phân phối Student. Tuy nhiên, cần phải nhấn mạnh rằng, với số bậc tự do nhỏ (n<30), việc thay thế quy luật Student bằng quy luật chuẩn có thể dẫn đến những sai số rất lớn. Chẳng hạn với và
thì giá trị tới hạn Student là
, trong khi đó
, tức là sai lệch nhau tới
(phải chăng giá trị tới hạn là một thước đo để xem xét sự hội tụ giữa hai phân phối này?).
Trong thực tế, quy luật Student thường được sử dụng trong trường hợp sau đây: Giả sử có U là biến ngẫu nhiên phân phối chuẩn hóa và biến ngẫu nhiên V (độc lập với U) phân phối theo quy luật khi bình phương với n bậc tự do. Ta sẽ có biến ngẫu nhiên
phân phối theo quy luật Student với n bậc tự do.
VI. Quy luật Fisher – Snedecor –
1. Định nghĩa:
Biến ngẫu nhiên liên tục F gọi là phân phối theo quy luật Fisher – Snedecor với và
bậc tự do nếu hàm mật độ xác suất của nó được xác định bằng biểu thức sau:
Với .
là hàm Gamma.
Đồ thị của hàm có dạng như sau:
[đồ thị – trang 171 – GT LTSX&TKT]
2. Các tham số đặc trưng của quy luật Fisher – Snedecor:
– Kỳ vọng toán:
– Phương sai:
– Độ lệch chuẩn:
Giá trị tới hạn Fisher – Snedecor ký hiệu là , là giá trị của biến ngẫu nhiên F phân phối theo quy luật Fisher – Snedecor với
và
bậc tự do, thỏa mãn điều kiện:
. Giá trị
có tính chất:
Trong thực tế, quy luật Fisher – Snedecor thường được sử dụng trong trường hợp sau: Giả sử có các biến ngẫu nhiên U và V độc lập với nhau và cùng phân phối theo quy luật khi bình phương với các bậc tự do tương ứng là và
. Lúc đó, biến ngẫu nhiên
sẽ phân phối theo quy luật Fisher – Snedecor với
và
bậc tự do. Mặc khác, có thể chứng minh được rằng, nếu biến ngẫu nhiên T phân phối theo quy luật Student với n bậc tự do thì biến ngẫu nhiên
sẽ phân phối Fisher – Snedecor với số bậc tự do là 1 và n.
Tham khảo:
– Chương 3 – Giáo trình Lý thuyết Xác suất & Thống kê Toán – ĐH KTQD – 4th edition.