Statistics 6 – Một số quy luật phân phối xác suất thông dụng của biến ngẫu nhiên liên tục

Ở bài trước, ta đã xét một số quy luật phân phối xác suất thông dụng nhất của biến ngẫu nhiên rời rạc. Sau đây, ta sẽ xét một số quy luật phân phối xác suất cơ bản của các biến ngẫu nhiên liên tục, vì nhiều đại lượng cần nghiên cứu trong thực tế là các biến ngẫu nhiên liên tục. Do đó, việc hiểu biết các quy luật phân phối xác suất của chúng cho phép tiến hành phân tích một cách sâu sắc, cụ thể và chính xác hơn các hiện tượng này.

QUY LUẬT PHÂN PHỐI XÁC SUẤT THÔNG DỤNG

CỦA BIẾN NGẪU NHIÊN LIÊN TỤC

I. Quy luật phân phối đều – \displaystyle U(a,b):

Phân phối đều là quy luật phân phối xác suất đơn giản nhất trong các quy luật phân phối xác suất của biến ngẫu nhiên liên tục. Nếu biến ngẫu nhiên X có thể nhận bất kỳ giá trị nào trên khoảng \displaystyle (a,b) với a và b là các số thực và ứng với mỗi giá trị là một mật độ xác suất như nhau thì biến X sẽ có phân phối đều. Như vậy, trong khoảng \displaystyle (a,b), hàm mật độ xác suất của biến ngẫu nhiên phải bằng một giá trị xác định, tức là \displaystyle f(x)=c với \displaystyle c\in (a,b). Từ đó, theo tính chất của hàm mật độ xác suất, ta có: \displaystyle \int\limits_{{-\infty }}^{{+\infty }}{{f(x)dx}}=\int\limits_{a}^{b}{{cdx}}=1. Từ đó: \displaystyle cb-ca=1, suy ra: \displaystyle c=\frac{1}{{b-a}}. Ta có định nghĩa dưới đây.

1. Định nghĩa:

Biến ngẫu nhiên liên tục X gọi là phân phối theo quy luật đều trong khoảng \displaystyle (a,b) nếu hàm mật độ xác suất của nó có dạng:

\displaystyle f(x)=\left\{ \begin{array}{l}\frac{1}{{b-a}}(x\in (a,b))\\0(x\notin (a,b))\end{array} \right.

Đồ thị hàm \displaystyle f(x) có dạng như sau:

[đồ thị – trang 141 – GT LTXS&TKT]

2. Các tham số đặc trưng của quy luật phân phối đều:

– Kỳ vọng toán: \displaystyle E(X)=\frac{{a+b}}{2}

– Phương sai: \displaystyle V(X)=\frac{{{{{(b-a)}}^{2}}}}{{12}}

– Độ lệch chuẩn: \displaystyle {{\sigma }_{X}}=\frac{{b-a}}{{\sqrt{{12}}}}

Quy luật phân phối đều có ứng dụng rộng trong thống kê toán. Nó có ý nghĩa to lớn trong các phương pháp phi tham số. Khái niệm phân phối đều đôi khi còn được sử dụng trong lý thuyết các ước lượng thống kê. Trong một số lý thuyết kết luận thống kê, người ta thường xuất phát từ quy tắc sau đây: Nếu ta không biết gì về giá trị của tham số cần ước lượng thì mỗi giá trị có thể có của tham số đó là đồng khả năng. Điều đó dẫn đến việc quan niệm tham số cần ước lượng như một biến ngẫu nhiên tuân theo quy luật phân phối đều.

II. Quy luật phân phối lũy thừa – \displaystyle E(\lambda ):

1. Định nghĩa:

Biến ngẫu nhiên liên tục X gọi là phân phối theo quy luật lũy thừa (quy luật mũ) nếu hàm mật độ xác suất của nó có dạng:

\displaystyle f(x)=\left\{ \begin{array}{l}0(x<0)\\\lambda {{e}^{{-\lambda x}}}(x\ge 0)\end{array} \right.

Trong đó \displaystyle \lambda là một hằng số dương. Đồ thị của hàm \displaystyle f(x) có dạng như sau:

[đồ thị – trang 144 – GT LTXK&TKT]

Hàm phân bố xác suất của quy luật phân phối lũy thừa tương ứng với hàm mật độ xác suất trên là:

\displaystyle F(x)=\int\limits_{{-\infty }}^{x}{{f(x)dx}}=\int\limits_{{-\infty }}^{x}{{\lambda {{e}^{{-\lambda x}}}dx}}=1-{{e}^{{-\lambda x}}}

2. Các tham số đặc trưng của quy luật phân phối lũy thừa:

– Kỳ vọng toán: \displaystyle E(X)=\frac{1}{\lambda }

– Phương sai: \displaystyle V(X)=\frac{1}{{{{\lambda }^{2}}}}

– Độ lệch chuẩn: \displaystyle {{\sigma }_{X}}=\frac{1}{\lambda }

Như vậy, trong quy luật lũy thừa, kỳ vọng toán và độ lệch chuẩn đều bằng \displaystyle \frac{1}{\lambda }. Đây chính là tính chất đặc biệt của quy luật lũy thừa. Nó có thể được sử dụng để kiểm tra xem một biến ngẫu nhiên mà ta nghiên cứu trong thực tế có phân phối theo quy luật lũy thừa hay không.

Xác suất để biến ngẫu nhiên X phân phối theo quy luật lũy thừa nhận giá trị trong khoảng \displaystyle (a,b) là:

\displaystyle P(a<X<b)={{e}^{{-\lambda a}}}-{{e}^{{-\lambda b}}}

Quy luật phân phối lũy thừa có ứng dụng trong nhiều lĩnh vực khác nhau. Người ta chứng minh được rằng: thời gian giữa hai lần xuất hiện yêu cầu của một dòng yêu cầu tối giản trong các hệ thống phục vụ công cộng phân phối theo quy luật lũy thừa. Trong các hệ thống kỹ thuật, thời gian làm việc liên tục của máy móc thiết bị giữa hai lần sửa chữa cũng thường phân phối theo quy luật lũy thừa. Khi áp dụng quy luật lũy thừa để giải quyết các bài toán nảy sinh trong thực tế, ngoài ưu điểm là đơn giản (nó chỉ phụ thuộc vào 1 tham số là \displaystyle \lambda ) nó còn có một tính chất rất quan trọng sau đây: Xác suất hoạt động liên tục của thiết bị trong khoảng thời gian t không phụ thuộc vào quãng thời gian hoạt động trước đó mà chỉ phụ thuộc vào độ dài của khoảng thời gian t mà thôi. Người ta chứng minh được rằng chỉ có quy luật phân phối lũy thừa mới có tính chất này. Đó cũng là tiêu chuẩn để nhận biết quy luật này trong thực tế.

III. Quy luật phân phối chuẩn – \displaystyle N(\mu ,{{\sigma }^{2}})

1. Định nghĩa:

Biến ngẫu nhiên liên tục X nhận các giá trị trong khoảng \displaystyle (-\infty ,+\infty ) gọi là phân phối theo quy luật chuẩn với các tham số \displaystyle \mu và \displaystyle {{\sigma }^{2}}, nếu hàm mật độ xác suất của nó có dạng:

\displaystyle f(x)=\frac{1}{{\sigma \sqrt{{2\pi }}}}{{e}^{{-\frac{{{{{(x-\mu )}}^{2}}}}{{2{{\sigma }^{2}}}}}}}

Nếu tiến hành khảo sát hàm số trên và vẽ đồ thị của nó ta sẽ thu được các kết luận sau đây:

a. Hàm số xác định trên toàn trục Ox.

b. Với mọi giá trị của x, hàm số luôn luôn dương, như vậy, đồ thị của nó luôn nằm cao hơn trục Ox.

c. Khi \displaystyle x\to \pm \infty thì \displaystyle f(x)\to 0, tức trục Ox là đường tiệm cận ngang.

d. Ta tìm đạo hàm bậc nhất: \displaystyle f'(x)=-\frac{{x-\mu }}{{{{\sigma }^{3}}\sqrt{{2\pi }}}}{{e}^{{-\frac{{{{{(x-\mu )}}^{2}}}}{{2{{\sigma }^{2}}}}}}}.

Dễ dàng thấy rằng: \displaystyle f'(x)=0 khi \displaystyle {x=\mu }\displaystyle f'(x)>0 khi \displaystyle {x<\mu }\displaystyle f'(x)<0 khi \displaystyle {x>\mu }. Như vậy, khi \displaystyle {x=\mu }, hàm số có cực đại bằng \displaystyle \frac{1}{{\sigma \sqrt{{2\pi }}}}.

e. Hiệu \displaystyle {x-\mu } trong biểu thức của hàm \displaystyle f(x) nằm trong dạng bình phương, tức là hàm số đối xứng qua đường thẳng \displaystyle {x=\mu }.

g. Ta tìm đạo hàm bậc hai: \displaystyle f''(x)=-\frac{1}{{{{\sigma }^{3}}\sqrt{{2\pi }}}}{{e}^{{-\frac{{{{{(x-\mu )}}^{2}}}}{{2{{\sigma }^{2}}}}}}}\left[ {1-\frac{{{{{(x-\mu )}}^{2}}}}{{{{\sigma }^{2}}}}} \right].

Dễ dàng thấy rằng: khi \displaystyle x=\mu +\sigma và \displaystyle x=\mu -\sigma , đạo hàm bậc hai bằng 0 và đi qua hai điểm đó nó đổi dấu. Tại cả hai điểm đó, hàm số đều bằng \displaystyle \frac{1}{{\sigma \sqrt{{2\pi e}}}}. Như vậy, hàm \displaystyle f(x) có các điểm uốn là:

\displaystyle \left( {\mu -\sigma ;\frac{1}{{\sigma \sqrt{{2\pi e}}}}} \right) và \displaystyle \left( {\mu +\sigma ;\frac{1}{{\sigma \sqrt{{2\pi e}}}}} \right)

Đồ thị hàm \displaystyle f(x) và đồ thị sự thay đổi của \displaystyle f(x) theo \displaystyle \sigma :

[2 đồ thị – trang 151 – GT LTXS&TKT]

Hai tham số \displaystyle \mu và \displaystyle \sigma có ý nghĩa quan trọng trong phân phối chuẩn. Khi \displaystyle \mu và \displaystyle \sigma thay đổi, dạng đồ thị của hàm mật độ xác suất \displaystyle f(x) cũng thay đổi như sau: Khi \displaystyle \mu thay đổi thì dạng của đường cong \displaystyle f(x) không thay đổi, song nó sẽ chuyển dịch sang phải hoặc sang trái theo trục Ox. Khi \displaystyle \mu tăng lên thì đồ thị sẽ dịch sang phải, còn khi \displaystyle \mu giảm thì đồ thị sẽ dịch sang trái. Trái lại, khi \displaystyle \sigma thay đổi, dạng của đồ thị sẽ thay đổi theo. Nếu \displaystyle \sigma tăng lên thì đồ thị sẽ thấp xuống và phình ra, còn khi \displaystyle \sigma giảm thì đồ thị sẽ cao lên và nhọn thêm.

Hàm phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật chuẩn:

\displaystyle F(X)=\frac{1}{{\sigma \sqrt{{2\pi }}}}\int\limits_{{-\infty }}^{x}{{{{e}^{{-\frac{{{{{(x-\mu )}}^{2}}}}{{2{{\sigma }^{2}}}}}}}dx}}

2. Các tham số đặc trưng của quy luật chuẩn:

– Kỳ vọng toán: \displaystyle E(X)=\mu

– Phương sai: \displaystyle V(X)={{\sigma }^{2}}

– Độ lệch chuẩn: \displaystyle {{\sigma }_{X}}=\sigma

Phân phối chuẩn được ký hiệu là \displaystyle N(\mu ,{{\sigma }^{2}}). Có liên quan mật thiết với phân phối chuẩn là quy luật phân phối chuẩn hóa. Giả sử biến ngẫu nhiên X phân phối chuẩn với kỳ vọng toán \displaystyle \mu và độ lệch chuẩn \displaystyle \sigma . Xét biến ngẫu nhiên: \displaystyle U=\frac{{X-\mu }}{\sigma }. Trong thống kê, việc biến đổi này thường gọi là phép chuẩn hóa biến ngẫu nhiên X. Phần tiếp theo sẽ đề cập đến quy luật phân phối chuẩn hóa \displaystyle N(0,1) của biến ngẫu nhiên U.

IV. Quy luật phân phối chuẩn hóa – \displaystyle N(0,1)

1. Định nghĩa:

Biến ngẫu nhiên U nhận các giá trị trong khoảng \displaystyle (-\infty ,+\infty ) gọi là tuân theo quy luật phân phối chuẩn hóa nếu hàm mật độ xác suất của nó có dạng:

\displaystyle \varphi (u)=\frac{1}{{\sqrt{{2\pi }}}}{{e}^{{-\frac{{{{u}^{2}}}}{2}}}}

Đồ thị của hàm \displaystyle \varphi (u) có dạng như dưới đây:

[đồ thị – trang 154 – GTLTXS&TKT]

Đặc điểm của đồ thị này là nó lấy trục tung làm trục đối xứng. Hàm phân bố xác suất của biến ngẫu nhiên U phân phối theo quy luật chuẩn hóa có dạng:

\displaystyle \Phi (u)=\frac{1}{{\sqrt{{2\pi }}}}\int\limits_{{-\infty }}^{u}{{{{e}^{{-\frac{{{{u}^{2}}}}{2}}}}du}}

2. Các tham số đặc trưng của quy luật chuẩn hóa:

– Kỳ vọng toán: \displaystyle E(X)=0

– Phương sai: \displaystyle V(X)=1

– Độ lệch chuẩn: \displaystyle {{\sigma }_{X}}=1

Phân phối chuẩn hóa được ký hiệu là \displaystyle N(0,1). Ngoài các tham số đặc trưng là kỳ vọng toán và phương sai, trong phân phối chuẩn hóa còn có một tham số khác với nhiều ứng dụng thực tế là giá trị tới hạn chuẩn.

3. Giá trị tới hạn chuẩn:

Giá trị tới hạn chuẩn mức \displaystyle \alpha , ký hiệu là \displaystyle {{u}_{\alpha }}, là giá trị của biến ngẫu nhiên U có phân phối chuẩn hóa, thỏa mãn điều kiện: \displaystyle P(U>{{u}_{\alpha }})=\alpha .

Vì U chuẩn hóa nên hàm mật độ của U là: \displaystyle \varphi (u)=\frac{1}{{\sqrt{{2\pi }}}}{{e}^{{-\frac{{{{u}^{2}}}}{2}}}}.

Theo tính chất hàm mật độ thì: \displaystyle P(U>{{u}_{\alpha }})=\int\limits_{{{{u}_{\alpha }}}}^{{+\infty }}{{\varphi (u)du}}.

Do đó: \displaystyle P(U>{{u}_{\alpha }})=\frac{1}{{\sqrt{{2\pi }}}}\int\limits_{{{{u}_{\alpha }}}}^{{+\infty }}{{{{e}^{{-\frac{{{{u}^{2}}}}{2}}}}du}}=\alpha . Cho trước \displaystyle \alpha , dựa vào biểu thức này có thể tính được \displaystyle {{u}_{\alpha }} và ngược lại. Trên đồ thị, giá trị tới hạn chuẩn \displaystyle {{u}_{\alpha }} là giá trị sao cho diện tích phần giới hạn bởi đường cong phân phối chuẩn hóa, trục OU và đường thẳng \displaystyle U={{u}_{\alpha }} bằng \displaystyle \alpha .

[đồ thị – trang 156 – GTLTXS&TKT]

Giá trị tới hạn chuẩn có tính chất sau đây: \displaystyle {{u}_{\alpha }}=-{{u}_{{1-\alpha }}}.

Sau đây là một số công thức có nhiều ứng dụng trong việc giải các bài toán thực tế.

1) Công thức xác suất để biến ngẫu nhiên X phân phối chuẩn nhận giá trị trong khoảng \displaystyle (a,b):

\displaystyle P(a<X<b)={{\Phi }_{0}}\left( {\frac{{b-\mu }}{\sigma }} \right)-{{\Phi }_{0}}\left( {\frac{{a-\mu }}{\sigma }} \right)

Trong đó: \displaystyle {{\Phi }_{0}}(u)=\frac{1}{{\sqrt{{2\pi }}}}\int\limits_{0}^{u}{{{{e}^{{-\frac{{{{Z}^{2}}}}{2}}}}dZ}}, và Z ở đây là biến mới được chuẩn hóa từ biến ngẫu nhiên X: \displaystyle Z=\frac{{X-\mu }}{\sigma }.

Hàm \displaystyle {{\Phi }_{0}}(u) có các tính chất sau:

\displaystyle {{\Phi }_{0}}(-u)=-{{\Phi }_{0}}(u)

+ Với mọi \displaystyle u>5 thì \displaystyle {{\Phi }_{0}}(u)\approx {{\Phi }_{0}}(0.5)=0.5.

Các tính chất trên được vận dụng khi tra bảng giá trị hàm \displaystyle {{\Phi }_{0}}(u).

2) Xác suất của sự sai lệch giữa biến ngẫu nhiên và kỳ vọng toán của nó:

\displaystyle P(\left| {X-\mu } \right|<\varepsilon )=2{{\Phi }_{0}}\left( {\frac{\varepsilon }{\sigma }} \right)

Trong thực tế, nhiều khi ta phải tính xác suất để biến ngẫu nhiên X phân phối chuẩn nhận giá trị sai lệch so với kỳ vọng toán của nó về giá trị tuyệt đối nhỏ hơn một số dương cho trước, tức là ta phải tìm xác suất để xảy ra bất đẳng thức: \displaystyle \left| {X-\mu } \right|<\varepsilon .

Ngoài ra, ta có mối liên hệ giữa hàm \displaystyle \Phi (u) của phân phối chuẩn hóa và hàm \displaystyle {{\Phi }_{0}}(u) trong các công thức trên là: \displaystyle \Phi (u)=0.5+{{\Phi }_{0}}(u).

4. Quy tắc hai xích ma và ba xích ma:

– Quy tắc hai xích ma: \displaystyle P(\left| {X-\mu } \right|<2\sigma )=0.9544.

Theo quy tắc hai xích ma, xác suất để biến ngẫu nhiên phân phối chuẩn nhận giá trị trong khoảng \displaystyle (\mu -2\sigma ;\mu +2\sigma ) là 0.9544 hay: 95.44% các giá trị của X sẽ nằm trong khoảng nói trên.

– Quy tắc ba xích ma: \displaystyle P(\left| {X-\mu } \right|<3\sigma )\approx 0.9973.

Theo quy tắc ba xích ma, xác suất để biến ngẫu nhiên phân phối chuẩn nhận giá trị trong khoảng \displaystyle (\mu -3\sigma ;\mu +3\sigma ) là 0.9973 hay: 99.73% các giá trị của X sẽ nằm trong khoảng nói trên.

Trong thực tế, hai quy tắc trên được áp dụng như sau: Nếu quy luật phân phối xác suất của biến ngẫu nhiên được nghiên cứu chưa biết, song nó thỏa mãn điều kiện của quy tắc hai xích ma hoặc ba xích ma thì có thể xem như biến ngẫu nhiên đó phân phối chuẩn.

[đồ thị – trang 162 – GTLTXS&TKT]

5. Phân phối xác suất của tổng các biến ngẫu nhiên độc lập tuân theo cùng một quy luật:

Giả sử \displaystyle {{X}_{1}} và \displaystyle {{X}_{2}} là hai biến ngẫu nhiên độc lập, \displaystyle {{X}_{1}} tuân theo quy luật chuẩn với kỳ vọng toán \displaystyle {{\mu }_{1}} và phương sai \displaystyle \sigma _{1}^{2}, còn \displaystyle {{X}_{2}} tuân theo quy luật chuẩn với kỳ vọng toán \displaystyle {{\mu }_{2}} và phương sai \displaystyle \sigma _{2}^{2}. Lúc đó, tổng của chúng là biến ngẫu nhiên \displaystyle X={{X}_{1}}+{{X}_{2}} cũng phân phối theo quy luật chuẩn với kỳ vọng \displaystyle {{\mu }_{1}}+{{\mu }_{2}} và phương sai \displaystyle \sigma _{1}^{2}+\sigma _{2}^{2}. Tính chất này cũng có thể mở rộng cho một số bất kỳ các biến ngẫu nhiên độc lập lẫn nhau và cúng phân phối chuẩn.

Mở rộng: Nếu \displaystyle {{X}_{1}},{{X}_{2}},...,{{X}_{n}} là n biến ngẫu nhiên độc lập lẫn nhau và cũng tuân theo một quy luật phân phối xác suất nào đó (không nhất thiết là quy luật chuẩn) với các kỳ vọng toán \displaystyle E({{X}_{1}}),E({{X}_{2}}),...,E({{X}_{n}}) và các phương sai \displaystyle V({{X}_{1}}),V({{X}_{2}}),...,V({{X}_{n}}) đã biết, thì biến ngẫu nhiên \displaystyle X=\sum\limits_{{i=1}}^{n}{{{{X}_{i}}}} sẽ phân phối xấp xỉ chuẩn với \displaystyle E(X)=\sum\limits_{{i=1}}^{n}{{E({{X}_{i}})}} và \displaystyle V(X)=\sum\limits_{{i=1}}^{n}{{V({{X}_{i}})}} khi n khá lớn (\displaystyle n>30). Tính chất này thường được gọi là định lý giới hạn trung tâm của Liapunốp [sẽ được đề cập đến trong các bài sau].

6. Sự hội tụ của quy luật nhị thức và quy luật Poisson về quy luật chuẩn:

Khi sử dụng quy luật nhị thức, nếu n khá lớn thì việc tính toán theo công thức Bernoulli sẽ gặp khó khăn. Lúc đó, nếu p nhỏ đến mức \displaystyle np\approx npq thì có thể dùng quy luật Poisson thay thế cho quy luật nhị thức. Song nếu p lại không nhỏ (\displaystyle p>0.1) thì không thể dùng quy luật Poisson để thay thế được. Lúc đó, có thể dùng quy luật chuẩn để thay thế cho quy luật nhị thức. Trong thực tế, quy luật chuẩn có thể thay thế cho quy luật nhị thức nếu thỏa mãn đồng thời hai điều kiện là:

\displaystyle n>5 và \displaystyle \left| {\sqrt{{\frac{p}{{1-p}}}}-\sqrt{{\frac{{1-p}}{p}}}} \right|\frac{1}{{\sqrt{n}}}<0.3

Lúc đó, biến ngẫu nhiên X phân phối theo quy luật nhị thức có thể coi như phân phối xấp xỉ chuẩn với kỳ vọng toán \displaystyle \mu =np và phương sai \displaystyle {{\sigma }^{2}}=npq. Từ đó ta có:

+ Định lý địa phương Laplace:

\displaystyle P(X=x)=C_{n}^{x}{{p}^{x}}{{q}^{{n-x}}}\approx \frac{1}{{\sqrt{{npq}}}}\varphi \left( {\frac{{x-np}}{{\sqrt{{npq}}}}} \right)

+ Định lý tích phân Laplace:

\displaystyle P(x\le X\le x+h)={{P}_{x}}+{{P}_{{x+1}}}+...+{{P}_{{x+h}}}\approx {{\Phi }_{0}}\left( {\frac{{x+h-np}}{{\sqrt{{npq}}}}} \right)-{{\Phi }_{0}}\left( {\frac{{x-np}}{{\sqrt{{npq}}}}} \right)

Đối với quy luật Poisson, quá trình hội tụ về quy luật chuẩn sẽ diễn ra khi \displaystyle \lambda trở lên lớn hơn 20. Vì vậy, nếu X phân phối Poisson, song \displaystyle \lambda >20 thì có thể xem là X phân phối xấp xỉ chuẩn với kỳ vọng toán \displaystyle \mu =\lambda và phương sai \displaystyle {{\sigma }^{2}}=\lambda .

7. Ứng dụng của quy luật chuẩn:

Quy luật chuẩn là quy luật phân phối xác suất được áp dụng rất rộng rãi trong thực tế. Trong  nhiều lĩnh vực của khoa học và đời sống, ta đều gặp các biến ngẫu nhiên phân phối chuẩn. Lý do của sự phổ biến đó không những đã được giải thích trong định lý giới hạn trung tâm như đã xét ở trên mà còn từ hệ quả của định lý đó: Nếu biến ngẫu nhiên X là tổng của một số lớn các biến ngẫu nhiên độc lập và giá trị của mỗi biến chỉ chiếm vị trí nhỏ trong tổng đó thì X sẽ có phân phối xấp xỉ chuẩn. Trong thực tế, ta gặp chính các biến ngẫu nhiên như vậy. Chẳng hạn, trong công nghiệp, người ta đã xác định được rằng: kích thước của các chi tiết do các nhà máy sản xuất ra sẽ phân phối chuẩn nếu quá trình sản xuất diễn ra bình thường. Trong nông nghiệp, năng suất của cùng một loại cây trồng tại các thửa ruộng khác nhau cũng phân phối chuẩn. Năng suất lao động của các công nhân có cùng tay nghề và làm cùng một công việc như nhau cũng phân phối chuẩn. Nhu cầu về các loại hàng hóa khác nhau cũng phân phối chuẩn …vv. Người ta ghi nhận rằng: các năng lực về trí tuệ và thể lực của con người cũng phân phối theo quy luật chuẩn. Thậm chí cả một số chỉ tiêu về sinh lý của những người cùng giới (chẳng hạn: chiều cao, vòng ngực, chiều dài cánh tay …vv) cũng phân phối theo quy luật chuẩn. Sự nhận biết này cho phép lập kế hoạch sản xuất quần áo may sẵn sản xuất hàng loạt sao cho đáp ứng một cách hợp lý nhất kích cỡ của người mua, tránh tình trạng thừa, thiếu do không vừa kích cỡ …vv. Tóm lại, khó có thể liệt kê được hết các hiện tượng và lĩnh vực trong đó có thể áp dụng quy luật phân phối chuẩn.

IV. Quy luật khi bình phương – \displaystyle {{\chi }^{2}}(n)

1. Định nghĩa:

Biến ngẫu nhiên liên tục \displaystyle {{\chi }^{2}} gọi là phân phối theo quy luật khi bình phương với n bậc tự do nếu hàm mật độ xác suất của nó được xác định bằng biểu thức sau:

\displaystyle f(x)=\left\{ \begin{array}{l}0(x\le 0)\\\frac{1}{{{{2}^{{\frac{n}{2}}}}.\Gamma \left( {\frac{n}{2}} \right)}}{{e}^{{\frac{x}{2}}}}{{x}^{{\frac{n}{2}-1}}}(x>0)\end{array} \right.

Trong đó: \displaystyle \Gamma (x)=\int\limits_{0}^{{+\infty }}{{{{t}^{{x-1}}}{{e}^{{-t}}}dt}} là hàm Gamma. Nếu n là một số nguyên thì: \displaystyle \Gamma (n+1)=n!.

Đồ thị của hàm \displaystyle f({{\chi }^{2}}) của quy luật khi bình phương:

[đồ thị – trang 166 – GTLTXS&TKT]

Khi số bậc tự do n tăng lên, quy luật khi bình phương sẽ xấp xỉ với quy luật chuẩn (cụ thể là n tăng đến khi nào?)

2. Các tham số đặc trưng của quy luật khi bình phương:

– Kỳ vọng toán: \displaystyle E({{\chi }^{2}})=n

– Phương sai: \displaystyle V({{\chi }^{2}})=2n

– Độ lệch chuẩn: \displaystyle {{\sigma }_{{{{\chi }^{2}}}}}=\sqrt{{2n}}

Ngoài ra, trong quy luật khi bình phương, giá trị tới hạn \displaystyle {{{\chi }^{2}}} cũng là tham số được sử dụng nhiều. Giá trị tới hạn khi bình phương mức \displaystyle \alpha được ký hiệu là \displaystyle \chi _{\alpha }^{{2(n)}}: là giá trị của biến ngẫu nhiên \displaystyle {{{\chi }^{2}}} tuân theo quy luật phân phối khi bình phương với n bậc tự do thỏa mãn điều kiện:

\displaystyle P({{\chi }^{2}}>\chi _{\alpha }^{{2(n)}})=\alpha

Quy luật khi bình phương có tính chất sau đây: Nếu \displaystyle \chi _{1}^{2} và \displaystyle \chi _{2}^{2} là các biến ngẫu nhiên độc lập cùng phân phối theo quy luật khi bình phương với số bậc tự do tương ứng là \displaystyle {{n}_{1}} và \displaystyle {{n}_{2}} thì tổng của chúng là biến ngẫu nhiên: \displaystyle {{\chi }^{2}}=\chi _{1}^{2}+\chi _{2}^{2} cũng phân phối theo quy luật khi bình phương với số bậc tự do là \displaystyle n={{n}_{1}}+{{n}_{2}}. Trong thực tế, quy luật khi bình phương thường được sử dụng trong trường hợp sau đây: Giả sử có các biến ngẫu nhiên \displaystyle {{x}_{i}} (\displaystyle i=\overline{{1,n}}) độc lập, cùng phân phối theo quy luật chuẩn hóa, tức là có kỳ vọng toán bằng 0 và độ lệch chuẩn bằng 1. Nếu xét tổng bình phương của các biến ngẫu nhiên nói trên ta có: \displaystyle {{\chi }^{2}}=\sum\limits_{{i=1}}^{n}{{x_{i}^{2}}}. Biến ngẫu nhiên \displaystyle {{\chi }^{2}} sẽ phân phối theo quy luật khi bình phương với bậc tự do n.

V. Quy luật Student – \displaystyle T(n)

1. Định nghĩa:

Biến ngẫu nhiên liên tục T gọi là phân phối theo quy luật Student với n bậc tự do nếu hàm mật độ xác suất của nó được xác định bằng biểu thức sau:

\displaystyle f(t)=\frac{{\Gamma \left( {\frac{n}{2}} \right)}}{{\sqrt{{\pi (n-1)}}.\Gamma \left( {\frac{{n-1}}{2}} \right)}}{{\left( {1+\frac{{{{t}^{2}}}}{{n-1}}} \right)}^{{-\frac{n}{2}}}}\forall t

Trong đó: \displaystyle \Gamma (x) là hàm Gamma.

Đồ thị của hàm \displaystyle f(t) có dạng như sau:

[đồ thị – trang 169 – GT LTXS&TKT]

2. Các tham số đặc trưng của quy luật Student:

– Kỳ vọng toán: \displaystyle E(T)=0

– Phương sai: \displaystyle V(T)=\frac{n}{{n-2}}

– Độ lệch chuẩn: \displaystyle {{\sigma }_{T}}=\sqrt{{\frac{n}{{n-2}}}}

Giá trị tới hạn Student, ký hiệu là \displaystyle t_{\alpha }^{{(n)}}, là giá trị của biến ngẫu nhiên T phân phối theo quy luật Student với n bậc tự do, thỏa mãn điều kiện: \displaystyle P(T>t_{\alpha }^{{(n)}})=\alpha . Giá trị tới hạn Student có tính chất: \displaystyle t_{\alpha }^{{(n)}}=-t_{{1-\alpha }}^{{(n)}}.

Khi số bậc tự do n tăng lên, phân phối Student sẽ hội tụ rất nhanh về phân phối chuẩn hóa. Do đó, nếu n khá lớn (n>30), có thể dùng phân phối chuẩn hóa thay thế cho phân phối Student. Tuy nhiên, cần phải nhấn mạnh rằng, với số bậc tự do nhỏ (n<30), việc thay thế quy luật Student bằng quy luật chuẩn có thể dẫn đến những sai số rất lớn. Chẳng hạn với \displaystyle n=4 và \displaystyle \alpha =0.05 thì giá trị tới hạn Student là \displaystyle t_{{0.05}}^{{(4)}}=4.6, trong khi đó \displaystyle {{u}_{{0.05}}}=2.58, tức là sai lệch nhau tới \displaystyle 4.6-2.58=2.02 (phải chăng giá trị tới hạn là một thước đo để xem xét sự hội tụ giữa hai phân phối này?).

Trong thực tế, quy luật Student thường được sử dụng trong trường hợp sau đây: Giả sử có U là biến ngẫu nhiên phân phối chuẩn hóa \displaystyle N(0,1) và biến ngẫu nhiên V (độc lập với U) phân phối theo quy luật khi bình phương với n bậc tự do. Ta sẽ có biến ngẫu nhiên \displaystyle T=\frac{U}{{\sqrt{{\frac{V}{n}}}}} phân phối theo quy luật Student với n bậc tự do.

VI. Quy luật Fisher – Snedecor – \displaystyle F({{n}_{1}},{{n}_{2}})

1. Định nghĩa:

Biến ngẫu nhiên liên tục F gọi là phân phối theo quy luật Fisher – Snedecor với \displaystyle {{n}_{1}} và \displaystyle {{n}_{2}} bậc tự do nếu hàm mật độ xác suất của nó được xác định bằng biểu thức sau:

\displaystyle f(x)=\left\{ \begin{array}{l}0(x\le 0)\\C\times \frac{{{{x}^{{\frac{{{{n}_{1}}-{{n}_{2}}}}{2}}}}}}{{{{{({{n}_{2}}+{{n}_{1}}x)}}^{{^{{\frac{{{{n}_{1}}-{{n}_{2}}}}{2}}}}}}}}(x>0)\end{array} \right.

Với \displaystyle C=\frac{{\Gamma \left( {\frac{{{{n}_{1}}+{{n}_{2}}}}{2}} \right).n_{1}^{{\frac{{{{n}_{1}}}}{2}}}n_{2}^{{\frac{{{{n}_{2}}}}{2}}}}}{{\Gamma \left( {\frac{{{{n}_{1}}}}{2}} \right)\Gamma \left( {\frac{{{{n}_{2}}}}{2}} \right)}}\displaystyle \Gamma (x) là hàm Gamma.

Đồ thị của hàm \displaystyle f(x) có dạng như sau:

[đồ thị – trang 171 – GT LTSX&TKT]

2. Các tham số đặc trưng của quy luật Fisher – Snedecor:

– Kỳ vọng toán: \displaystyle E(F)=\frac{{{{n}_{2}}}}{{{{n}_{2}}-2}}

– Phương sai: \displaystyle V(F)=\frac{{2n_{2}^{2}({{n}_{1}}+n_{2}^{2}-2)}}{{{{n}_{1}}{{{({{n}_{2}}-2)}}^{2}}({{n}_{2}}-4)}}

– Độ lệch chuẩn: \displaystyle {{\sigma }_{F}}=\sqrt{{\frac{{2n_{2}^{2}({{n}_{1}}+n_{2}^{2}-2)}}{{{{n}_{1}}{{{({{n}_{2}}-2)}}^{2}}({{n}_{2}}-4)}}}}

Giá trị tới hạn Fisher – Snedecor ký hiệu là \displaystyle f_{\alpha }^{{({{n}_{1}},{{n}_{2}})}}, là giá trị của biến ngẫu nhiên F phân phối theo quy luật Fisher – Snedecor với \displaystyle {{n}_{1}} và \displaystyle {{n}_{2}} bậc tự do, thỏa mãn điều kiện: \displaystyle P(F>f_{\alpha }^{{({{n}_{1}},{{n}_{2}})}})=\alpha . Giá trị \displaystyle f_{\alpha }^{{({{n}_{1}},{{n}_{2}})}} có tính chất:

\displaystyle f_{\alpha }^{{({{n}_{1}},{{n}_{2}})}}=\frac{1}{{f_{{1-\alpha }}^{{({{n}_{2}},{{n}_{1}})}}}}

Trong thực tế, quy luật Fisher – Snedecor thường được sử dụng trong trường hợp sau: Giả sử có các biến ngẫu nhiên U và V độc lập với nhau và cùng phân phối theo quy luật khi bình phương với các bậc tự do tương ứng là \displaystyle {{n}_{1}} và \displaystyle {{n}_{2}}. Lúc đó, biến ngẫu nhiên \displaystyle F=\frac{{\frac{U}{{{{n}_{1}}}}}}{{\frac{V}{{{{n}_{2}}}}}} sẽ phân phối theo quy luật Fisher – Snedecor với \displaystyle {{{n}_{1}}} và \displaystyle {{{n}_{2}}} bậc tự do. Mặc khác, có thể chứng minh được rằng, nếu biến ngẫu nhiên T phân phối theo quy luật Student với n bậc tự do thì biến ngẫu nhiên \displaystyle {{T}^{2}} sẽ phân phối Fisher – Snedecor với số bậc tự do là 1 và n.


Tham khảo:

– Chương 3 – Giáo trình Lý thuyết Xác suất & Thống kê Toán – ĐH KTQD – 4th edition.

Comment