Statistics 3 – Biến ngẫu nhiên

Ở các bài trước, chúng ta đã nghiên cứu các loại biến cố và phương pháp tính xác suất xảy ra của biến cố đó. Việc này cho phép ta chuyển sang nghiên cứu khái niệm trung tâm của lý thuyết xác suất, đó là khái niệm về biến ngẫu nhiên.

1. Định nghĩa:

“Một biến số được gọi là ngẫu nhiên nếu trong kết quả của phép thử nó sẽ nhận một và chỉ một trong các giá trị có thể có của nó tùy thuộc vào sự tác động của các nhân tố ngẫu nhiên.” (Chương 2 – Giáo trình Lý thuyết Xác suất và Thống kê Toán – ĐH KTQD – 4th edition)

Một định nghĩa dễ hiểu hơn về biến ngẫu nhiên: “Biến ngẫu nhiên là biến số mà các giá trị của nó không biết được cho đến khi chúng ta quan sát hay thu thập chúng.” (Chương 1 – Principles of Econometrics – 4th edition)

Biến ngẫu nhiên thường được ký hiệu bằng các ký tự viết hoa \displaystyle X, \displaystyle Y, \displaystyle Z; hoặc nếu có nhiều biến cùng nhóm, ta có thể ký hiệu là \displaystyle {{X}_{1}},{{X}_{2}},...{{X}_{n}};{{Y}_{1}},{{Y}_{2}},...{{Y}_{n}};...

Mỗi biến ngẫu nhiên có một tập hợp các giá trị có thể xảy ra. Một số ví dụ: Điểm số của chúng ta sẽ không biết được cho đến khi hoàn thành xong bài thi (chúng ta có thể nhận điểm 5, 8 hoặc 9 …), số trận thắng của đội bóng sẽ không biết được cho đến khi đá xong mùa giải (đội bóng có thể không thắng trận nào), độ cao mà một vận động viên nhảy cao đạt được sẽ không biết được cho đến khi cô ấy thực hiện cú nhảy (có thể là 1m, 2m … ). Kết quả của các sự kiện này đều không chắc chắn biết được, chúng mang tính ngẫu nhiên.

Sở dĩ biến \displaystyle X nào đó được gọi là biến ngẫu nhiên vì: trước khi tiến hành 1 phép thử (hay 1 thí nghiệm) nào đó, ta chưa có thể nói một cách chắc chắn rằng nó sẽ nhận giá trị bằng bao nhiêu, mà chỉ có thể dự đoán điều đó với một xác suất nhất định. Nói cách khác, việc X nhận một giá trị nào đó (\displaystyle X={{x}_{1}}) hoặc (\displaystyle X={{x}_{2}}), … (\displaystyle X={{x}_{n}}) về thực chất là các biến cố ngẫu nhiên. Hơn nữa, vì trong kết quả của phép thử, biến X nhất định sẽ nhận 1 và chỉ 1 trong các giá trị có thể có của nó. Do đó, các biến cố (\displaystyle X={{x}_{1}}), (\displaystyle X={{x}_{2}}), … (\displaystyle X={{x}_{n}}) tạo nên một nhóm đầy đủ các biến cố (nhóm đầy đủ các biến cố là gì?). VD:

– Tung một con xúc xắc. Gọi X là “Số chấm xuất hiện”. X là biến ngẫu nhiên vì trong kết quả của phép thử, X sẽ nhận 1 trong 6 giá trị có thể có là 1, 2, 3, 4, 5, 6.

– Gọi Y là “Số con trai trong 100 trẻ sắp được sinh ra tại một nhà hộ sinh”. Y cũng là một biến ngẫu nhiên.

– Gọi Z là “Khoảng cách từ điểm chạm của viên đạn đến tâm bia”. Z cũng là biến ngẫu nhiên.

2. Phân loại biến ngẫu nhiên:

Biến ngẫu nhiên có thể là rời rạc hoặc liên tục.

1) Biến ngẫu nhiên gọi là rời rạc nếu các giá trị có thể có của nó lập nên một tập hợp hữu hạn hoặc đếm được. Nói các khác, biến ngẫu nhiên sẽ là rời rạc nếu ta có thể liệt kê được tất cả các giá trị có thể có của nó. VD:

– Trong phép thử về tung xúc xắc, nếu ta gọi X là “Số điểm thu được”, thì X là biến ngẫu nhiên rời rạc vì các giá trị có thể có của nó là một tập hợp hữu hạn.

– Gọi Y là “Số người vào mua hàng tại một siêu thị trong một ngày”. Y là một biến ngẫu nhiên rời rạc vì các giá trị của nó lập nên một tập hợp đếm được \displaystyle Y=0,1,2,...

– Một phân xưởng có 5 máy hoạt động. Gọi X là “Số máy hỏng trong một ca”. X là biến ngẫu nhiên rời rạc với các giá trị có thể có là \displaystyle X=0,1,2,3,4,5.

2) Biến ngẫu nhiên gọi là liên tục nếu các giá trị có thể có của nó lấp đầy một khoảng trên trục số. Đối với biến ngẫu nhiên liên tục, ta không thể liệt kê tất cả các giá trị có thể có của nó. VD:

– Phép thử là bắn một phát súng vào bia. Nếu gọi X là “Khoảng cách từ điểm chạm của viên đạn đến tâm bia” thì X là biến ngẫu nhiên liên tục vì ta không thể kể ra được tất cả các giá trị có thể có của nó. Ta chỉ có thể nói rằng: các giá trị có thể có của X nằm trong khoảng \displaystyle (a,b) nào đó.

– Gọi X là “Sai số khi đo lường một đại lượng vật lý”, Y là “Kích thước của chi tiết máy do một máy sản xuất ra”, Z là “Năng suất lúa vụ mùa của một tỉnh”. Ta có X, Y, Z là các biến ngẫu nhiên liên tục.

Có thể nói rằng, gần như tất cả các đại lượng mà ta gặp trong thực tế đều là các biến ngẫu nhiên, và chúng sẽ thuộc về một trong hai loại biến ngẫu nhiên đã kể trên.

3. Quy luật phân phối xác suất của biến ngẫu nhiên:

Ta có thể nghĩ rằng chỉ cần xác định các giá trị có thể có của một biến ngẫu nhiên là đủ để xác định biến ngẫu nhiên ấy. Tuy nhiên điều này chưa đủ. Trong thực tế, có những đại lượng rất khác nhau mà các giá trị có thể có chúng lại giống nhau. Hơn nữa, việc các biến ngẫu nhiên nhận một giá trị nào đó trong kết quả của phép thử chỉ là một biến cố ngẫu nhiên, do đó: nếu chỉ mới biết được các giá trị có thể có của nó thì ta mới nắm được rất ít thông tin về biến ngẫu nhiên ấy. Vì vậy, ta còn phải xác định các xác suất tương ứng với các giá trị có thể có của biến ngẫu nhiên để hoàn toàn nắm bắt toàn diện nó. Từ đó, ta có định nghĩa dưới đây.

“Quy luật phân phối xác suất của biến ngẫu nhiên là sự tương ứng giữa các giá trị có thể có của nó và các xác suất tương ứng với các giá trị đó.”

Trong thực tế, người ta thường sử dụng 3 phương pháp để mô tả quy luật phân phối xác suất của biến ngẫu nhiên là: bảng phân phối xác suất, hàm phân bố xác suất, hàm mật độ xác suất.

3.1. Bảng phân phối xác suất:

Bảng phân phối xác suất chỉ dùng để mô tả quy luật phân phối xác suất của biến ngẫu nhiên rời rạc.

Giả sử biến ngẫu nhiên rời rạc X có thể nhận một trong các giá trị có thể có là \displaystyle {{x}_{1}},{{x}_{2}},...,{{x}_{n}} với các xác suất tương ứng là \displaystyle {{p}_{1}},{{p}_{2}},...,{{p}_{n}}. Bảng phân phối xác suất của biến ngẫu nhiên rời rạc X có dạng:

X x1 x2 xi xn
P p1 p2 pi pn

Ta chú ý rằng, để tạo nên một quy luật phân phối xác suất, thì các xác suất \displaystyle {{p}_{i}} phải thỏa mãn điều kiện:

\displaystyle \left\{ \begin{array}{l}0\le {{p}_{i}}\le 1\forall i\\\sum\limits_{{i=1}}^{n}{{{{p}_{i}}}}=1\end{array} \right.

Điều kiện thứ nhất là hiển nhiên theo tính chất của xác suất, còn điều kiện thứ hai suy ra từ định nghĩa của biến ngẫu nhiên. Do các biến cố \displaystyle (X={{x}_{1}}),(X={{x}_{2}}),...,(X={{x}_{n}}) tạo nên một nhóm đầy đủ các biến cố nên tổng các xác suất của chúng bằng 1.

3.2. Hàm phân bố xác suất:

Khái niệm hàm phân bố xác suất áp dụng được đối với cả biến ngẫu nhiên rời rạc và liên tục. Giả sử X là biến ngẫu nhiên bất kỳ, x là một số thực nào đó. Xét biến cố “Biến ngẫu nhiên X nhận giá trị nhỏ hơn x”, ký hiệu \displaystyle (X<x). Hiển nhiên là x thay đổi thì xác suất \displaystyle P(X<x) cũng thay đổi theo. Như vậy, xác suất này là một hàm số của x.

a. Định nghĩa:

Hàm phân bố xác suất của biến ngẫu nhiên X ký hiệu là \displaystyle F(x), là xác suất để biến ngẫu nhiên X nhận giá trị nhỏ hơn x, với x là một số thực bất kỳ.

\displaystyle F(x)=P(X<x)

Ta chú ý rằng: đây chỉ là định nghĩa tổng quát của hàm phân bố xác suất. Đối với từng loại biến ngẫu nhiên, hàm phân bố xác suất được tính theo những công thức riêng. Chẳng hạn, nếu X là biến ngẫu nhiên rời rạc, thì hàm phân bố xác suất được xác định bằng công thức:

\displaystyle F(x)=\sum\limits_{{{{x}_{i}}<x}}{{{{p}_{i}}}}

Với \displaystyle {{p}_{i}} là xác suất để \displaystyle (X={{x}_{i}}).

b. Các tính chất của hàm phân bố xác suất:

Tính chất 1. Hàm phân bố xác suất luôn nhận giá trị trong đoạn \displaystyle \text{ }\!\![\!\!\text{ }0,1]:

\displaystyle 0\le F(x)\le 1

Tính chất này trực tiếp suy ra từ định nghĩa của hàm phân bố xác suất, vì nó là một xác suất nên giá trị của nó luôn nằm trong đoạn \displaystyle \text{ }\!\![\!\!\text{ }0,1].

Tính chất 2. Hàm phân bố xác suất là hàm không giảm, tức là với \displaystyle {{x}_{2}}>{{x}_{1}} thì:

\displaystyle F({{x}_{2}})\ge F({{x}_{1}})

Từ tính chất thứ 2 có thể suy ra một số hệ quả sau đây:

Hệ quả 1. Xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng \displaystyle \text{ }\!\![\!\!\text{ }a,b) bằng hiệu số của hàm phân bố xác suất tại hai đầu khoảng đó:

\displaystyle \text{P(}a\le X<b)=F(b)-F(a)

Hệ quả 2. Xác suất để biến ngẫu nhiên liên tục X nhận một giá trị xác định bằng 0:

\displaystyle \text{P(}X=x)=0

Hệ quả 3. Đối với biến ngẫu nhiên liên tục X ta có các đẳng thức sau đây:

\displaystyle P(a\le X\le b)=P(a\le X<b)=P(a<X\le b)=P(a<X<b)

Tính chất 3. Ta có biểu thức giới hạn sau:

\displaystyle F(-\infty )=0;F(+\infty )=1

Từ tính chất trên có thể suy ra hệ quả sau:

Hệ quả. Nếu biến ngẫu nhiên X chỉ nhận giá trị trong đoạn \displaystyle \text{ }\!\![\!\!\text{ }a,b\text{ }\!\!]\!\!\text{ } thì với \displaystyle x\le a\displaystyle F(x)=0 và với \displaystyle x>b\displaystyle F(x)=1

Chú ý rằng, nếu X là biến ngẫu nhiên rời rạc thì hàm phân bố xác suất chỉ liên tục về phía trái tại mỗi giá trị có thể có của nó, còn về phía phải thì nó bị gián đoạn.

c. Ý nghĩa của hàm phân bố xác suất:

Từ định nghĩa của hàm phân bố xác suất \displaystyle F(x)=P(X<x) ta thấy hàm phân bố xác suất phản ánh mức độ tập trung xác suất ở  về phía bên trái một số thực x nào đó. Như đã biết toàn bộ xác suất của biến ngẫu nhiên bằng một, do đó: giá trị của hàm phân bố xác suất tại mỗi điểm x cho biết có bao nhiêu phần của một đơn vị xác suất phân bổ trong đoạn \displaystyle (-\infty ,x).

3.3. Hàm mật độ xác suất:

Đối với biến ngẫu nhiên liên tục X có thể dùng hàm phân bố xác suất để mô tả quy luật phân phối xác suất của nó. Tuy nhiên, phương pháp này cũng có hạn chế. Hàm phân bố xác suất không thể đặc trưng được xác suất để biến ngẫu nhiên liên tục X nhận một giá trị xác định. Vì thế, đối với các biến ngẫu nhiên liên tục, người ta thường dùng hàm mật độ xác suất để mô tả quy luật phân phối xác suất của nó.

a. Định nghĩa:

Hàm mật độ xác suất của biến ngẫu nhiên liên tục X (ký hiệu là \displaystyle f(x)) là đạo hàm bậc nhất của hàm phân bố xác suất của biến ngẫu nhiên đó.

\displaystyle f(x)={{F}^{'}}(x)

Chú ý rằng, khái niệm hàm mật độ xác suất chỉ áp dụng được đối với các biến ngẫu nhiên liên tục mà không áp dụng được đối với biến ngẫu nhiên rời rạc vì muốn \displaystyle {{F}^{'}}(x) tồi tại thì tối thiểu \displaystyle F(x) phải liên tục, do đó X phải là biến ngẫu nhiên liên tục.

b. Các tính chất của hàm mật độ xác suất:

Tính chất 1. Hàm mật độ xác suất luôn không âm: \displaystyle f(x)\ge 0 \displaystyle \forall x.

Tính chất 2. Xác suất để biến ngẫu nhiên liên tục X nhận giá trị trong khoảng \displaystyle (a,b) bằng tích phân xác định của hàm mật độ xác suất trong khoảng đó:

\displaystyle P(a<X<b)=\int\limits_{a}^{b}{{f(x)dx}}

Về mặt hình học, kết quả trên có thể minh họa như sau: Xác suất để biến ngẫu nhiên liên tục X nhận giá trị trong khoảng \displaystyle (a,b) bằng diện tích của hình giới hạn bởi trục 0x, đường cong \displaystyle f(x) và các đường thẳng \displaystyle x=a và \displaystyle x=b:

[đồ thị – trang 82 – GT Lý thuyết XS và TK Toán – ĐH KTQD – 4th edition]

Tính chất 3. Hàm phân bố xác suất \displaystyle F(x) của biến ngẫu nhiên liên tục X bằng tích phân suy rộng của hàm mật độ xác suất trong khoảng \displaystyle (-\infty ,x):

\displaystyle F(x)=\int\limits_{{-\infty }}^{x}{{f(x)dx}}

Về mặt hình học, công thức trên cho thấy giá trị của hàm phân bố xác suất \displaystyle F(x) tại điểm a bằng diện tích giới hạn bởi trục 0x, đường cong \displaystyle {f(x)} và đường thẳng \displaystyle x=a:

[đồ thị – trang 83 – GT Lý thuyết XS và TK Toán – ĐH KTQD – 4th edition]

Tính chất 4. Tích phân suy rộng trong khoảng \displaystyle (-\infty ,+\infty ) của hàm mật độ xác suất bằng 1.

\displaystyle \int\limits_{{-\infty }}^{{+\infty }}{{f(x)dx}}=1

Về mặt hình học, điều này có nghĩa là toàn bộ diện tích giới hạn bởi đường cong \displaystyle f(x) và trục 0x bằng 1.

Ta chú ý rằng, để một hàm số \displaystyle f(x) có thể là hàm mật độ xác suất của một biến ngẫu nhiên liên tục nào đó, thì nó phải thỏa mãn hai tính chất cơ bản là tính chất 1 và tính chất 4, tức là:

\displaystyle \left\{ \begin{array}{l}f(x)\ge 0\forall x\\\int\limits_{{-\infty }}^{{+\infty }}{{f(x)dx}}=1\end{array} \right.

c. Ý nghĩa của hàm mật độ xác suất:

Hàm mật độ xác suất của biến ngẫu nhiên X tại mỗi điểm x cho biết mức độ tập trung xác suất tại điểm đó. Thật vậy, theo định nghĩa của hàm mật độ xác suất, ta có:

\displaystyle f(x)={{F}^{'}}(x)=\underset{{\Delta x\to 0}}{\mathop{{\lim }}}\,\frac{{F(x+\Delta x)-F(x)}}{{\Delta x}}=\underset{{\Delta x\to 0}}{\mathop{{\lim }}}\,\frac{{P(x\le X<x+\Delta x)}}{{\Delta x}}

Như vậy, hàm mật độ xác suất tại điểm x chính là giới hạn của xác suất để biến ngẫu nhiên liên tục X nhận giá trị trong khoảng \displaystyle (x,x+\Delta x) chia cho độ dài của khoảng đó (khi \displaystyle \Delta x\to 0), tức là giới hạn của mật độ xác suất trung bình trên đoạn \displaystyle (x,x+\Delta x) khi \displaystyle \Delta x\to 0.


Tham khảo:

– Chương 2 – Giáo trình Lý thuyết Xác suất và Thống kê Toán – ĐH KTQD – 4th edition

– Chương 1 – Principles of Econometrics – 4th edition

Comment