Daily Archives: May 28th, 2016

Vấn đề biến độc lập không có ý nghĩa thống kê

Biến độc lập không có ý nghĩa thống kê thì phải làm sao?

Có phải hệ số xác định luôn tăng khi thêm biến mới vào mô hình?

Hệ số xác định \displaystyle {{R}^{2}}

Mức ý nghĩa và độ tin cậy là gì?

Bậc tự do là gì?

Phương pháp luận của Kinh tế lượng

Phân tích 1 vấn đề bằng phương pháp Kinh tế lượng được thực hiện theo 8 bước:

1. Nêu ra các giả thuyết hay giả thiết về mối quan hệ giữa các biến kinh tế

2. Định dạng mô hình toán học

3. Định dạng mô hình kinh tế lượng

4. Thu thập số liệu

5. Ước lượng các tham số của mô hình

6. Phân tích kết quả

7. Dự báo

8. Sử dụng mô hình để kiểm tra hoặc đề ra chính sách

Statistics 13 – Phân tích phương sai

Phân tích phương sai một nhân tố

Phân tích phương sai hai nhân tố

Statistics 12 – Kiểm định giả thuyết thống kê

Khái niệm

Kiểm định tham số

Kiểm định phi tham số

Statistics 11 – Ước lượng tham số của biến ngẫu nhiên

Ước lượng điểm

Ước lượng khoảng tin cậy

Statistics 9 – Cơ sở lý thuyết mẫu

1. Khái niệm về phương pháp mẫu:

Trong thực tế thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hoặc định lượng đặc trưng cho các phần tử đó. Chẳng hạn, một doanh nghiệp phải nghiên cứu tập hợp các khách hàng của nó thì dấu hiệu định tính có thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp, còn dấu hiệu định lượng là nhu cầu khách hàng về số lượng sản phẩm của doanh nghiệp.

Để nghiên cứu tập hợp các phần tử này theo một dấu hiệu nhất định, đôi khi người ta sử dụng phương pháp nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp đó và phân tích từng phần tử của nó theo dấu hiệu nghiên cứu. Chẳng hạn, để nghiên cứu dân số của một nước theo các dấu hiệu như tuổi tác, trình độ văn hóa, địa bàn cư trú, cơ cấu nghề nghiệp … có thể tiến hành tổng điều tra dân số và phân tích từng người theo các dấu hiệu trên, từ đó tổng hợp thành dấu hiệu chung cho toàn bộ dân số của nước đó. Tuy nhiên, trong thực tế, việc áp dụng phương pháp này gặp phải những khó khăn chủ yếu sau:

– Nếu quy mô của tập hợp quá lớn thì việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phí vật chất và thời gian.

– Nhiều khi cũng do quy mô của tập hợp quá lớn nên có thể xảy ra trường hợp tính trùng hoặc bỏ sót các phần tử của nó.

– Do quy mô nghiên cứu lớn mà trình độ tổ chức nghiên cứu lại hạn chế dẫn đến các sai sót trong quá trình thu thập thông tin ban đầu, hạn chế độ chính xác của kết quả phân tích.

– Trong nhiều trường hợp không thể nắm được toàn bộ các phần tử của tập hợp cần nghiên cứu, do đó, không thể tiến hành nghiên cứu toàn bộ được.

– Nếu các phần tử của tập hợp lại bị phá hủy trong quá trình nghiên cứu, thì phương pháp nghiên cứu toàn bộ trở thành vô nghĩa.

Vì thế, trong thực tế, phương pháp nghiên cứu toàn bộ thường chỉ được áp dụng với các tập hợp có quy mô nhỏ, còn chủ yếu người ta áp dụng phương pháp nghiên cứu không toàn bộ, đặc biệt là phương pháp nghiên cứu chọn mẫu. Phương pháp này chủ trương: từ tập hợp cần nghiên cứu chọn ra một số phần tử  (gọi là mẫu), phân tích các phần tử này và dựa vào đó mà suy ra các kết luận từ tập hợp cần nghiên cứu. Nếu mẫu được chọn ra một cách ngẫu nhiên và xử lý bằng các phương pháp xác suất thì vừa thu được các kết luận một cách nhanh chóng, đỡ tốn kém mà vẫn đảm bảo độ chính xác cần thiết.

Việc thu thập, sắp xếp và trình bày các số liệu của tổng thể hoặc một mẫu gọi là thống kê mô tả. Còn việc sử dụng thông tin của mẫu để tiến hành các suy đoán, kết luận về tổng thể gọi là thống kê suy diễn.

2. Tổng thể nghiên cứu:

a. Định nghĩa:

Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hoặc định lượng nào đó được gọi là tổng thể nghiên cứu hay tổng thể.

Số lượng các phần tử của tổng thể được gọi là kích thước của tổng thể, ký hiệu là N. Thường thì kích thước N của tổng thể là hữu hạn, song nếu tổng thể quá lớn hoặc không thể nắm được toàn bộ các phần tử của tổng thể, ta có thể giả thiết rằng kích thước của tổng thể là vô hạn. Điều giả thiết này dựa trên cơ sở là khi tăng kích thước của tổng thể lên khá lớn thì thực tế không ảnh hưởng gì đến kết quả tính toán trên số liệu của từng bộ phận rút ra từ tổng thể đó.

Với mỗi tổng thể, ta không nghiên cứu trực tiếp tổng thể đó mà thông qua một hay nhiều dấu hiệu đặc trưng cho tổng thể đó. Chúng được gọi là dấu hiệu nghiên cứu, ký hiệu là \displaystyle \chi (chi). Các dấu hiệu này là định tính hoặc định lượng.

b. Các phương pháp mô tả tổng thể:

b.1. Giả sử trong tổng thể dấu hiệu nghiên cứu định lượng \displaystyle \chi nhận các giá trị \displaystyle {{X}_{1}},{{X}_{2}},...,{{X}_{k}} với các tần suất tương ứng \displaystyle {{N}_{1}},{{N}_{2}},...,{{N}_{k}} (\displaystyle {{N}_{i}} là số phần tử của tổng thể có chung giá trị \displaystyle {{x}_{i}}). Lúc đó, tổng thể có thể mô tả bằng bảng phân phối tần số sau:

chi x1 x2 xi xk
Tần số N1 N2 Ni Nk

 Hiển nhiên:

\displaystyle \left\{ \begin{array}{l}0\le {{N}_{i}}\le N\forall i\\\sum\limits_{{i=1}}^{k}{{{{N}_{i}}}}=N\end{array} \right.

b.2. Nếu ký hiệu \displaystyle {{p}_{i}}(i=\overline{{1,k}}) là tần suất của \displaystyle {{x}_{i}}, tức là tỷ số giữa tần số của \displaystyle {{x}_{i}} và kích thước của tổng thể thì: \displaystyle {{p}_{i}}=\frac{{{{N}_{i}}}}{N}(i=\overline{{1,n}}). Và lúc đó, tổng thể còn có thể mô tả bằng bảng phân phối tầ suất sau:

chi x1 x2 xi xk
Tần suất p1 p2 pi pk

Ta cũng có: \displaystyle \left\{ \begin{array}{l}0\le {{p}_{i}}\le 1\forall i\\\sum\limits_{{i=1}}^{k}{{{{p}_{i}}}}=1\end{array} \right.

Về mặt hình thức, bảng phân phối tần suất của tổng thể tương tự như bảng phân phối xác suất của biến ngẫu nhiên rời rạc. Nó phản ánh cơ cấu của tổng thể theo dấu hiệu \displaystyle \chi .

b.3. Nếu ký hiệu \displaystyle {{w}_{i}}(i=\overline{{1,k}}) là tần số tích lũy của \displaystyle {{x}_{i}}, tức là tổng số các phần tử có giá trị nhỏ hơn \displaystyle {{x}_{i}} thì: \displaystyle {{w}_{i}}=\sum\limits_{{{{x}_{j}}<{{x}_{i}}}}{{{{N}_{j}}}}. Và là tần suất tích lũy của \displaystyle {{x}_{i}}, tức là tỷ số giữa tần số tích lũy của nó và kích thước của tổng thể thì: \displaystyle F({{x}_{i}})=\frac{{{{w}_{i}}}}{N}=\sum\limits_{{{{x}_{j}}<{{x}_{i}}}}{{\frac{{{{N}_{j}}}}{N}}}. Tần suất tích lũy là một hàm của \displaystyle {{x}_{i}}, có tính chất giống như hàm phân bố xác suất của biến ngẫu nhiên rời rạc. Việc mô tả tổng thể theo dấu hiệu nghiên cứu \displaystyle \chi bằng bảng phân phối tần số, bảng phân phối tần suất và tần suất tích lũy cho thấy dấu hiệu định lượng \displaystyle \chi hoàn toàn có thể mô hình hóa bằng một biến ngẫu nhiên rời rạc \displaystyle X. Điều này cũng đúng đối với các tổng thể mang dấu hiệu \displaystyle \chi phân phối liên tục. Biến ngẫu nhiên \displaystyle X dùng để mô hình hóa dấu hiệu nghiên cứu \displaystyle \chi được gọi là biến ngẫu nhiên gốc, còn quy luật phân phối xác suất của nó được gọi là quy luật phân phối gốc. Việc mô hình hóa dấu hiệu nghiên cứu \displaystyle \chi bằng biến ngẫu nhiên \displaystyle X cho phép áp dụng các công cụ xác suất đã xét ở phần trước trong việc nghiên cứu tổng thể.

c. Các tham số đặc trưng của tổng thể:

Việc mô tả tổng thể theo dấu hiệu \displaystyle \chi bằng bảng phân phối tần số, bảng phân phối tần suất và tần suất tích lũy mới chỉ cung cấp những thông tin chung nhất về tổng thể đó. Trong thực tế, nhiều khi người nghiên cứu cần quan tâm đến những thông tin tổng hợp phản ánh những khía cạnh quan trọng nhất của tổng thể theo dấu hiệu nghiên cứu đó. Những thông tin này được biểu hiện qua các tham số đặc trưng chủ yếu sau đây của tổng thể.

c.1. Trung bình tổng thể:

Giả sử trong tổng thể kích thước \displaystyle N dấu hiệu định lượng \displaystyle \chi nhận các giá trị \displaystyle {{x}_{1}},{{x}_{2}},...,{{x}_{N}}. Trung bình tổng thể, ký hiệu là \displaystyle m, là trung bình số học của các giá trị của dấu hiệu trong tổng thể: \displaystyle m=\frac{1}{N}\sum\limits_{{i=1}}^{N}{{{{x}_{i}}}}.

Nếu trong tổng thể dấu hiệu \displaystyle \chi chỉ nhận các giá trị \displaystyle {{x}_{1}},{{x}_{2}},...,{{x}_{k}} với các tần số tương ứng \displaystyle {{N}_{1}},{{N}_{2}},...,{{N}_{k}} thì trung bình tổng thể được xác định bằng biểu thức: \displaystyle m=\frac{1}{N}\sum\limits_{{i=1}}^{k}{{{{x}_{i}}{{N}_{i}}}}.

Bản chất của trung bình tổng thể có thể làm rõ như sau: Giả sử tổng thể kích thước \displaystyle N bao gồm các phần tử mang các giá trị khác nhau của dấu hiệu nghiên cứu \displaystyle \chi là \displaystyle {{x}_{1}},{{x}_{2}},...,{{x}_{N}}. Giả sử từ tập hợp này lấy ngẫu nhiên ra một phần tử thì xác suất để lấy được phần tử mang giá trị \displaystyle {{{x}_{i}}} hiển nhiên là \displaystyle \frac{1}{N}(i=\overline{{1,N}}). Như vậy giá trị của dấu hiệu \displaystyle \chi có thể xem như một biến ngẫu nhiên \displaystyle X với các giá trị có thể có  \displaystyle {{x}_{1}},{{x}_{2}},...,{{x}_{N}} và các xác suất tương ứng đều bằng \displaystyle \frac{1}{N}. Từ đó:

\displaystyle E(X)={{x}_{1}}\frac{1}{N}+{{x}_{2}}\frac{1}{N}+...+{{x}_{N}}\frac{1}{N}=\frac{1}{N}\sum\limits_{{i=1}}^{N}{{{{x}_{i}}}}=m

Như vậy: \displaystyle E(X)=m.

Mở rộng kết quả thu được cho tổng thể với dấu hiệu nghiên cứu liên tục, ta thu được kết quả là: nếu xem dấu hiệu nghiên cứu như biến ngẫu nhiên

Statistics 8 – Các định lý giới hạn

Như ta đã thấy ở các bài trước, không thể dự đoán trước được một cách chắc chắn xem biến ngẫu nhiên sẽ nhận giá trị nào trong các giá trị có thể có của nó khi thực hiện phép thử. Điều đó phụ thuộc vào rất nhiều nhân tố mà ta không thể tính hết được. Tuy nhiên vấn đề sẽ khác đi khi ta xét cùng một lúc một số lớn các biến ngẫu nhiên. Với một số điều kiện khác rộng rãi, hành vi tổng thể của một số lớn các biến ngẫu nhiên lại gần như mất đi tính ngẫu nhiên và trở nên có tính quy luật. Nói cách khác, khi ta tổng hợp một số lượng lớn các biến ngẫu nhiên thì tính ngẫu nhiên của hiện tượng mất đi và quy luật tất nhiên của nó được bộc lộ.

Đối với thực tiễn thì điều quan trọng là phải xác định các điều kiện trong đó tác động đồng thời của rất nhiều nguyên nhân ngẫu nhiên sẽ dẫn đến kết quả gần như không phụ thuộc gì vào các yếu tố ngẫu nhiên nữa, và lúc đó, ta có thể dự đoán được tiến trình của hiện tượng. Các điều kiện này được chỉ ra trong các định lý có tên là các định lý giới hạn mà một vài kết luận của chúng đã được đề cập ở các bài trước. Ở đây, ta sẽ chỉ xét một số định lý có nhiều ứng dụng hơn cả trong thực tế, bao gồm một số định lý của luật số lớn và định lý giới hạn trung tâm.

Trước hết, ta xét một công cụ bổ trợ là bất đẳng thức Trê-bư-sép.

1. Bất đẳng thức Trê-bư-sép:

Nếu X là biến ngẫu nhiên có kỳ vọng toán và phương sai hữu hạn thì với mọi số dương \displaystyle \varepsilon tùy ý ta đều có:

\displaystyle P(\left| {X-E(X)} \right|<\varepsilon )\ge 1-\frac{{V(X)}}{{{{\varepsilon }^{2}}}}

Hay: \displaystyle P(\left| {X-E(X)} \right|\ge \varepsilon )\le \frac{{V(X)}}{{{{\varepsilon }^{2}}}}

Về mặt thực tiễn, bất đẳng thức Trê-bư-sép chỉ cho phép đánh giá cận trên hoặc cận dưới xác suất để biến ngẫu nhiên X nhận giá trị sai lệch so với kỳ vọng toán của nó lớn hơn hoặc nhỏ hơn \displaystyle \varepsilon . Đôi khi sự đánh giá đó là hiển nhiên và không có ý nghĩa. Chẳng hạn nếu \displaystyle V(X)\ge {{\varepsilon }^{2}} thì bất đẳng thức Trê-bư-sép cho kết quả hiển nhiên. Song nó lại có ưu điểm là áp dụng được đối với mọi biến ngẫu nhiên mà không cần biết quy luật phân phối xác suất của nó. Về mặt lý thuyết, bất đẳng thức Trê-bư-sép có ý nghĩa rất to lớn. Nó được sử dụng để chứng minh các định lý của luật số lớn.

2. Định lý Trê-bư-sép:

Nếu các biến ngẫu nhiên \displaystyle {{X}_{1}},{{X}_{2}},...,{{X}_{n}},... độc lập từng đôi, có các kỳ vọng toán hữu hạn và các phương sai đều bị chặn trên bởi hằng số \displaystyle C (\displaystyle V({{X}_{i}})\le C;i=\overline{{1,n}}) thì với mọi \displaystyle \varepsilon dương bé tùy ý ta luôn có:

\displaystyle \underset{{n\to \infty }}{\mathop{{\lim }}}\,P\left( {\left| {\frac{{{{X}_{1}}+{{X}_{2}}+...+{{X}_{n}}}}{n}-\frac{{E({{X}_{1}})+E({{X}_{2}})+...+E({{X}_{n}})}}{n}} \right|<\varepsilon } \right)=1

Hay: \displaystyle \underset{{n\to \infty }}{\mathop{{\lim }}}\,P\left( {\left| {\overline{X}-E(\overline{X})} \right|<\varepsilon } \right)=1

Ở trên, ta giả thiết là các biến ngẫu nhiên \displaystyle {{{X}_{1}},{{X}_{2}},...,{{X}_{n}}} có các kỳ vọng toán khác nhau. Trong thực tế thường gặp trường hợp các biến ngẫu nhiên có cùng một kỳ vọng toán. Lúc đó có thể áp dụng trường hợp riêng của bất đẳng thức Trê-bư-sép như sau:

Nếu \displaystyle {{{X}_{1}},{{X}_{2}},...,{{X}_{n}}} là các biến ngẫu nhiên độc lập từng đôi, có cùng kỳ vọng toán (\displaystyle E({{X}_{i}})=m;i=\overline{{1,n}}) và các phương sai cùng bị chặn trên (\displaystyle V({{X}_{i}})\le C,i=\overline{{1,n}}) thì với mọi \displaystyle \varepsilon dương bé tùy ý, ta luôn có:

\displaystyle \underset{{n\to \infty }}{\mathop{{\lim }}}\,P\left( {\left| {\frac{{{{X}_{1}}+{{X}_{2}}+...+{{X}_{n}}}}{n}-m} \right|<\varepsilon } \right)=1

Định lý trên còn được gọi là luật số lớn của Trê-bư-sép.

Bản chất của định lý Trê-bư-sép là nó chứng minh sự hội tụ theo xác suất của trung bình số học của một số lớn các biến ngẫu nhiên về trung bình số học của các kỳ vọng toán tương ứng. Nói cách khác, nó chứng tỏ sự ổn định của trung bình số học của một số lớn các biến ngẫu nhiên xung quanh trung bình số học của các kỳ vọng toán của các biến ngẫu nhiên ấy.

Như vậy, mặc dù từng biến ngẫu nhiên độc lập có thể nhận giá trị khác nhiều so với kỳ vọng toán của chúng, song trung bình số học của một số lớn các biến ngẫu nhiên lại nhận giá trị gần bằng trung bình số học của các kỳ vọng toán của chúng với xác suất rất lớn. Điều đó cho phép dự đoán giá trị của trung bình số học của các biến ngẫu nhiên.

Trong thực tế, định lý Trê-bư-sép có ứng dụng rộng rãi trong nhiều lĩnh vực, chẳng hạn trường hợp riêng của nó chính là cơ sở cho phương pháp đo lường trong vật lý. Để xác định giá trị của một đại lượng vật lý nào đó, người ta thường tiến hành đo n lần và lấy trung bình số học của các kết quả đo làm giá trị thực của đại lượng cần đo. Thật vậy, giả sử xem kết quả đo của n lần đo là các biến ngẫu nhiên \displaystyle {{X}_{1}},{{X}_{2}},...,{{X}_{n}}. Ta thấy rằng đối với các biến ngẫu nhiên này có thể áp dụng được trường hợp riêng của định lý Trê-bư-sép vì chúng độc lập với nhau (từ đó chúng cũng độc lập từng đôi một với nhau), có cùng kỳ vọng toán vì nếu không có sai số hệ thống thì kỳ vọng toán của các biến ngẫu nhiên ấy chính bằng giá trị thực của đại lượng vật lý. Cuối cùng các phương sai của chúng đều bị chặn trên bằng độ chính xác của thiết bị đo. Do đó theo định lý Trê-bư-sép ta có thể chứng tỏ rằng trung bình số học của các kết quả đo sẽ sai lệch rất ít so với giá trị thực của đại lượng vật lý và điều đó xảy ra với xác suất gần như bằng 1.

Định lý Trê-bư-sép còn là cơ sở cho một phương pháp được áp dụng rộng rãi trong thống kê là phương pháp mẫu mà thực chất nó là dựa vào một mẫu ngẫu nhiên khá nhỏ có thể kết luận về toàn bộ tập hợp tổng quát của các đối tượng được nghiên cứu. Chẳng hạn, để đánh giá năng suất cây trồng của một vùng nào đó, người ta không cần phải điều tra trên toàn bộ diện tích của vùng đó mà chỉ dựa vào kết quả thu hoạch được của một mẫu ngẫu nhiên khá nhỏ mà vẫn đưa ra được các kết luận đủ chính xác về năng suất cây trồng của vùng đó.

Qua vài ví dụ như vậy có thể thấy được ý nghĩa to lớn của định lý Trê-bư-sép đối với thực tiễn.

3. Định lý Bernoulli:

Nếu \displaystyle f là tần suất xuất hiện biến cố A trong \displaystyle n phép thử độc lập và \displaystyle p là xác suất xuất hiện biến cố đó trong mỗi phép thử thì với mọi \displaystyle \varepsilon dương bé tùy ý, ta luôn có:

\displaystyle \underset{{n\to \infty }}{\mathop{{\lim }}}\,P\left( {\left| {f-p} \right|<\varepsilon } \right)=1

Định lý trên còn được gọi là luật số lớn của Bernoulli.

Định lý Bernoulli chứng minh sự hội tụ theo xác suất của tần suất xuất hiện biến cố trong n phép thử  độc lập về xác suất xuất hiện biến cố đó trong mỗi phép thử khi số phép thử tăng lên vô hạn. Nó chứng tỏ sự ổn định của tần suất xung quanh giá trị xác suất của biến cố đó.

Định lý Bernoulli là cơ sở lý thuyết của định nghĩa thống kê về xác suất, do đó nó cũng là cơ sở cho mọi áp dụng của định nghĩa thống kê về xác suất trong thực tế.

Chú ý rằng, trong các định lý của luật số lớn, ta chỉ đề cập đến sự hội tụ theo xác suất chứ không phải sự hội tụ theo nghĩa thông thường của giải tích toán học. Chẳng hạn, theo định lý Bernoulli, không thể kết luận rằng \displaystyle \underset{{n\to \infty }}{\mathop{{\lim }}}\,f=p, tức là không thể kết luận khi n đủ lớn thì f sẽ luôn luôn sai lệch không đáng kể so với p. Sự hội tụ theo xác suất chỉ có nghĩa là khi n đủ lớn thì việc f và p sai lệch nhau không đáng kể sẽ có thể xem như có xác suất bằng 1.  Như vậy thì với từng giá trị riêng biệt của n, bất đẳng thức vẫn có thể không thỏa mãn, tức là f và p vẫn có thể sai lệch nhau đáng kể. Vì vậy định lý Bernoulli có thể viết ngắn gọn: khi \displaystyle n\to \infty thì f hội tụ theo xác suất về p.

4. Định lý giới hạn trung tâm:

Định lý giới hạn tổng quát hơn cả là định lý giới hạn trung tâm của Liapunov. Ở đây, ta chỉ xét một trường hợp của nó được sử dụng nhiều trong thống kê. Trước hết, ta xét khái niệm hàm đặc trưng.

4.1. Hàm đặc trưng: 

a. Định nghĩa:

Hàm đặc trưng của biến ngẫu nhiên X là kỳ vọng toán của biến ngẫu nhiên \displaystyle {{e}^{{itx}}} và được ký hiệu là \displaystyle {{\varphi }_{X}}(t). Tức là:

\displaystyle {{\varphi }_{X}}(t)=E\left[ {{{e}^{{itx}}}} \right]=E(\cos tX)+iE(\sin tX)

Như vậy, nếu X là biến ngẫu nhiên rời rạc thì:

\displaystyle {{\varphi }_{X}}(t)=\sum\limits_{j}{{{{e}^{{itx}}}{{P}_{j}}}}

Còn nếu X là biến ngẫu nhiên liên tục thì:

\displaystyle {{\varphi }_{X}}(t)=\int\limits_{{-\infty }}^{{+\infty }}{{{{e}^{{itx}}}f(x)dx}}

b. Các tính chất của hàm đặc trưng:

1) \displaystyle \left| {{{\varphi }_{X}}(t)} \right|\le 1

2) Nếu \displaystyle Y=ax+b thì \displaystyle {{\varphi }_{Y}}(t)={{e}^{{ibt}}}{{\varphi }_{X}}(at).

3) \displaystyle F(x) xác định một cách duy nhất theo hàm đặc trưng \displaystyle {{\varphi }_{X}}(t).

4) Nếu \displaystyle {{X}_{1}},{{X}_{2}},...,{{X}_{n}} là các biến ngẫu nhiên độc lập thì:

\displaystyle {{\varphi }_{{{{X}_{1}}+{{X}_{2}}+...+{{X}_{n}}}}}(t)=\prod\limits_{{k=1}}^{n}{{{{\varphi }_{{{{X}_{k}}}}}(t)}}

5) Nếu tồn tại \displaystyle E{{\left| X \right|}^{k}} thì hàm đặc trưng \displaystyle {{\varphi }_{X}}(t) cũng tồn tại đạo hàm đến bậc k tại mọi điểm t (khả vi đến bậc k tại mọi điểm t).

6) Nếu \displaystyle \left\{ {{{F}_{n}}(x)} \right\} là dãy hàm phân bố xác suất và \displaystyle \left\{ {{{\varphi }_{n}}(t)} \right\} là dãy các hàm đặc trưng tương ứng thì điều kiện cần và đủ để \displaystyle \left\{ {{{F}_{n}}(x)} \right\} hội tụ yếu (tức là hội tụ tại các điểm \displaystyle {{{F}_{n}}(x)} liên tục) tới hàm phân bố xác suất \displaystyle F(x) là \displaystyle \left\{ {{{\varphi }_{n}}(t)} \right\} hội tụ tại mọi t đến hàm đặc trưng \displaystyle \varphi (t) tương ứng với \displaystyle F(x).

Với khái niệm hàm đặc trưng, ta sẽ xét định lý giới hạn trung tâm sau đây:

4.2. Định lý Lindenberg – Lewi:

Nếu \displaystyle {{X}_{1}},{{X}_{2}},...,{{X}_{n}} là một dãy các biến ngẫu nhiên độc lập cùng tuân theo một quy luật phân phối xác suất nào đó với kỳ vọng toán và phương sai hữu hạn: \displaystyle E({{X}_{k}})=a;V({{X}_{k}})={{\sigma }^{2}};\forall k, thì quy luật phân phối xác suất của biến ngẫu nhiên:

\displaystyle U_{n}^{c}=\frac{{{{U}_{n}}-E({{U}_{n}})}}{{\sqrt{{V({{U}_{n}})}}}} với \displaystyle {{U}_{n}}=\sum\limits_{{k=1}}^{n}{{{{X}_{k}}}}

sẽ hội tụ khi \displaystyle n\to \infty tới quy luật chuẩn hóa \displaystyle N(0,1).

Tức là: \displaystyle P(U_{n}^{c}<x)=\frac{1}{{\sqrt{{2\pi }}}}\int\limits_{{-\infty }}^{x}{{{{e}^{{-\frac{{{{t}^{2}}}}{2}}}}dt}}

Về mặt thực hành, người ta có thể ứng dụng định lý giới hạn trung tâm như sau:

Với n đủ lớn, ta có thể cho rằng :

\displaystyle P(U_{n}^{c}<x)\approx \frac{1}{{\sqrt{{2\pi }}}}\int\limits_{{-\infty }}^{x}{{{{e}^{{-\frac{{{{t}^{2}}}}{2}}}}dt}}=\phi (x)

Hoặc:

\displaystyle P\left( {a<{{U}_{n}}<b} \right)\approx {{\phi }_{0}}\left( {\frac{{b-E({{U}_{n}})}}{{\sqrt{{V({{U}_{n}})}}}}} \right)-{{\phi }_{0}}\left( {\frac{{a-E({{U}_{n}})}}{{\sqrt{{V({{U}_{n}})}}}}} \right)


Tham khảo:

– Chương 5 – Giáo trình Lý thuyết Xác suất & Thống kê Toán – ĐH KTQD – 4th edition.

Statistics 8 – Các tham số đặc trưng của biến ngẫu nhiên hai chiều

Kỳ vọng: \displaystyle E(X)

Phương sai: \displaystyle V(X)

Độ lệnh chuẩn: \displaystyle {{\sigma }_{X}}

Statistic 7 – Biến ngẫu nhiên 2 chiều

Ở các bài trước, ta đã xét các biến ngẫu nhiên mà các giá trị có thể có của chúng được biểu diễn bằng 1 số. Đó là các biến ngẫu nhiên một chiều. Ngoài các biến ngẫu nhiên một chiều, trong thực tế, ta còn gặp các biến số mà các giá trị có thể có của chúng được xác định bằng hai, ba, …, n số. Những biến số này được gọi một cách tương ứng là các biến ngẫu nhiên hai chiều, ba chiều, …, n chiều.

Continue reading →

Statistics 4 – Các tham số đặc trưng của biến ngẫu nhiên

Từ bài trước, ta có thể thấy: quy luật phân phối xác suất của biến ngẫu nhiên (dưới dạng bảng phân phối xác suất, hàm phân bố xác suất hay hàm mật độ xác suất) hoàn toàn xác định biến ngẫu nhiên. Như vậy, khi ta xác định được quy luật phân phối của biến ngẫu nhiên thì ta đã nắm được toàn bộ thông tin về biến ngẫu nhiên đó. Tuy nhiên, trong thực tế, ta không chỉ cần đến những thông tin đó mà còn phải quan tâm đến những thông tin cô đọng, phản ánh tổng hợp những đặc trưng quan trọng nhất của biến ngẫu nhiên được nghiên cứu. Những thông tin cô đọng phản ánh từng phần về biến ngẫu nhiên được gọi là các tham số đặc trưng.

Continue reading →

Statistics 6 – Một số quy luật phân phối xác suất thông dụng của biến ngẫu nhiên liên tục

Ở bài trước, ta đã xét một số quy luật phân phối xác suất thông dụng nhất của biến ngẫu nhiên rời rạc. Sau đây, ta sẽ xét một số quy luật phân phối xác suất cơ bản của các biến ngẫu nhiên liên tục, vì nhiều đại lượng cần nghiên cứu trong thực tế là các biến ngẫu nhiên liên tục. Do đó, việc hiểu biết các quy luật phân phối xác suất của chúng cho phép tiến hành phân tích một cách sâu sắc, cụ thể và chính xác hơn các hiện tượng này.

Continue reading →

Statistics 5 – Một số quy luật phân phối xác suất thông dụng của biến ngẫu nhiên rời rạc

Ở những bài tiếp theo, ta sẽ nghiên cứu một số quy luật phân phối xác suất thông dụng nhất với các biến ngẫu nhiên rời rạc và liên tục. Điều đó làm cho việc phân loại các biến ngẫu nhiên trong thực tế theo các quy luật phân phối xác suất được dễ dàng hơn. Để làm rõ những đặc điểm cơ bản của mỗi quy luật phân phối xác suất ta sẽ xuất phát từ các thí dụ có tính điển hình cho mỗi quy luật để làm cơ sở xây dựng những lược đồ khác nhau, từ đó đi đến các quy luật phân phối xác suất tương ứng với mỗi lược đồ. Giả sử trong bình có N quả cầu, trong đó có M quả cầu trắng và N – M quả cầu đen. Mỗi phép thử là việc lấy ngẫu nhiên từ bình ra một quả cầu. Theo những cách lấy khác nhau sẽ dẫn đến những lược đồ khác nhau và các quy luật phân phối xác suất khác nhau.

Continue reading →

Statistics 3 – Biến ngẫu nhiên

Ở các bài trước, chúng ta đã nghiên cứu các loại biến cố và phương pháp tính xác suất xảy ra của biến cố đó. Việc này cho phép ta chuyển sang nghiên cứu khái niệm trung tâm của lý thuyết xác suất, đó là khái niệm về biến ngẫu nhiên.

Continue reading →

Giới thiệu về Kinh Tế Lượng

Kinh tế lượng là bộ môn khoa học nghiên cứu về mối quan hệ giữa các đại lượng kinh tế: ước lượng, kiểm định và dự báo mối quan hệ đó.

Continue reading →

Các giả thiết OLS

A. Mô hình hồi quy đơn (mô hình hồi quy hai biến):

Xét mô hình hồi quy tuyến tính đơn: \displaystyle {{Y}_{i}}={{\beta }_{1}}+{{\beta }_{2}}{{X}_{i}}+{{u}_{i}}

Các giả thiết OLS cho mô hình hồi quy đơn là:

1. \displaystyle {{X}_{i}} phi ngẫu nhiên

2.