Định lý giới hạn trung tâm (CLT): Định nghĩa và Các đặc điểm chính
📝

Định lý giới hạn trung tâm (CLT): Định nghĩa và Các đặc điểm chính

Nguồn bài viết: Click here
ĐỊNH NGHĨA
Định lý giới hạn trung tâm (Central Limit Theorem - CLT) phát biểu rằng phân phối của các trung bình mẫu xấp xỉ một phân phối chuẩn khi kích thước mẫu ngày càng lớn.
Định lý giới hạn trung tâm (CLT) là gì?
Trong lý thuyết xác suất, định lý giới hạn trung tâm (CLT) phát biểu rằng phân phối của một mẫu sẽ xấp xỉ một phân phối chuẩn (tức là, một bell curve - đường cong hình chuông) khi kích thước mẫu trở nên lớn hơn, bất kể hình dạng phân phối thực tế của quần thể.
Nói cách khác, CLT là một tiền đề thống kê rằng, với một kích thước mẫu đủ lớn từ một quần thể có mức độ phương sai hữu hạn, trung bình của tất cả các biến được lấy mẫu từ cùng một quần thể sẽ xấp xỉ bằng trung bình của toàn bộ quần thể. Hơn nữa, các mẫu này sẽ xấp xỉ một phân phối chuẩn, với phương sai của chúng xấp xỉ bằng phương sai của quần thể khi kích thước mẫu ngày càng lớn, theo luật số lớn.
NHỮNG ĐIỂM CHÍNH
  • Định lý giới hạn trung tâm (CLT) phát biểu rằng phân phối của các trung bình mẫu xấp xỉ một phân phối chuẩn khi kích thước mẫu ngày càng lớn, bất kể phân phối của quần thể.
  • Một kích thước mẫu đủ lớn có thể dự đoán các đặc điểm của một quần thể chính xác hơn.
  • Kích thước mẫu bằng hoặc lớn hơn 30 thường được coi là đủ để CLT có hiệu lực.
  • Một khía cạnh quan trọng của CLT là trung bình của các trung bình mẫu và độ lệch chuẩn sẽ bằng trung bình và độ lệch chuẩn của quần thể.
  • CLT hữu ích trong tài chính và đầu tư khi phân tích một tập hợp lớn các chứng khoán để ước tính phân phối và các đặc điểm của danh mục đầu tư về lợi nhuận, rủi ro và tương quan.
Investopedia / Jiaqi Zhou
Hiểu về Định lý giới hạn trung tâm (CLT)
Theo định lý giới hạn trung tâm, trung bình của một mẫu dữ liệu sẽ gần với trung bình của toàn bộ quần thể đang xét khi kích thước mẫu tăng lên, bất kể phân phối thực tế của dữ liệu. Khái niệm này có thể đúng bất kể phân phối của quần thể là chuẩn hay lệch.
Theo quy tắc chung, kích thước mẫu từ 30 trở lên thường được coi là đủ để CLT có hiệu lực, có nghĩa là phân phối của các trung bình mẫu được phân phối khá chuẩn. Ngoài ra, càng lấy nhiều mẫu, kết quả được vẽ đồ thị càng có hình dạng của một phân phối chuẩn.
Định lý giới hạn trung tâm thường được sử dụng kết hợp với luật số lớn, luật này phát biểu rằng trung bình của các trung bình mẫu sẽ ngày càng gần với trung bình của quần thể khi kích thước mẫu tăng lên. Khái niệm này có thể cực kỳ hữu ích trong việc dự đoán chính xác các đặc điểm của các quần thể rất lớn.
Mặc dù khái niệm này lần đầu tiên được Abraham de Moivre phát triển vào năm 1733, nhưng nó đã không được chính thức hóa cho đến năm 1920, khi nhà toán học người Hungary George Pólya đặt tên cho nó là định lý giới hạn trung tâm.
Các thành phần chính của Định lý giới hạn trung tâm
Định lý giới hạn trung tâm có một số thành phần chính. Chúng chủ yếu xoay quanh kỹ thuật lấy mẫu.
  • Lấy mẫu liên tiếp: Điều này có nghĩa là một số đơn vị mẫu là chung với các đơn vị mẫu được chọn trong các lần trước.
  • Lấy mẫu ngẫu nhiên: Tất cả các mẫu phải được chọn ngẫu nhiên để chúng có cùng khả năng thống kê được chọn.
  • Các mẫu phải độc lập: Các lựa chọn hoặc kết quả từ một mẫu không được ảnh hưởng đến các mẫu trong tương lai hoặc các kết quả mẫu khác.
  • Kích thước mẫu lớn: Khi kích thước mẫu tăng lên, phân phối lấy mẫu sẽ ngày càng gần với phân phối chuẩn.
Định lý giới hạn trung tâm trong Tài chính và Đầu tư
CLT có thể hữu ích trong việc xem xét lợi nhuận của một cổ phiếu riêng lẻ hoặc của các chỉ số chứng khoán rộng hơn vì việc phân tích rất đơn giản, do việc tạo ra dữ liệu tài chính cần thiết tương đối dễ dàng. Do đó, các nhà đầu tư thường dựa vào CLT để phân tích lợi nhuận cổ phiếu, xây dựng danh mục đầu tư và quản lý rủi ro.
Giả sử, ví dụ, một nhà đầu tư muốn phân tích lợi nhuận tổng thể cho một chỉ số chứng khoán bao gồm 1.000 cổ phiếu khác nhau. Trong trường hợp này, nhà đầu tư có thể chỉ cần nghiên cứu một mẫu ngẫu nhiên các cổ phiếu để đưa ra ước tính lợi nhuận cho toàn bộ chỉ số. Để an toàn trong trường hợp này, ít nhất 30 đến 50 cổ phiếu được chọn ngẫu nhiên trên các lĩnh vực khác nhau nên được lấy mẫu để định lý giới hạn trung tâm có hiệu lực.
Tại sao Định lý giới hạn trung tâm lại hữu ích?
Định lý giới hạn trung tâm hữu ích khi phân tích các tập dữ liệu lớn vì nó cho phép người ta giả định rằng phân phối lấy mẫu của trung bình sẽ được phân phối chuẩn trong hầu hết các trường hợp. Điều này cho phép phân tích và suy luận thống kê dễ dàng hơn. Ví dụ, các nhà đầu tư có thể sử dụng định lý giới hạn trung tâm để tổng hợp dữ liệu hiệu suất chứng khoán riêng lẻ và tạo ra phân phối các trung bình mẫu đại diện cho phân phối quần thể lớn hơn về lợi nhuận chứng khoán trong một khoảng thời gian.
Công thức của Định lý giới hạn trung tâm là gì?
Định lý giới hạn trung tâm không có công thức nào được sử dụng trong ứng dụng thực tế của nó. Nguyên tắc của nó chỉ đơn giản là được áp dụng. Với kích thước mẫu đủ lớn, phân phối mẫu sẽ xấp xỉ một phân phối chuẩn và trung bình mẫu sẽ tiến gần đến trung bình quần thể. Nó gợi ý rằng nếu chúng ta có kích thước mẫu ít nhất là 30, chúng ta có thể bắt đầu phân tích dữ liệu như thể nó phù hợp với một phân phối chuẩn.
Tại sao Kích thước mẫu tối thiểu của Định lý giới hạn trung tâm là 30?
Kích thước mẫu từ 30 trở lên khá phổ biến trong thống kê như là mức tối thiểu để áp dụng định lý giới hạn trung tâm. Kích thước mẫu của bạn càng lớn, mẫu càng có nhiều khả năng đại diện cho tập hợp quần thể của bạn.
Luật số lớn là gì?
Trong lý thuyết xác suất và thống kê, luật số lớn phát biểu rằng kích thước mẫu càng lớn, trung bình của nó càng có nhiều khả năng phản ánh trung bình của toàn bộ quần thể.
Trong kinh doanh, luật số lớn có thể có một ý nghĩa khác, cụ thể là khi một công ty phát triển về quy mô, việc duy trì tốc độ tăng trưởng theo tỷ lệ phần trăm trở nên khó khăn hơn.
Điểm mấu chốt
Định lý giới hạn trung tâm (CLT) khẳng định rằng khi kích thước mẫu ngày càng lớn, trung bình của nó sẽ ngày càng xấp xỉ trung bình trong một phân phối chuẩn. Khái niệm này có thể hữu ích trong nhiều ứng dụng, chẳng hạn như phân tích lợi nhuận đầu tư, vì nó chỉ yêu cầu một kích thước mẫu đủ lớn (thường được hiểu là 30 điểm dữ liệu trở lên) thay vì toàn bộ quần thể.