Thứ Ba, 19 tháng 8, 2014

Ảo tưởng- Sự kiện độc lập và luật số lớn

Có thể bạn quan tâm



Một tình huống có thể gặp nếu bạn đã từng chơi trò sấp ngửa bằng một đồng xu (hoặc chưa chơi thì hãy hình dung): kết quả của 10 lần liên tiếp đều là ngửa, bây giờ lần chơi thứ 11 ta sẽ đặt tiền cho sấp hay ngửa?

Một tình huống có thể gặp nếu bạn đã từng chơi trò sấp ngửa bằng một đồng xu (hoặc chưa chơi thì hãy hình dung): kết quả của 10 lần liên tiếp đều là ngửa, bây giờ lần chơi thứ 11 ta sẽ đặt tiền cho sấp hay ngửa?
Nhiều người sẽ trả lời là sấp.
Tình huống này cũng hay gặp trong dân đánh số đề và được gọi là “nuôi” số. Họ “thích” một số nào và sẽ nuôi số đó với niềm tin rằng chắc chắn nó sẽ ra, không sớm thì muộn. Nó càng lâu ra thì niềm tin càng mãnh liệt, ngay cả đến lúc tan gia bại sản không còn sức để…”nuôi”.
Một ví dụ nữa, người Á đông có khuynh hướng “trọng nam khinh nữ” hay nhẹ nhàng hơn là thích “có nếp có tẻ” . Một người đã có 4 đứa con gái thường có khuynh hướng hy vọng đứa tiếp là con trai hơn là người đang chỉ có 1 đứa con gái.
Đó là hiện tượng mà người ta gọi là “ảo tưởng của tay đánh bạc” (gambler’s fallacy, fallacy có thể dịch là ngụy biện, nhưng trường hợp này gọi là ảo tưởng có vẻ thích hợp hơn).
Ảo tưởng này được diễn đạt như sau:
1 – X có khả năng xảy ra như Y
2 – Khả năng Y đã xảy ra quá nhiều
3 – Vậy, X sẽ sớm xảy ra
Bài này sẽ phân tích cơ sở của sai lầm đó, và vì sao nó là một sai lầm dựa vào khái niệm sự kiện độc lập và luật số lớn. Qua đó sẽ thấy mặc dù xác suất là một khái niệm tự nhiên nhưng không đơn giản và chịu ảnh hưởng lớn bởi suy nghĩ và tâm lý của con người.
Điều đơn giản nhất không phải ai cũng thấy là: kết quả của (các) lần tung đồng xu trước hoàn toàn không ảnh hưởng đến lần sau. Nói cách khác đồng xu không có trí nhớ (chỉ có chúng ta mới có trí nhớ :-) ). Mỗi lần tung là một lần độc lập và khả năng sấp hay ngửa của mỗi lần đều luôn luôn là 0.5 bất chấp kết quả trước đó.
Diễn đạt một cách ”khoa học” hơn, giả sử ta tung 10 đồng xu, đều là ngửa hết ta có dãy:
NNNNNNNNNN
Bây giờ ta tung một lần nữa thì khả năng là NNNNNNNNNNN (thêm một lần ngửa nữa) cũng đúng bằng khả năng NNNNNNNNNNS (lần thứ 11 là sấp).
Tính toán cụ thể thì hai khả năng này đều bằng 0.511.
Để hiểu tính độc lập ta xem trò xổ số, có 10 số ghi trên 10 quả cầu và bỏ vào lồng quay. Nếu sau khi lấy ra ta không bỏ cầu trở lại, thì sự kiện lấy quả cầu tiếp theo đúng là không độc lập và nó phụ thuộc vào kết quả trước đó.
Thật vậy, nếu ta hy vọng vào số 8 chẳng hạn, thì xác suất có quả cầu đầu tiên mang số 8 là 1/10.
Khi quả cầu thứ nhất đúng là số 8 thì xác suất quả cầu thứ hai là số 8 là zê rô, đơn giản là vì nó không còn trong lồng nữa.
Khi quả cầu thứ nhất không là số 8 thì hy vọng của ta sẽ tăng lên với quả thứ hai, đơn giản là vì còn lại chỉ 9 quả (và có quả số 8 trong đó), xác suất lúc này là 1/9 (hơn 1/10) v.v…
Nhưng thực tế thì trò xổ số không như vậy, sau khi quay người ta bỏ lại quả cầu vào trong lồng. Mọi sự lại trở nên như ban đầu. Xác suất có một số nào đó luôn luôn là 1/10 trong mỗi lần quay. Thành thử chuyện nuôi số đúng là ảo tưởng, về mặt xác suất. Và mọi trò bịp dựa vào các con số đã ra trước đó để đoán số ra sau đều không có cơ sở!
Tính độc lập cũng là thuộc tính của việc sinh con trai hay con gái trong mỗi lần mang thai. Nói thẳng ra việc đẻ con gái hay trai chẳng khác gì việc chúng ta tung một đồng xu!
Một số người am hiểu hơn (hoặc tỏ ra am hiểu hơn) lại dựa vào định luật số lớn: Định luật số lớn nói rằng nếu ta tung đồng xu n lần thì thì nếu số lần sấp là k, tỉ số k/n sẽ tiến đến 1/2, như vậy nếu số lần ngửa đã nhiều rồi thì số lần sấp phải có khuynh hướng xảy ra nhiều lên, để bảo đảm được định luật đó.
Ở đây có hai sai lầm, định luật số lớn (đúng ra định luật số lớn “yếu”, còn cái khác, gọi là định luật số lớn “mạnh”) chỉ phát biểu tỉ số giữa lần sấp k và tổng số lần gieo đồng xu n sẽ tiến đến 1/2 khi n tăng đủ lớn. Đủ lớn trong toán học có thể là 1 tỉ, 1 tỉ tỉ, nghĩa là sẽ lớn, nhưng không biết bao giờ. Mặt khác nó không đề cập đến việc số lần sấp và số lần ngửa sẽ tiến đến bằng nhau (tức là trị tuyệt đối của hiệu của chúng tiến đến 0). Ta xem một ví dụ đơn giản sau đây:
Số lần gieo    200     400
Số lần sấp     120      230
Số lần ngửa  80        170
Hiệu số         40        60
Tỉ số           0.667     0.739
Tỉ số giữa lần sấp vả ngửa ở cột thứ hai lớn hơn (0.739 gần 1 hơn là 0.667) nhưng hiệu số sấp – ngửa của cột hai lại lớn hơn nhiều (60 và 40).
Cuối cùng, phải xét đến một khía cạnh nữa, có thể là nguyên nhân đến ảo tưởng đánh bạc nói trên. Khi hỏi một người nào đó, nếu gieo đồng xu 5 lần thì theo anh tình huống nào sẽ khó xảy ra hơn (S: sấp, N: ngửa):
SSSSS (1) hay SNNSN (2)
Thì chắc là trong phần lớn trường hợp, bạn sẽ được câu trả lời là (1) khó xảy ra hơn. Điều đó cũng tương tự như chúng ta sẽ ngạc nhiên khi một gia đình có 5 người con gái, mà không ngạc nhiên khi gặp một gia đình có 1 trai, 1 gái, 1 gái, 1 trai, 1 gái !!!
Thực ra, như lập luận ở trên, xác suất xảy ra (1) cũng đúng bằng (2).
Khuynh hướng tâm lý con người cho rằng (1) là đặc biệt, nó có một khuôn mẫu (pattern), trong khi đó việc sinh trai hay gái là ngẫu nhiên. Nhiều sự kiện ngẫu nhiên nhưng cuối cùng lại được một sự kiện “chẳng có vẻ ngẫu nhiên” bằng một phát biểu có tính “tổng kết”, ví dụ cả 5 đứa đều là con gái, cả 5 lần đều sấp!!! Còn (2) có vẻ lộn xộn, “không có quy luật”, và do đó dễ xảy ra hơn!!!
Tuy nhiên nếu chúng ta hỏi một người, theo anh bây giờ chúng ta gieo 5 đồng xu. Chúng ta có thể hy vọng lần đầu tiên sẽ S, lần hai N, lần ba N, lần bốn S, lần năm N, chính xác như vậy, liệu khả năng này có thể đạt được không. Câu trả lời sẽ là “rất khó”. Có nghĩa là nếu chúng ta xem trường hợp (2) là một khuôn mẫu (pattern) thì nó cũng sẽ được đối xử ngang hàng với (1), về mặt khả năng xảy ra.
Cũng vậy, chúng ta thấy ngạc nhiên đối với một gia đình có 5 con gái, nhưng nếu bây giờ chúng ta phải đi tìm một gia đình có 5 con, theo thứ tự là 1 trai, 1 gái, 1 gái, 1 trai, 1 gái, thì, bảo đảm, nó cũng cực kỳ khó khăn đến mức….đáng ngạc nhiên!!!
Ghi chú: Định luật số lớn được Jabcob Bernoulli (1654-1705) chứng minh trong tác phẩm mang tên “Ars conjectandi” (tiếng Latinh nghĩa là Nghệ thuật phỏng đoán) được xuất bản sau khi ông qua đời vào năm 1713. Bản thân Bernoulli không dùng thuật ngữ “luật các số lớn”, nó chỉ được Poisson gọi như vậy vào năm 1837. Theo Bernoulli, nếu chúng ta gieo một đồng xu đồng chất (fair) n lần và nó có k lần ngửa, thì, bằng cách tăng số lần gieo (n), tỉ số k/n (tần số tương đối của số lần ngửa) sẽ tiến đến giá trị 1/2.
Một cách chính xác hơn nếu ε và δ là hai số dương nhỏ tùy ý, và n (phụ thuộc vào ε và δ ) đủ lớn thì |k/n – 1/2| nhỏ hơn ε với một xác suất ít nhất là 1-δ .
Luật số lớn theo như Bernoulli, là “đơn giản đến nỗi một người ngu đần cũng hiểu được nó theo bản năng tự nhiên”. Nhưng như ta đã thấy nó thật không đơn giản chút nào!
statistics.vn


Dưới đây là quy trình của một cuộc nghiên cứu, bất luận lĩnh vực- quy mô thì nó cũng trải qua đầy đủ các bước

  • B1: Xác định vấn đề nghiên cứu
  • B2: Xác định mục tiêu nghiên cứu
  • B3: Thiết kế dự án- lập kế hoạch
  • B4: Thu thập dữ liệu
  • B5: Kiểm tra
  • B6: làm sạch, mã hóa
  • B7: Phân tích, báo cáo


Trong trường hợp cần chúng tôi hỗ trợ 01 hay nhiều công đoạn- để tạo điều kiện thuận lợi nhất vui lòng gửi toàn bộ các tài liệu liên quan tới các công đoạn trước cho chúng tôi.
***********************************
Các bạn đang xem bài viết tại website XỦ LÝ SỐ LIỆU- Một dịch vụ của Antsmrg
ANTS là nhóm chuyên cung cấp dịch vụ nghiên cứu xã hội- thị trường cho các tổ chức và các nhân ở mọi quy mô. Các dịch vụ của chúng tôi bao gồm
  • Tư vấn, thiết kế nghiên cứu
  • Thiết kế bảng hỏi, thu thập số liệu
  • Phân tích, báo cáo
Đối với dịch vụ XỬ LÝ SỐ LIỆU, chúng tôi cung cấp các gói dịch vụ liên quan
Mọi yêu cầu, thắc mắc vui lòng gửi lại thông tin cho chúng tôi tại mục "Liên hệ với chúng tôi" tại cuối website này.
+++++++++++++++++++++++++++++++