Thứ Năm, 3 tháng 7, 2014

Cạm bẫy trong xác suất - Phần 2. Cạm bẫy cho những người tính toán

Có thể bạn quan tâm




 

Phần hai: Cạm bẫy cho những người tính toán

Trong phần một, chúng ta đã thấy nhiều khi, thay vì giải thích bằng phép thuật của các Đấng Tối Cao, nếu chịu khó một chút, ta có thể giải thích bằng Xác Suất. Nhưng liệu cái Xác Suất đó có phải Đấng Tối Cao không thì lại là chuyện khác. Có những thứ cứ ngẫm nghĩ thấy chỉ có Thượng Đế mới làm được thôi, nhưng cuối cùng cũng có thể giải thích bằng Xác Suất. Ví dụ, quỹ đạo của điện tử (electron) trong nguyên tử- các bạn thử tưởng tượng một anh chàng láo nháo, động đậy liên tục thế mà cũng chuyển động theo quỹ đạo. Khó tin quá!!! Các bạn đừng vội cho đó là quỹ đạo. Những hình vẽ được biểu diễn cho quỹ đạo của electron chẳng qua vùng biểu thị xác suất tìm thấy electron lớn nhất.


Phái nào ngoại tình nhiều hơn?

Ở Việt Nam ta, những đức tính cao quý như Công, Dung, Ngôn, Hạnh vẫn được phụ nữ chúng ta gìn giữ một cách trân trọng. Thời buổi kinh tế thị trường, nhịp sống dường như nhanh hơn, hối hả hơn. Hậu quả của nó là người ta cảm thấy có nhu cầu sống gấp hơn, thực dụng hơn kể cả những liễu yếu đào tơ. Theo thống kê, số lượng các cặp vợ chồng ly hôn ở Mỹ là 54%, ở Nga 56%(cao nhất) mà nguyên nhân phần lớn là do bạo hành gia đình và ngoại tình. Thế nhưng, có những thống kê nhiều khi lại dẫn dắt chúng ta đến kết luận sai lầm trầm trọng:

Theo thống kê cho thấy phần châu Âu của nước Nga (chỉ là ví dụ thôi), xác suất tìm người đàn ông ngoại tình lớn hơn người đàn bà ngoại tình với tỷ lệ 75 và 65% tương ứng, còn ở phần châu Á cũng vậy nhưng vì ảnh hưởng văn hoá Á Đông nên cũng ít đi chút đỉnh 30 và 20% tương ứng. Thế ở nước Nga, đàn ông nói chung  ngoại tình hơn đàn bà chăng?

Tôi cam chắc với các bạn, không 100% thì 99,99% số người được hỏi sẽ bảo “hiển nhiên là vậy.”. Các bậc mày râu thì thở dài ngao ngán: “Mấy vị làm thống kê này chắc toàn phụ nữ hay sao ấy.”. Còn các bà thì chì chiết “Đấy nhé, còn chối không?. Con số thống kê rành rành nhé.”.
Ấy, đừng vội hoảng quí ông, và cũng đừng vội đe nghiến quí bà. Kể cả những con số chênh lệch khủng khiếp thế cũng không chứng tỏ ở nước Nga nói chung, người đàn ông ngoại tình hơn phụ nữ. Chỉ có điều, tất cả người được hỏi đã để cho những con số đánh lừa cảm giác của mình. Và chúng ta đã suy đoán vấn đề không như nó thế mà như nó có vẻ thế. Hay là, chúng ta đánh giá vấn đề theo cảm giác và phỏng đoán. Chúng ta thử tính toán một tý xem sao:
Đặt a1 là số đấng mày râu phần châu Á nước Nga, a2 là số quí ông ở phần châu Á ngoại tình. Và b1, b2 là số phái đẹp châu Á tương ứng.
Tương tự cho phần châu Âu nước Nga là c1, c2 (quí ông) và d1, d2 (quí bà) tương ứng.
a2/a1 = x%
b2/b1 = y%
x>y
c2/c1 = z%
d2/d1 = t%
z>t
Liệu chúng ta có thể khẳng định:
(a2 + c2)/(a1 + c1) > (b2 + d2)/(b1 + d1)
Đây là bài đại số sơ đẳng và các bạn có thể tìm ra vô số thí dụ để khẳng định điều ngược lại. Ngay cả đối với những thông số x=0.75, y=0.65, z=0.3, t=0.2 như đề bài. Ta lấy những con số sau:
a1 = 24.000.000, a2 = 7.200.000
b1 = 9.800.000,   b2 = 1.960.000
c1 =  8.000.000,  c2 = 6.000.000
d1 = 14.000.000  d2 = 9.100.000
Như vậy, tổng số quí ông và quí bà là 32.000.000, 23.800.000 tương ứng. Và số các gentlemen và ladies phạm lời thề hôn nhân sẽ là 13.200.000, 11.060.000. Xác suất tìm thấy người đàn ông ngoại tình ở nước Nga là 41,25% và người phụ nữ ngoại tình lại là 46,47%!!!
Hay chúng ta muốn tạo nên khung cảnh đầy kịch tính hơn:
Xác suất tìm người đàn ông ngoại tình ở hai phần Á, Âu của nước Nga đều lớn hơn xác suất tìm thấy người phụ nữ ngoại tình là 10%. Liệu xác suất tìm thấy người đàn ông ngoại tình của toàn nước Nga có lớn hơn tìm thấy người phụ nữ ngoại tình. Hoàn toàn không chắc!!! Thậm chí, ngược lại có những thông số cho thấy những người phụ nữ vẫn ngoại tình hơn đàn ông như thường. Mà cũng lại hơn đến 10%!
Ta vẫn lấy x, y, z, t như trên và các thông số sau:
a1 = 28.000.000, a2 = 8.400.000
b1 = 9.000.000,   b2 = 1.800.000
c1 =  8.000.000,  c2 = 6.000.000
d1 = 18.000.000  d2 = 11.700.000
Xác suất tìm thấy người đàn ông ngoại tình ở nước Nga là 40% và người phụ nữ ngoại tình lại là 50%!!!

Trên đây, chúng tôi lấy ví dụ cho quí độc giả thấy có những thông số đánh lừa cảm giác chúng ta dẫn đến những kết luận sai lầm tai hại. Khi nói đến danh từ xác suất làm cho người ta dễ đơn giản hoá các thông số thành thông số duy nhất P(A) và P(B). Và lầm tưởng mình có thể cộng, trừ, so sánh chúng với nhau. Cũng không ít người trong các bạn cho rằng, những con số trên làm sao đánh lừa được người tính toán chuyên nghiệp. Đúng là như vậy, nhưng có những bài toán xác suất khi đọc điều kiện bài toán cứ ngỡ như tìm ra cách giải đúng nhất. Nhưng sau đấy sẽ có người khác chỉ cho chúng ta cách lý luận khác, cũng hợp lý không kém, đưa đến một đáp số khác Xin các bạn đọc đoạn trích dưới đây trong cuốn Mathematical puzzles and diversions của Martin Gardner:
“Charles Sanders Pears có nói, chưa có một lãnh vực toán học nào mà người chuyên gia sai lầm dễ dãi như lý thuyết xác suất. Lịch sử đã khẳng định điều này. Ngay cả G. W. Leibniz cũng từng cho rằng khi tung hai con xúc xắc lên thì số lần nhận được 12(tổng số hai con xúc xắc cộng lại) cũng bằng số lần xuất hiện 11.
…….
Thời này, lý thuyết xác suất cho những câu trả lời chính xác và rõ ràng với một yêu cầu: trong điều kiện bài toán phải xác định rõ ràng bằng phương pháp nào ta thử sự kiện ngẫu nhiên.”
Và một thí dụ cổ điển nhất minh chứng cho tính không nhất quán của bài toán xác suất là bài toán sau:

Hình tam giác có dễ tạo không?

Tại sao không dễ nhỉ?!. Chấm ba chấm trên tờ giấy trắng. Nối ba điểm lại theo từng cặp ta được một tam giác (xác suất bạn chọn ba điểm trên một đường thẳng hầu như bằng không). Chúng tôi không nói đến cách này, bạn thử làm thí nghiệm như dưới đây:
Bẻ một que (bằng gỗ) thành ba phần một cách ngẫu nhiên. Ba phần nhận được bạn thử tạo thành tam giác. Và tìm xác suất ba phần đó tạo thành hình tam giác.

Chúng ta cho rằng hai điểm cắt thanh gỗ được chọn rất ngẫu nhiên và nằm bất kỳ ở đâu trên thanh gỗ và độ dài thanh gỗ là 1 đơn vị. Vậy, các thanh OA, OB, OC có độ dài ngẫu nhiên trong khoảng [0,1]. Ta dựng hình tam giác đều có đường cao bằng 1. Chắc ai trong chúng ta đều chứng minh được “Cho điểm O trong tam giác đều. Tổng ba đoạn vuông góc từ O xuống ba cạnh tam giác bằng đường cao của tam giác.”. Vậy, bất kỳ ta bẻ như thế nào ta cũng dựng được điểm O trong tam giác lớn. Và bất kỳ điểm O ở đâu trong tam giác lớn ta cũng tìm được một cách bẻ (hay là hay chỗ bẻ) trên que gỗ. Điều này có nghĩa các điểm O ứng với các càch bẻ khác nhau lấp đầy tam giác lớn. Nhưng chỉ có phần trong tam giác nhỏ màu xanh là cho phép chúng ta dựng được hình tam giác (một cạnh không lớn hơn hai cạnh còn lại). Suy ra, xác suất bằng ¼.
Thế nhưng, trên thực tế khi nói đến động từ bẻ hai lần, ta có thể nghĩ như sau:
Đầu tiên, ta bẻ ngẫu nhiên que gỗ thành hai phần. Sau đó, chọn một đoạn  trong hai phần đó bẻ ra thành hai phần nữa. Tìm xác suất để ba phần này tạo thành hình tam giác.
Có một ý kiến thế này: Lấy đoạn OA là đoạn nhỏ khi chia lần đầu tiên. Vậy O phải nằm trong ba phần dưới của tam giác to. Còn đoạn lớn bẻ ra hai phần (xác suất chọn được phần lớn để bẻ tiếp là ½). Như vậy, xác suất điểm O vào phần màu xanh là 1/3. Như vậy xác suất đề ra là 1/3 x ½ =1/6.
Trên thực tế, cách tính trên hoàn toàn sai (theo sách đã dẫn, cách chứng minh này của một chuyên gia tên là Witvort đưa ra). Với hình vẽ trên, ta thấy các tam giác bằng nhau. Nhưng khi tính xác suất thì các tam giác trên hoàn toàn không bằng nhau tý nào cả!!! Khác với trường hợp một, các điểm đều được biểu thị cho một trạng thái bẻ của que và tất cả các điểm này có giá trị như nhau khi tính xác suất. Và “tổng tất cả trường hợp” để xét xác suất cho tất cả điểm O là tam giác lớn không thay đổi. Còn trường hợp hai, “tổng tất cả trường hợp” là đoạn MN thay đổi theo độ dài x của đoạn OA. X càng lớn thì MN càng nhỏ và trọng lượng từng trường hợp xảy ra trên MN càng lớn. Nói cách khác, các điểm O hoàn toàn không bình đẳng với nhau. Chúng đi kèm với xác suất xảy ra trên MN. [1] Vậy O càng lên trên thì giá trị để tính xác suất của nó càng lớn. Mà theo hình vẽ, càng lên trên đoạn màu xanh càng lớn, ngược lại đoạn màu đỏ càng nhỏ đi. Có nghĩa, trong tam giác màu xanh, trọng lượng xét xác suất tăng dần từ đỉnh đến đáy, còn tam giác màu đỏ lại giảm dần. Hai tam giác vì thế không thể nào bằng nhau về giá trị tính xác suất. Muốn tính xác suất của trường hợp hai, ta phải nhờ đến tích phân.
Với một x nào đó, xác suất điểm O nằm trong phần màu xanh là x/(1-x). Ta lấy trung bình của tất cả xác suất này theo x biến thiên từ 0 đến ½. Giá trị đó bằng:
Và phải tính thêm xác suất chọn được đoạn lớn để bẻ bằng ½ nữa, ta được kết quả 0,193 lớn hơn 1/6.
Xác suất ¼ như cách tính 1 có được (lớn hơn 0,193) vì ta tính xác suất bẻ lần thứ hai đúng vào phần lớn hơn không phải là ½ mà lớn hơn. Nó tỷ lệ thuận với độ dài của đoạn lớn. Và nếu ta đặt bài toán như sau:
Đặt que gỗ vào máy chặt, chỉnh máy chặt sao cho khoảng di động của dao chạy theo đúng chiều dài của thanh gỗ. Mỗi lần chặt, máy chặt tự chọn ngẫu nhiên điểm chặt trong khoảng đó. Chặt hai lần được ba phần. Tìm xác suất sao cho ba phần đó lập được tam giác.
Vâng, thưa các bạn nếu bài toán như vậy thì xác suất chính xác bằng ¼.
Bài toán này đã gây khá nhiều tranh luận trong bạn bè chúng tôi. Khi chúngtôi giải thích tất cả những khúc mắc của nó, mọi người đều đồng ý như tôi đã viết trên. Thế nhưng, chúng tôi nhận được một lời giải thích khá hay của một anh bạn trẻ-và chúng tôi nghĩ đó là lời giải thích chu đáo, cặn kẽ:
“Anh Vỹ thân mến!
Khi dùng động từ bẻ thì chắc chúng ta tuyệt đối không thể dùng phương pháp một để giải, vì nó không toát lên ý nghĩa của từ bẻ. Cách một phù hợp hoàn toàn với bài toán máy chặt như anh đã giải thích. Thế nhưng, ngay cả cách hai tuy đúng nhưng không logic trên thực tế. Khi ta nói bẻ có nghĩa là chia cái gì đấy bằng tay ra hai phần. Nếu chia que gỗ ra chỉ hai phần thôi thì mọi việc đơn giản quá. Nhưng ở đây là chia ra ba phần, như vậy ta phải bẻ hai lần. Mà đã bẻ làm hai hay lớn hơn lần thì phải có trạng từ bổ ngữ thêm nữa: đó là bẻ các lần cách quãng hay bẻ liên tiếp. Cách giải hai phù hợp với bẻ hai lần cách quãng. Đúng hơn là: yêu cầu một người bẻ que gỗ. Sau đấy, ta cầm cả hai phần và chìa hai đầu (đã chỉnh cho bằng đầu để người kia không biết đâu là que dài) cho anh ta chọn. Chọn xong, anh ta bẻ đoạn đã chọn ra thành hai phần. Tìm xác suất sao cho ba đoạn nhận được có thể tạo thành tam giác. Như vậy, cách này có toát lên ý nghĩa của từ “bẻ” không?
Hay, người bẻ (trung thực trong cách bẻ ngẫu nhiên) chọn lựa cách bẻ hợp lý trên thực tế hơn. Anh ta bẻ ngẫu nhiên lần một trên que gỗ. Sau đó, tuỳ sở thích của từng người, anh ta thả rơi đoạn bên trái xuống (tay trái thả ra) trong khi tay phải vẫn nắm giữ đầu bên phải của que gỗ. Và tiếp tục bẻ tiếp phần còn lại trong tay phải ra hai phần một cách ngẫu nhiên. Tìm xác suất sao cho ba đoạn tạo thành tam giác.
Rõ ràng, cách bẻ này liên tiếp không dứt quãng và tiết kiệm thời gian cho người bẻ. Đồng thời, cách bẻ này toát lên ý nghĩa từ “bẻ” chân thật nhất. Xác suất tính được cũng bằng 0,193. Nhưng cách giải thích xác suất chọn thanh dài để bẻ bằng ½ hoàn toàn khác. Vì anh ta bẻ liên tiếp như thế, nên chỉ khi điểm bẻ của lần đầu anh ta chọn nằm trên nửa trái của que, thì phần bẻ tiếp theo mới là đoạn dài hơn được. Suy ra xác suất bằng ½.[2]

Thật là sai lầm khi nói đến tính không nhất quán của bài toán xác suất mà không đề cập đến bài toán Bertran (nhà toán học người Pháp Josep Bertran ), còn gọi là nghịch lý Bertran.

Nghịch lý Bertran:

Dựng một cách ngẫu nhiên một đoạn thẳng (có hai điểm trên một vòng tròn cho trước). Tìm xác suất sao cho dây cung này lớn hơn độ dài của cạnh tam giác đều nội tiếp trong vòng tròn đó.
Để trả lời cho câu hỏi này, có rất nhiều lời giải. Dưới đây là ba lời giải cổ điển của nó:
Lời giải 1: Dây cung phải được bắt đầu từ một điểm nào đó trên vòng tròn. Ví dụ, điểm đó là điểm A như trên hình 7:
Tất cả các đường thẳng từ A quét hết một góc Pi, nhưng chỉ có những đường thẳng màu xanh tạo nên những dây cung lớn hơn cạnh của tam giác đều nội tiếp. Suy ra xác suất bằng 1/3. Ở bất kỳ điểm A nào đó trên vòng tròn đều có kết quả như vậy.


Lời giải 2: Bất kỳ điểm nào trong đường tròn có thể là trung điểm của một dây cung nào đó. Và ngược lại điểm đó chỉ là trung điểm của một dây cung duy nhất (trừ tâm vòng tròn).
Từ hình 8, ta thấy chỉ có những đường thẳng có điểm giữa nằm trong vòng tròn nội tiếp tam giác đều mới có độ dài lớn hơn cạnh tam giác. Suy ra, xác suất bằng Diện tích vòng tròn nội tiếp/ Diện tích vòng tròn ngoại tiếp = ¼.


Lời giải 3: Không mất tính tổng quát, ta chỉ xét những dây cung song song với đường kính vòng tròn nào đấy (Các đường khác có thể nhận được nhờ quay). Chúng ta hoàn toàn thấy được tổng tất cả các đường bằng tổng tất cả các bộ đường song song như thế với các góc quay khác nhau. Nên ta chỉ cần xét một bộ đường song song là đủ.
Tất cả những đoạn thẳng nằm trong vùng màu xanh đều thoả mãn điều kiện. Suy ra xác xuất bằng ½.

Hầu hết tất cả các chuyên gia, qua các lời giải trên, đều cho rằng đề ra không chính xác. Tất cả xoay quanh cụm “dựng một cách ngẫu nhiên đoạn thẳng”. Dựng thế nào? Bằng cách gì? Ngẫu nhiên ra sao? Ngẫu nhiên nào ngẫu nhiên hơn?...
Dù ngôn ngữ có những lệch lạc với logic toán học, nhưng chúng tôi cho rằng ngay cả những lệch lạc đó cũng có giới hạn của nó. Chứ không thể dựng ngẫu nhiên một đoạn thẳng là ta có thể lấy một điểm trên vòng tròn rồi vẽ đường thẳng ngẫu nhiên. Có cái gì đó bất ổn!!!
Ta thử xem đoạn thẳng phải được dựng như thế nào? Theo đề toán việc chúng ta nhận được đoạn thẳng (dây cung) là hiển nhiên. Nói cách khác, cứ một lần thử nghiệm một cách ngẫu nhiên ta phải có một dây cung hay xác suất nhận được dây cung phải bằng 1. Rõ ràng, nếu thế phải có ít nhất một điểm trên mặt đường tròn nằm trên đường thẳng (đt mà từ đó ta có thể kéo dài cho nó cắt đường tròn tạo ra dây cung). Như vậy, việc tạo ra dây cung hiển nhiên một cách ngẫu nhiên có phải tương đương với một trong hai việc sau:
1. Điểm bên ngoài và thước kẻ: Lấy ngẫu nhiên một điểm ngoài vòng tròn. Từ điểm này dựng hai tiếp tuyến với đường tròn. Đặt thước kẻ qua điểm đó và di động ngẫu nhiên trong góc tạo bởi hai tiếp tuyến. Chọn bất kỳ vị trí ngẫu nhiên của thước kẻ, dựng một đường thẳng cắt đường tròn, ta nhận dây cung.
2. Điểm bên ngoài và điểm bên trong: Lấy một điểm ngẫu nhiên bên ngoài đường tròn, sau đó lấy một điểm ngẫu nhiên khác trong vòng tròn. Nối chúng lại, dựng được một dây cung.
3. Điểm bên trong và thước vẽ: Lấy ngẫu nhiên một điểm trên mặt đường tròn, đặt cây thước vào điểm đó vẽ ngẫu nhiên một đường thẳng cắt vòng tròn tạo thành một dây cung. Kể cả phương pháp đặt ngẫu nhiên thước kẻ vào vòng tròn và kẻ cũng là một dạng của phép lấy dây cung này.
4. Hai điểm và nối: Lấy một điểm trên mặt đường tròn và một điểm bất kỳ. Nối chúng lại tạo một đường thẳng cắt đường tròn ta nhận đươc một dây cung. Nếu điểm ngẫu nhiên sau nằm ngoài vòng tròn thì phép thử này lại giống phép 1 (giải thích dưới). Nên phép thử này chỉ như sau: lấy ngẫu nhiên hai điểm trên mặt vòng tròn. Nối hai điểm lại thành đường thẳng cắt đường tròn, ta nhận được dây cung.

Như vậy, có hai kiểu dựng chính: một điểm + thước kẻ, hai điểm và nối. Biểu diễn trên trục toạ độ, ta thấy cách một phụ thuộc vào toạ đoạ x, y và góc α, còn cách hai- toạ độ x, y và x1, y1.
Chúng ta lưu ý, tuy từ toạ độ của hai điểm, ta cũng tìm được góc α, nhưng cách hai cho ta thêm một đại lượng nữa- đó là trọng lượng hay xác suất vẽ được đường thẳng qua (x,y) có góc α. Theo hình 10, cách dùng thước kẻ để vẽ chỉ cho ta thêm đại lượng ngẫu nhiên α, còn cách hai, để nhận được đường thẳng (x,y,α) ta có nhiều trường hợp các cặp [(x,y),(x1,y1)] khác nhau. Nhưng xác suất nhận được chúng khác nhau. Khoảng chọn được các cặp điểm lớn thì xác suất lớn, khoảng chọn được nhỏ thì xác suất nhỏ.
Ví dụ, lời giải 1 chỉ dựa trên thông số α, bởi vì tuy có điểm trên đường tròn nhưng tất cả những điểm này tương đương nhau nên yếu tố x,y không đóng vai trò gì. Lại chọn điểm mà xác suất thấp nhất. Nhưng nếu thay vì chọn cách một, ta lại theo cách hai- tức ta điểm đầu tiên vẫn trên đường tròn nhưng điểm thứ hai lấy ngẫu nhiên trên mặt đường tròn. Lúc này, xác suất không phải 1/3 nữa mà bằng diện tích của phần màu xanh chia cho diện tích đường tròn (lớn hơn ½, trường hợp 2 phía dưới).  Hoặc, lời giải 3 chỉ dựa vào thông số ngẫu nhiên duy nhất là y. Nhưng nếu ta đặt bài toán như sau:
Cho một điểm x, y trên mặt đường tròn, vẽ một đường song song với trục hoành tao trên đường tròn một dây cung. Tìm xác suất sao dây cung đó lớn hơn cạnh tam giác đều nội tiếp.
Bài này cũng có xác suất bằng diện tích phần màu xanh chia cho diện tích đường tròn (trường hợp 2 phía dưới). Chỉ có lời giải hai khá lập dị, nó dựa trên hai thông số ngẫu nhiên (x,y) và thông số α (rất quan trọng cho việc dựng đoạn thẳng ngẫu nhiên) được suy ra từ (x,y). Và cách dựng đường thẳng lại làm cho dây cung nhận được nhỏ nhất, nên trách sao xác suất chả nhỏ hơn nhiều!!!. Các bạn thử xem, vì sao về nguyên tắc lời giải 3 và lời giải 2 giống nhau, thế nhưng hai xác suất nhận được lại khác nhau?
So sánh các lời giải trên với các yếu tố ngẫu nhiên như đã vẽ trên hình 10, chúng ta thấy các lời giải chỉ dùng “tính ngẫu nhiên” một phần rất nhỏ. Hiển nhiên, khi tính ngẫu nhiên nhỏ thì người ta càng dễ đưa ra các lời giải khác nhau ứng với từng phần nhỏ ngẫu nhiên nhất định. Dẫn đến kết quả khác nhau xa nhau rất lớn. Và ba lời giải trên chẳng qua chỉ là những ví dụ khá độc đáo gây ấn tượng lớn cho độc giả (xác suất ½, 1/3, ¼), không hơn không kém. Chúng không thể được xem là những lời giải của bài toán Bertran. Bởi vì, chúng chưa làm toát lên tính ngẫu nhiên của đoạn thẳng. Dù, như chúng tôi viết ở trên, ngôn ngữ có những lệch lạc không đáp ứng với tính chính xác của toán học, nhưng những lệch lạc đó cũng phải có giới hạn của nó.
Và khi các yếu tố ngẫu nhiên được đề cập đến nhiều, đề cập một cách tổng thể, thì kết quả nhận được không lệch nhau nhiều. Ta thử tính xem xác suất của các cách lấy ngẫu nhiên như tôi đã đề cập trên:

1. Điểm bên ngoài và thước kẻ: Lấy ngẫu nhiên một điểm ngoài vòng tròn. Từ điểm này dựng hai tiếp tuyến với đường tròn. Đặt thước kẻ qua điểm đó và di động ngẫu nhiên trong góc tạo bởi hai tiếp tuyến. Chọn bất kỳ vị trí ngẫu nhiên của thước kẻ, dựng một đường thẳng cắt đường tròn, ta nhận dây cung.
Gọi l là độ dài từ tâm đến điểm ở ngoài đó. Từ hình vẽ 11, dễ thấy xác suất sao cho dây cung nhận được lớn hơn cạnh tam giác đều nội tiếp bằng góc màu xanh chia cho góc giữa hai tiếp tuyến. Hay bằng:
Và lời giải 1, lời giải 3 dẫn ra trước đây chỉ là trường hợp con của bài toán này. Nếu l = ½, tức các điểm lấy bên ngoài nằm trên đường tròn (lời giải 1) thì thay vào công thức ta được 1/3. Nếu l = ∞ thì:
,
đây cũng chính là lời giải 3. Khi l tiến đến vô cùng, các đường thẳng vẽ được thành song song nhau. Hai góc trên đều bằng không, nhưng tỷ lệ của chúng lại bằng ½.
Vì điểm ngoài vòng tròn là ngẫu nhiên, vậy xác suất trong trường hợp này là trung bình của tất cả các trường hợp của l (từ 1/3 đến ½). Nhưng vì l tiến về vô cùng thì xác suất bằng ½ nên xác suất trung bình cũng bằng ½.
2. Điểm bên ngoài và điểm bên trong: Lấy một điểm ngẫu nhiên bên ngoài đường tròn, sau đó lấy một điểm ngẫu nhiên khác trong vòng tròn. Nối chúng lại, dựng được một dây cung.
Tất cả những điểm trong vùng màu xanh thoả mãn điều kiện. Vậy xác suất dây cung lớn hơn cạnh tam giác sẽ không đổi dù điểm bên ngoài nằm ở đâu đi chăng nữa và bằng:
3. Điểm bên trong và thước vẽ: Lấy ngẫu nhiên một điểm trên mặt đường tròn, đặt cây thước vào điểm    đó vẽ ngẫu nhiên một đường thẳng cắt vòng tròn tạo thành một dây cung. Kể cả phương pháp đặt ngẫu nhiên thước kẻ vào vòng tròn và kẻ cũng là một dạng của phép lấy dây cung này.






Và xác suất bằng:
4. Hai điểm và nối: Lấy một điểm trên mặt đường tròn và một điểm bất kỳ. Nối chúng lại tạo một đường thẳng cắt đường tròn ta nhận đươc một dây cung. Nếu điểm ngẫu nhiên sau nằm ngoài vòng tròn thì phép thử này lại giống phép 1, bởi vì lúc đó tất cả các điểm quét hết các phần thoả mãn điều  kiện và không thoả mãn đến vô cùng. Lúc đó tỷ lệ của vô cùng với vô cùng bằng tỷ lệ các góc. Và điều này hoàn toàn trùng với phép chọn ngẫu nhiên 3.
Như vậy phép thử này phần điểm bên trong với điểm bên ngoài ta không cần xét nữa (ở trường hợp 3). Ta chỉ xét trường hợp: lấy ngẫu nhiên hai điểm trên mặt vòng tròn. Nối hai điểm lại thành đường thẳng cắt đường tròn, ta nhận được dây cung.
φ = 2arcsin(1/4l), α = π/2 – arcsin(1/4l), β = arcsin(1/4l) – π/6
Diện tích cung OAB = 1/4(arcsin(1/4l)-π/6), tổng diện tích hai tam giác ORA, ORB = ½lsin(arcsin(1/4l)-π/6)=1/16[sqrt(3)-sqrt(16l2-1)]. Diện tích cung RAB =1/4(arcsin(1/4l)-π/6)- 1/16[sqrt(3)-sqrt(16l2-1)]. Diện tích hai phần màu đỏ =π/4 – ½ arcsin(1/4l) – 1/8 sqrt(16l2-1). Vậy, diện tích phần màu xanh = 1/2arcsin(1/4l)+1/8sqrt(16l2-1). Xác suất để dây cung lớn hơn cạnh tam giác tại một l nào đó sẽ = [2arcsin(1/4l) +1/2sqrt(16l2-1)]/π. Lấy trung bình của các xác suất này trong toàn mặt đường tròn (phần diện tích tam giác nội tiếp, xác suất bằng 1), ta được xác suất cho các điểm l ngẫu nhiên sẽ là:

Những bài toán xác suất hình học rất thú vị và hóc búa. Chúng tôi xin giới thiệu với các bạn một bài toán khá hay sau:

Chia bánh dễ mà khó?

Thuở sinh viên ở đất nước Nga xa xôi, lạnh giá, vào những dịp Tết, lũ lưu học sinh chúng tôi hay quay quần bên nhau trò chuyện về bánh chưng, bánh tét và hầu hết những hoài nhớ quê hương. Có một giao thừa như thế, tác giả bài viết này khi nhìn cô bạn cắt bánh gatô mà nhớ về những ngày thơ ấu. Hồi đó, mỗi khi đi chợ về, má thường cho ba đứa trẻ chúng tôi khi cái bánh, khi cây kẹo. Anh Hai chia ra làm ba phần (theo trí nhớ của tôi là khá đều), nhưng cô em Út bao giờ cũng giãy nãy lên: “Các anh khôn lắm, toàn cho em phần nhỏ nhất thôi.”. Anh Hai lại cấu của mình cho Út một tý nữa. (Cái bánh có nhiều nhặn gì cho cam!!!. Chắc vừa đủ để anh em chúng tôi phân biệt được nó là loại bánh gì trong “kho tàng bánh” rất ư phong phú của Việt Nam ta. Các bạn thử nhớ lại xem, ai mà không từng gặp trường hợp này).
Trong giao thừa đó, chúng tôi có đưa ra bài toán:
Chia ngẫu nhiên một bánh hình vuông làm ba phần (các vết chia là đường thẳng). Tìm xác suất sao cho có ít nhất một phần nhỏ hơn ¼ cái bánh.
Bài toán vừa đưa ra đã gây nên một cuộc tranh luận sôi nổi. Một cô bạn nói: “Cho dù bạn có cắt bằng cách nào đi chăng nữa thì ta cũng có thể ép ba phần đấy lại thành một dây bánh dài. Vậy bài toán gần như tương đương với việc ép bánh lại và cắt. Lúc này, để tìm xác suất thì không khó”. Vâng, nếu như vậy thì quả là dễ. Bài toán cũng khá gần với bài toán bẻ que gỗ như ở trên.
 
Thế nhưng, có người phản bác lại: “Cách cắt bánh bằng các đường song song với cạnh hoàn toàn không đồng nhất với cắt bằng các đường song song ngẫu nhiên.”
Sau đó, bạn ấy suy luận như sau: “Bất kỳ phần nào được ép của bạn thành dây khi chia thì nó chính xác có một cách như thế được diện tích như thế. Nhưng khi chia bánh có dạng vuông (hay hình nào đó) thì cũng một diện tích như thế có nhiều cách cắt khác nhau. Và quan trọng, diện tích khác nhau thì số cách cắt khác nhau. Nên không thể dùng phương pháp này tính xác suất được. Cách tính này tương đương việc dùng các đường song song với một cạnh nào đấy của bánh để chia. Nhưng có thể dùng phương pháp này để dự đoán xác suất gần đúng.”. Người khác lại bảo: “Bánh được cắt ra thì phải có điểm cắt tại các cạnh. Vậy, các điểm trên chu vi của bánh có vai trò ngẫu nhiên như nhau. Ví dụ, ta xét bài toán “Chia ngẫu nhiên bánh hình vuông thành hai phần, tìm xác suất sao cho có một phần nhỏ hơn 1/3.”. Cho điểm ban đầu để cắt là A (bao giờ cũng phải có điểm ban đầu. Do đó xác suất có điểm A bằng 1). Ngoài ra, không mất tính tổng quát, ta có thể cho A chỉ nằm trên một nửa của cạnh đó, bởi vì nếu nằm ở nửa ngược lại thì ta cũng có bộ cách cắt giống y như vậy nhưng nằm đối xứng gương với bộ cách cắt khi A ở phía bên kia. Tổng các số điểm B trên chu vi bánh để có thể từ A cắt thành đường AB bằng 3 (cho cạnh bánh bằng 1). Việc chúng ta là tìm hàm xác suất theo thông số x (đoạn từ góc bánh đến A).
Từ hình 18, ta thấy nếu x<=1/3 thì xác suất sẽ là:
còn nếu x >1/3 thì xác suất bằng 7/9.
Ta lấy bình quân tất cả các xác suất này trong khoảng [0, ½], sẽ có được xác suất cần tìm. Còn bài toán hai nhát cắt cũng tương tự vậy, tuy có phức tạp hơn nhiều.”. Xác suất này bằng 0,773 trong khi nếu dùng cách ép và cắt thì xác suất sẽ là 0,667.
Ấy vậy mà, khi phân tích bài toán trên, chúng tôi nhận thấy rằng, cách cắt trên chỉ là một trong những cách suy diễn của động từ “chia” mà thôi. Tuy động từ “chia” nghe có vẻ êm ái vậy, nhưng trong trường hợp bài toán này, nó rất là thiếu sót. Cần phải thêm bổ từ trả lời cho câu hỏi “chia như thế nào?”. Cách giải trên, nghĩ kỹ chúng ta sẽ thấy nó giống như cách người ta cắt bánh chưng bằng lạt vậy. Một đầu dây lạt người ta tựa vào điểm ngẫu nhiên nào đấy trên một cạnh, còn đầu kia, người ta chọn bất kỳ điểm nào đó của ba cạnh còn lại để đặt vào. Sau đó luồn xuống dưới và rút. Sợi dây lạt sẽ cắt miếng bánh thành hai phần.
Còn cắt bằng dao thì để tạo vết cắt, người ta thường tỳ dao vào một điểm nào đó trên chu vi bánh, sau đó xoay dao rồi ấn xuống. Cái ngẫu nhiên tạo ra được do cách chọn điểm đặt dao A, C và cách xoay dao hay góc xoay dao.
Phương pháp chia bánh “bẻ” khác hơn: người ta đưa hai tay vào một điểm nào đấy trên mặt bánh, sau đó bẻ theo đường thẳng (cũng có góc xoay tay, ngay tại một chỗ ấn tay, cũng có nhiều cách nhận được đường thẳng “vết bẻ” khác nhau). Bẻ xong, chọn một trong hai (dĩ nhiên là ngẫu nhiên) và bẻ tiếp. Không giống như bằng lạt và dao, cách này cho phép vết hai bất kỳ ở đâu. Trong trường hợp lạt và dao, bánh để nguyên thì hai đường cắt không thể cắt nhau được vì như thế sẽ chia ra bốn phần chứ không phải là ba.
Mời các bạn tìm lời giải cho các cách cắt này. Mặc định rằng, các vết cắt vuông góc với mặt bánh.

Có Tứ quý hay biết bao nhiêu:

Không, xin các bạn đừng nghĩ đó là “Long, Ly, Quy, Phượng”. Xác suất của cái Tứ Quý này bằng không. Hay nói đúng hơn nó bằng không trong thế giới thực của chúng ta. Ngoài Quy ra, thì các con vật khác đều do trí tưởng tượng của con người tạo nên. Biết đâu…chúng tồn tại trong thế giới khác?!. Tôi muốn nói đến Tứ Quý trong bài Tây 52 con bài kia. Khi đánh bài Tiến lên, Binh…, chúng ta ai ai cũng mừng khi trong bài của mình có bốn cây giống nhau về chất, ví dụ như bốn cây A, bốn cây K hay thậm chí bốn cây 3. Chắc nhiều người trong chúng ta đã không ít lần đặt câu hỏi: Vậy xác suất của Tứ Quý ta có thể nhận được là bao nhiêu? Và chính xác hơn ta đặt bài toán như sau:
Chia bộ bài Tây 52 cây thành bốn tay bài. Tìm xác suất sao cho có ít nhất một tay bài có Tứ Quý.
“Có gì đâu!” có người nói, “ta cứ lấy một tay bài, vì xác suất có Tứ Quý trong các tay bài đều bằng nhau nên khi tính được xác suất một tay bài, ta nhân cho 4 thì được xác suất có ít nhất một tay bài có Tứ Quý.”. Sau đấy, bạn ấy trình bày cách như sau:
Xác suất một tay bài có Tứ Quý bằng xác suất tay bài đó có ít nhất một Tứ Quý trong 13 chất bài nhân cho 13. Bởi vì các xác suất có ít nhất Tứ Quý của một chất bài nào đó đều bằng nhau. Vậy có bao nhiêu cách để chia bài cho một tay bài:
Có bao nhiêu cách có ví dụ như Tứ Quý A:
Vậy xác suất có ít nhất Tứ Quý A bằng 0,002641. Và xác suất có một Tứ Quý của bất kỳ một chất nào đó ở cả bốn tay bài bằng: 0,1373. Tức là cứ 7 lần chia sẽ có ít nhất một lần có Tứ Quý.
Các bạn thân mến! Chúng ta dễ thấy trong lập luận trên có hai điểm không đúng:
Thứ nhất: Nếu tính xác suất của tay bài có ít nhất một Tứ Quý bằng 13 xác suất có ít nhất Tứ Quý A, ta thấy có điểm vô lý. Ví dụ khi ta tính có ít nhất Tứ Quý A thì ta đã quét hết các trường hợp có Tứ Quý A kể cả trường hợp vừa có Tứ Quý A vừa có Tứ Quý K. Đến khi cộng thêm các cách có Tứ Quý K vào ta lại một lần nữa tính các trường hợp vừa có Tứ Quý K vừa có Tứ Quý A.
Thứ hai: Tương tự như trên, ta không thể tính xác suất có Tứ Quý của bốn tay bài bằng bốn lần xác suất một tay bài. Bởi vì, khi tính tất cả các trường hợp có Tứ Quý A ở tay bài 1 đã tính trường hợp có xác suất Tứ Quý K ở tay bài 2. Nhưng đến khi tính tất cả trường hợp có Tứ Quý ở bài 2 đã tính luôn trường hợp có Tứ Quý A ở bài 1. Vậy ta tính thành ra hai lần.
Để giải bài này, ta vận dụng biểu đồ Venn. Ví dụ ta có ba tập hợp A, B, C. Tính tập AUBUC.

\


Theo biểu đồ ta có thể tính được:
AUBUC=A + B + C - A∩B - A∩C - B∩C + A∩B∩C
Các bạn có thể tổng quát hoá lên cho n tập:
A1UA2U….UA= ∑Ai - ∑Ai∩Aj + ∑Ai∩Aj∩Ak - ∑Ai∩Aj∩Ak∩Am + …..+(-1)n+1∑A1∩A2…∩An
Vận dụng vào bài toán trên, ta gọi:
Ai: tập các trường hợp có ít nhất Tứ Quý i cho cả bốn tay bài.
Ai∩Aj: tập các trường hợp có ít nhất Tứ Quý i và j cho cả bốn tay bài.
….
A(12,i): tập các trường hợp có ít nhất 12 Tứ Quý trừ Tứ Quý i cho cả bốn tay bài.
Với 11=J, 12=Q, 13=K.
Ta có thể chứng minh được, trong mỗi tầng kết hợp các tập bằng nhau: Ví dụ A1=A2=…=A13,
A1∩A2=A2∩A3=….
Lại thấy, mỗi lần chia ta nhận được bốn tay bài và chúng có thể hoán cho nhau thành 4! cách. Nên ta chỉ lấy một cách là đủ (bất kỳ trạng thái nào của bốn tay bài đều có 4! cách hoán vị như vậy.). Bởi vậy, số trường hợp thật sự khác nhau khi chia 52 cây bài thành 4 sẽ là:
Ta tính tất cả trường hợp có ít nhất một Tứ Quý X nào đó:
∑(1 Tứ Quý):
Cách tính của bạn kia chính là lấy: ∑(1 Tứ Quý) chia cho tổng các trường hợp.
Tiếp tục, ta tính cho có ít nhất hai Tứ Quý X và Y nào đó:
Cách sắp xếp giữa X và Y sẽ là: X, Y cùng một tay bài, X, Y ở hai tay bài khác nhau:
Có 12x13/2=78 cách cho hai Tứ Quý khác nhau. Suy ra,∑(2 Tứ Quí) bằng:
Chỉ số này chỉ làm giảm xác suất như đã tính xuống: 0,0096 thành 0,1277. Không đáng kể, và các thành phần sau còn nhỏ hơn rất nhiều. Nếu có nhã hứng, các bạn có thể tính cho trường hợp có 3 Tứ Quý và 4 Tứ Quí. Nhưng những thành phần này không đóng góp nhiều lắm để thay đổi xác suất nói trên. Chúng ta nhận thấy rằng, tuy cách ban đầu có sai sót, nhưng nó cũng rất gần với kết quả thật. Bởi vì, xác suất có hai tứ quí trong một lần chia bài rất nhỏ (1 trên 100). Và Tứ Quý hoàn toàn không khó như nhiều người lầm tưởng.[3], [4]


1. Thực tế, ta không cần phải vẽ hình phức tạp làm gì. Ta thấy, khi bẻ nhát đầu tiên, có thể điểm bẻ nằm ở bất kỳ ở đâu trên que, nhưng không mất tính tổng quát ta cho nó nằm ở nửa bên trái. Vì nếu nằm bên phải cũng là th đối xứng gương mà thôi. Gọi x là độ dài đoạn nhỏ, x nằm trong khoảng[0,1/2], P(1-x)-xác suất bằng cách nào đó ta chọn được đoạn lớn để bẻ tiếp theo.

Vậy xác suất bẻ hai lần để tạo được tam giác tại một giá trị x bằng P(1-x)x/(1-x). Lấy trung bình đại lượng này trong khoảng [0,1/2] ta được xác suất cần tìm.
Trong trường hợp máy chặt, ta có P(1-x)=1-x. Suy ra xác suất bằng:
Còn trường hợp bẻ P(1-x)=1/2, và xác suất như đã tính.
2. Nếu người bẻ lẫn lộn lung tung khi thả phần nào và cầm lại bẻ tiếp phần nào thì trên nguyên tắc xác suất bẻ được phần lớn hơn cũng chính là xác suất chọn một trong hai.
3. Tôi sẽ viết một bài về các trò chơi bài Tây 52 lá. Trong đó, nói cụ thể các vấn đề này hơn.
4. Sẽ có bạn hỏi “Thế, tác giả bài viết có chui vào bẫy không?”. Có, rất nhiều lần. Nhưng chúng tôi muốn nói các bạn rằng, những cạm bẫy là những hoa văn tuyệt mỹ tô điểm cho bức tranh xác suất tổng thể càng lung linh, càng huyền ảo hơn. Và chúng tôi bị mê hoặc bởi chúng. Cũng rất vui sướng vì điều đó.



Dưới đây là quy trình của một cuộc nghiên cứu, bất luận lĩnh vực- quy mô thì nó cũng trải qua đầy đủ các bước

  • B1: Xác định vấn đề nghiên cứu
  • B2: Xác định mục tiêu nghiên cứu
  • B3: Thiết kế dự án- lập kế hoạch
  • B4: Thu thập dữ liệu
  • B5: Kiểm tra
  • B6: làm sạch, mã hóa
  • B7: Phân tích, báo cáo


Trong trường hợp cần chúng tôi hỗ trợ 01 hay nhiều công đoạn- để tạo điều kiện thuận lợi nhất vui lòng gửi toàn bộ các tài liệu liên quan tới các công đoạn trước cho chúng tôi.
***********************************
Các bạn đang xem bài viết tại website XỦ LÝ SỐ LIỆU- Một dịch vụ của Antsmrg
ANTS là nhóm chuyên cung cấp dịch vụ nghiên cứu xã hội- thị trường cho các tổ chức và các nhân ở mọi quy mô. Các dịch vụ của chúng tôi bao gồm
  • Tư vấn, thiết kế nghiên cứu
  • Thiết kế bảng hỏi, thu thập số liệu
  • Phân tích, báo cáo
Đối với dịch vụ XỬ LÝ SỐ LIỆU, chúng tôi cung cấp các gói dịch vụ liên quan
Mọi yêu cầu, thắc mắc vui lòng gửi lại thông tin cho chúng tôi tại mục "Liên hệ với chúng tôi" tại cuối website này.
+++++++++++++++++++++++++++++++