Что это я все про зло да про зло, напишу-ка я о чем нибудь добром. О теории вероятностей, например (предупреждаю, дальше будет матан, не математически настроенным дальше будет неинтересно)
Есть в математике такое
правило следования Лапласа. Объясню вкратце: пусть у нас имеется неведомая хрень, про которую только известно, что если ее потрясти, то она выдаст ответ либо "да" либо "нет" и что ответы выпадают независимо друг от друга. Обычно представляют себе хитрогнутую монету или огромное ведро с черными и белыми шарами (неизвестно сколько каких). Это по вкусу.
И вот мы взяли эту неведомую хрень. потрясли 5 раза и из них 2 раза получили ответ "да". Спрашивается, с какой вероятностью в следующий раз выпадет опять "да"?
Неправильны очевидный ответ: 2/5 Неочевидный правильный: (2+1)/(5+2) = 3/7 В этом и есть правило Лапласа.
Точнее: пусть у нашего генератора равноемерное априорное распределение вероятностей. То бишь шансы то, что вероятность успеха равна 10% равноа шансам того, что вероятност равна 25% или 100% (да. в ход идут вероятности вероятностей). Если у нас сделано N испытаний и из них M испытаний успешно, то вероятность успеха при следующем испытании ("наилучшая оценка") равна (M+1)/(N+2)
Примечание: В неправильности наивного ответа можно легко убедиться, если взглянуть на предельный случай N=1. Мы потрясли один раз, получили ответ "да". И что теперь? У нас в следуюший раз "да" выпадет с вероятностью 1/1=1? И так у нас всю жизнь теперь "да" будет? (спасибо
kobak за пример)
Во-как. Стандартное доказательство можно прочитать либо в статье в википедии выше (на английском), либо
тут на русском. Но, сказать. по чести оно мне не нравится. там матан, факториалы и ничего не понятно. То есть все вроде правильно, но хотелось бы чего-то более очевидного. Правило-то по сути простое. Неужели без интегралов нельзя понять откуда берутся эти лишние единицы?
Ну вот думал я думал и придумал (дальше мое лично творчество. безошибочность не гарантирую)
Как мы может смоделировать нашу неизвестную хрень с равномерным распределением? Вот как: берем случайное число x от 0 до 1 Это будет наша вероятность успеха. Испытателю мы ее не сообщаем, а запоминаем внутри генератора. Теперь начинаем делать собственно испытания. Для каждого испытания i мы берем другое случайное число y_i, тоже от 0 до 1 Если оно меньше или равно x то возвращаем "успех", иначе говорим "неудача"
Если вдуматься, построенный нами прибор функционально совершенно аналогичен неизведанной хрени в условиях. Если бы мне задали смодерировать хрень на компе, то я, собственно, именно так бы ее и запрограммировал.
Теперь пусть у нас уже такая ситуация: мы сделали N испытаний, получили M "успехов" и теперь собираемся сделать N+1ое испытание. Что у нас творится внутри смоделированной хрени? Рассмотрим на примре, приведенном выше, где N=5, M=2
Внутри хрени теперь есть число
x и числа
y1,
y2...
y5 Все они сгенерированы совершенно одинаковым способом - случайно выбраны из интервала [0,1]
Теперь хитрый трюк. Мы замечаем, что если мы повторим наш эксперимент (все N испытаний) многократно, эти числа по величине могут идти в любом порядке. Если. как в примере выше, M=2 N=5 то
возможно , что
y1 <
y3 <
x <
y2 <
y5 <
y4или
y5 <
y2 <
x <
y1 <
y4 <
y3или
y3 <
y2 <
x <
y4 <
y1 <
y5итп
- вероятность одна и та же
Единственное ограничение. что у нас должно быть M=2 успехов. То есть, левее
x имеем 2 числа, а правее, соотвественно, 3
Если мы пересортируем все
у в порядке возрастания и переименуем в
y' то у нас будет
y'1 <
y'2 <
x <
y'3 <
y'4 <
y'5Идем дальше, и добваляем новое число
y6. На него у нас никаких ограничений нет. Оно может быть левее всех сгеренереных чисел, правее всех или стоять между какими-то двумя. Иными словами мы можем одинаково ожидать, что
y6 попадет в интервал
0...
y'1,
y'1...
y'2 ,
y'2...
x,
x...
y'3,
y'3...
y'4,
y'4...
y'5 или же
y'5...1 Всего 7 интервалов.
Из этих интервалов 3, а именно 0...
y'1,
y'1...
y'2 ,
y'2...
x соответствуют "успеху". а остальные "неудаче" Итого вероятность 3/7
Что и требовалось.
Надо сказать, что обосновать правильность рассуждения, так чтоб было абсолютно очевидно, что оно действительно правильно, до конца у меня не получается. Видимо, чего-то недопонимаю. Тервер это такая засада...
По мотивам
старого треда у
plakhov a