Здравствуйте, гость Правила · Помощь

»  Клуб интеллектуалов?, немного внимания Подписаться | Сообщить другу | Версия для печати
      » 28/05/2014, 20:43,  Злодейчик 
БигДжордж имел ввиду наверно другое. Программа после 130 начинает валить не только его, а любого игрока.
В другой ветке форума я спрашивал БигДжорджа, как включается кнопка "загнобить игрока", автоматически по каким-то собственным соображениям, или кем-то из админов. Он ответил, что не знает ответа на этот вопрос. Он уверен только в существовании самой кнопки.

Пока мы тут играем в недопреферанс, БигДжордж изучает зависимости включения/выключения этой кнопки. Вот где НАСТОЯЩАЯ МАТЕМАТИКА! Для нас, непросвещенных же старается человек, а мы его игнорируем, да еще и стебаемся над его опусами.


      » 28/05/2014, 22:46,  Pochemuk 
2 Меф:

Вот, честное слово, не знаю, как можно применить теорему Байеса для потверждения/опровержения "кнопочной гипотезы". Но, в принципе, в преферансе ее применять наверняка есть где.

Прежде всего она применяется для оценки вероятности гипотезы в условиях противоречивых критериев. Например, в Байесовской фильтрации спама.
Вот, допустим, дано слово VIAGRA. Ивестно, что оно может встречаться в спаме, а может и не встречаться. В то же время оно может встречаться или не встречаться в нормальных сообщениях. Имеем 4 разных ситуации:
1. Слово присутствует в спаме.
2. Слово присутствует в не спаме.
3. Слово отсутствует в спаме.
4. Слово отсутствует в не спаме.
Но ситуация 3 дополняет 1, а 4 дополняет 2. Так что можно обойтись двумя первыми.
Вот и берут слова из подозрительного письма и анализируют их совокупность.

Так вот, эти ситуации взаимопротиворечащие. Письмо, содержащее слово VIAGRA может быть как спамом, так и не спамом. Но частота этих ситуаций различна. Вот на основании этих пар частот (для каждого слова - своих) и вычисляется вероятность того, что письмо - спам. Если письмо содержит много слов, которые часты в спаме и редки в обычных письмах, то это письмо с большой вероятностью - спам.

Где может это быть применено в преферансе? Например, при создании и обучении алгоритма "вистователя".
Вот вистовал алгоритм шестерные и в 75% удачно, а в 25% сам садился "без 1". В удачных случаях у него был второй козырный король в 10%, а в неудачных - в 5%. Какова вероятность отвистоваться удачно, если опять придет второй козырный король?

P=(0.75*0.1)/(0.75*0.1+0.25*0.05)=0.86

Допустим, завистовали и опять сели. На основе новой полученной информации скорректировали частоты. И степень нашей уверенности в необходимости вистования тоже изменилась. И так, начиная с редких событий, постепенно будем корректировать свой опыт.

Разумеется, критериев должно быть больше. Да и ситуаций. Например, еще: "Ушел за свои и выпустил сидящего без разу".

Не уверен, что такое обучение будет эффективным и к чему-то приведет. Но я просто продемонстрировал область возможного применения формулы Байеса.

Это сообщение отредактировал Pochemuk - 28/05/2014, 22:51
      » 28/05/2014, 23:01,  Меф 
Pochemuk ("28/".$m["май"]."/2014," 22:46)
2 Меф:

Вот, честное слово, не знаю, как можно применить теорему Байеса для потверждения/опровержения "кнопочной гипотезы".

...

Но я просто продемонстрировал область возможного применения формулы Байеса.

Да забудьте Вы о той кнопке - пусть ото голова болит у клиента.


Применимость Байевских методов для оценки карты и принятия решений Игроком. Вот о чём я спрашивал.
Игрок должен принимать решения не по вероятности (частотной) - не опираясь лишь на вероятность, - если он в данном конкретном случае располагает дополнительной информацией, которая верна с некой степенью достоверности, то вероятность события меняется.
Это, например, могут быть пристрастия парта по висту или какие-нибудь его особенности. Или особенности игры в распасах. И т.д., и т.п..
Вот Юра (Байкер) писал, что знание особенностей игроков может принести дивиденды, но они малы, ибо математика рулит. Так вот оказывается, что математика-таки рулит, но дивиденды могут быть значительно больше. smile.gif

Очень толково то, что я написал выше, объяснено вот ЗДЕСЬ - я уже давал эту ссылку ранее, посмотрите страницу № 6 (по тексту книги стр.72) и задачу о сигнализации, землетрясениях и ворах.

Это сообщение отредактировал Меф - 28/05/2014, 23:06
      » 28/05/2014, 23:12,  Pochemuk 
Меф ("28/".$m["май"]."/2014," 23:01)
Игрок должен принимать решения не по вероятности (частотной) - не опираясь лишь на вероятность, - если он в данном конкретном случае располагает дополнительной информацией, которая верна с некой степенью достоверности, то вероятность события меняется.
Это, например, могут быть пристрастия парта по висту или какие-нибудь его особенности. Или особенности игры в распасах. И т.д., и т.п..

Как формализовать эти пристрастия и особенности и каким боком впихнуть их в формулу Байеса - понятия не имею. Но вот корректировать вероятности принятия решений - может получится. Другое дело, что человек часто делает корректировку резко и переключается как бы на другой режим, а алгоритм будет накапливать поправки постепенно.

Впрочем, да ... если замечено, что на пасах, например, слишком часто не добирает масть, то это может быть учьено в фБ.
      » 29/05/2014, 11:19,  Pochemuk 
Увлекло ... Решил чуток подумать, но так и не смог решить, есть ли какая-то практическая польза от формулы Байеса в префе. Именно конкретно практическая, позволяющая производить "на лету" революционные корректировки.

Во-первых, формула Байеса все равно опирается на априорные вероятности, которые надо точно так же вначале рассчитать (если они не зависят от действий оппонентов) или получить эмпирическим путем на основе длительных наблюдений за игрой оппонента (если зависят).
Если же нам ничего из этого не известно, то по формуле Байеса мы можем только делать весьма грубые уточнения к вероятности встречи динозавра. А тем временем набирать опыт статистику, которые позволят нам уйти от динозавровой вероятности к реальной.

Во-вторых, даже рассчитав или получив априорные вероятности, заставить работать формулу Байеса удастся далеко не всегда.

Это лучше на примере:

Допустим, априорно стало известно про мизерящего, что он оставляет из {Т 7}{9} туза с вероятностью P. А с вероятностью 1-P девятку.
Так же стало известно про него, что он (если оставил туза - условная вероятность) рискует и не перехватывает с вероятностью Q.

Какова вероятность оставления туза, если он не перехватил?
Тут я очень упростил задачу, не указав вероятную длину паровоза. А это является ОЧЕНЬ существенным моментом. Но решил не усложнять.

Так вот, по формуле Байеса, вероятность оставления туза (если перехват не выполнен) вычисляется так:

T = P*Q / (P*Q + 1*(1 - P))

Можно составить табличку значений и обнаружим вот что:

1. Если P<0.5, то знание Q (а так же информация о том, что перехвата не было) нам ничего не дает. T остается так же меньше 0.5.
2. Если P близко к единице (априорно известно, что мизерящий предпочитает оставить туза на перехват), то формула может скорректировать T до величин меньших 0,5 только в случае, если он предпочитает рисковать и не перехватывать очень редко. Но это и так ловцу-человеку (а не автомату) понятно - зачем иначе априорно (очень часто) оставлять туза, если не перехватывать? Так что, если такой мизерящий не перехватывает, то почти наверняка у него туза и нет.
3. И только при 0.5<P<1 и Q<(1-P)/P формула Байеса способна скорректировать вероятности так, то T станет меньше 0.5, хотя P>0.5 ...

Выводы:

1. Формула Байеса способна работать и корректировать значения вероятности до значений, способных переменить решение. Но не во всех случаях.

2. Для работы формулы Байеса нам в любом случае требуются расчетные или эмпирические знания тех или иных частот. А то и нескольких.

Кстати, при обучении Байесовских фильтров вначале полагают неизвестные априорные вероятности равными 0.5. Такое вот правило Динозавра в действии. Такие фильтры даже имеют специфическое название - наивные. И толку от них - практический ноль. А затем, по мере обучения, априорные вероятности корректируются, что позволяет им работать гораздо точнее.
      » 29/05/2014, 12:47,  aps 
Злодейчик ("28/".$m["май"]."/2014," 21:43)
БигДжордж имел ввиду наверно другое. Программа после 130 начинает валить не только его, а любого игрока...

А откуда же тогда взялось +1500 игроков с рейтом выше 150 (включая и ОМБ)? unsure.gif Кривую программу сляпали, видимо biggrin.gif excl.gif

Это сообщение отредактировал aps - 29/05/2014, 12:51
      » 29/05/2014, 13:10,  Антипруль 
aps ("29/".$m["май"]."/2014," 12:47)

А откуда же тогда взялось +1500 игроков с рейтом выше 150 (включая и ОМБ)?  unsure.gif Кривую программу сляпали, видимо  biggrin.gif  excl.gif

Просто эти +1500 и более игроков "понятиев" не имеют что такое "настоящий преферанс" biggrin.gif laugh.gif biggrin.gif
      » 29/05/2014, 13:32,  Pochemuk 
P.S. К формуле Байеса.

Интересный парадокс обнаружил. Оказывается, многие знания могут помешать получать скорректированную информацию. Пример:

Как выше я писал, скорректированное после пропуска взятки значение вероятности оставленного туза равно T = P*Q / (P*Q + 1*(1 - P)).
Т.е., если известна достоверность Q гипотезы "мизерящий никогда не перехватывает тузом, даже если он оставлен", то результирующая вероятность T отличается от априорной вероятности оставления туза P.

Предположим, нам известно, что Q=0, т.е. гипотеза о рискованных постоянных пропусках не верна. Мизерящий на самом деле никогда не рискует и перехватывает, если есть чем.
Тогда при любом P<1 получим T=0. Т.е., если мизерящий не перехватил, то ему и в самом деле перехватывать нечем. И ловить надо девятку.

Казалось бы, все правильно. Четкие и конкретные сведения о манере игры дали нам столько дополнительной информации, что позволили получить нам однозначно определенный ответ.

Но теперь рассмотрим другую крайность: нам достоверно известно, что мизерящий, действительно, постоянно пропускает семеркой, даже если туз оставлен. Т.е. Q=1.
Тогда по формуле Байеса получаем T=P/(P+1-P)=P. Т.е. в этом случае абсолютно достоверной дополнительной информации оказалось недостаточно, чтобы изменить априорную вероятность даже на малую величину.

Результаты формул верные. А вот сам вывод парадоксальный.

aps ("29/".$m["май"]."/2014," 12:47)
А откуда же тогда взялось +1500 игроков с рейтом выше 150 (включая и ОМБ)?  unsure.gif Кривую программу сляпали, видимо  biggrin.gif  excl.gif

А что это мы все о теорвере? Давайте поговорим за квантовую физику.

Все дело в том, что "кнопка" в виртуальном континууме имеет волновую природу. Которая, взаимодействуя с волновыми характеристиками корпускул smile.gif пользователей, образует сложную инфернальную интерференционную картину, характеризующуюся наличием потенциальных барьеров.
Вот один из таких барьеров и находится в районе 130 единиц, отталкивая неосторожно приблизившихся к нему.
Но если игрок запредельными усилиями, помолясь какой-то матери, преодолевает этот потенциальный барьер при помощи туннельного эффекта (в мире виртуальных частиц игроков это вполне возможно), то дальше ему обеспечен неуклонный рост рейтинга до следующего потенциального барьера.
Только бывает, что следующий барьер так оттолкнет частицу игрока, что он по инерции ниже предыдущего барьера скатится. Да еще такая энергия при этом высвободится, что этот нижний барьер преодолеют аж два других игрока.
Вот так и обеспечивается инфляционное раздувание Вселенной рейтинга smile.gif

Это сообщение отредактировал Pochemuk - 29/05/2014, 14:50
      » 29/05/2014, 14:38,  Haoc 
Да, к слову, самый хороший аргумент в пользу "химии" - это то, что не используется физический ГСЧ. В случае использования последнего все вопросы снялись бы сами собой.

Это сообщение отредактировал Haoc - 29/05/2014, 14:45
      » 29/05/2014, 15:00,  Dukhin 
понеслась )
« Предыдущая тема | Перечень тем | Следующая тема »
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей: