Вконтакте Facebook Twitter Лента RSS

Простейшие понятия теории вероятностей. Теория вероятностей и основные понятия теории

но и всех дальнейших

наблюдённые частоты стабилизируются,

при

Какового практическое применение методов теории вероятностей?

Практическое применение методов теории вероятностей заключается в пересчёте вероятностей «сложных» событий через вероятности «простых событий».

Пример. Вероятность выпадения герба при однократном подбрасывании правильной монеты равна ½ (к этому числу стремится наблюдённая частота выпадения герба при большом количестве бросаний). Требуется найти вероятность того, что при трёх бросаниях правильной монеты выпадет 2 герба.

Ответ: на этот вопрос даёт формула Берулли:

0.375 (т.е такое событие бывает в 37,5 % случаев при 2 –ух бросаниях правильной монеты).

Характерной особенностью современной теории вероятностей является тот факт, что несмотря на свою практическую направленность, в ней используют новейшие разделы почти всех разделов математики.

Основные понятия: генеральная и выборочная совокупность.

Привем таблицу соотнесения основных понятий генеральной совокупности и выборки.

Генеральная совокупность Выборочная совокупность
Случайная величина (x, h, z) Признак (x, y, z)
Вероятность p, p ген Относительная частота p, p выб
Распределение вероятностей Частотное распределение
Параметр (характеристика вероятностного распределения) Статистика (функция от выборочных значений признаков), служит для оценки того или иного параметра генерального вероятностного распределения
Примеры параметров и отвечающих им статистик
Одномерные случайные величины (одномерные распределения)
Математическое ожидание (m, Мx) Среднее арифметическое (m, )
Мода (Мо) Мода (Мо)
Медиана (Ме) Медиана (Ме)
Среднее квадратическое отклонение (s)
Дисперсия (s 2 , Dx) Дисперсия (s 2 , Dx)
Двумерные случайные величины (двумерные распределения)
Коэффициент корреляции r(x, h) Коэффициент корреляции r (x, y)
Многомерные случайные величины (многомерные распределения)
Коэффициенты уравнения регрессии b 1 ,b 2 ,…,b n Коэффициенты уравнения регрессии b 1 , b 2 , … , b n

Дисперсионный анализ

План лекции.

1. Однофакторный дисперсионный анализ.

Вопросы лекции.

Коэффициент корреляции

Принимает значения в диапазоне от -1 до +1

Безразмерная величина

Показывает тесноту связи (связь как синхронность, согласованность ) между признаками

Коэффициент регрессии

Может принимать любые значения

Привязан к единицам измерения обоих признаков

Показывает структуру связи между признаками: характеризует связь как зависимость, влияние, устанавливает причинно-следственные связи.

Знак коэффициента говорит о направлении связи

Усложнение модели

Совокупное влияние всех независимых факторов на зависимую переменную не может быть представлено как простая сумма нескольких парных регрессий.

Это совокупное влияние находится более сложным методом - методом множественной регрессии.

Этапы проведения корреляционного и регрессионного анализа:

· Выявление наличия взаимосвязи между признаками;

· Определение формы связи;

· Определение силы, тесноты и направления связи.

Задачи,решаемые после прочтения данной лекции:

Можно выписывать уравнения прямой и обратной регрессий для данных величин. Строить соответствующие графики. Находить коэффициент корреляции рассматриваемых величин. По критерию Стьюдента проверять гипотезу о существенности корреляционной связи. Пользуемся командами: ЛИНЕЙН и Мастер диаграмм в Excel.

Литература.

1. Конспект лекций.

  1. Гмурман, В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 2003. - 479 с.

1.8. Основные понятия планирования эксперимента и некоторые рекомендации

План лекции.

1. Планирование эксперимента: основные этапы и принципы.

2. Понятие эксперимента, отклика, поверхности отклика, факторного пространства.

3. Определение цели планирования эксперимента.

4. Основные этапы планирования:

Вопросы лекции:

1. Основные понятия. Постановка задачи.

Планирование эксперимента – это оптимальное (наиболее эффективное) управление ходом эксперимента с целью получения максимально возможной информации на основании минимально допустимого количества данных. Под самим же экспериментом понимаем систему операций, действий или наблюдений, направленных на получение информации об объекте.

Теория планирования эксперимента предполагает наличие определенных знаний и условно можно выделить следующие этапы планирования:

1) сбор и первичная обработка статистических данных

2) определение точечных и интервальных оценок распределения

3)и последующая их обработка, что предполагает знание статистических методов измерений случайной величины, теории проверки статистических гипотез, методов планирования эксперимента, в частности, пассивного эксперимента, методов дисперсионного анализа, методов поиска экстремума функции отклика;

2) составление плана эксперимента, проведение самого эксперимента, проведение обработки результатов эксперимента, оценка точности эксперимента.

Итак, дадим понятие самого эксперимента.

Эксперимент. Эксперимент является основным и наиболее совершенным методом познания, который может быть активным или пассивным.

Активный – основной вид эксперимента, который проводится в контролируемых и управляемых условиях, имеющих следующие преимущества:

1) результаты наблюдений независимые нормально распределенные случайные величины;

2) дисперсии равны друг другу (вследствие того, что выборочные оценки являются однородными);

3) независимые переменные измеряются с малой погрешностью в сравнении с погрешностью значения y ;

4) активный эксперимент лучше организован: оптимальное использование факторного пространства позволяет при минимальных затратах получить максимум информации про изучаемые процессы или явления.

Пассивный эксперимент не зависит от экспериментатора, который в данном случае выступает сторонним наблюдателем.

При планировании эксперимента исследуемый объект представляется в виде «черного ящика», на который воздействуют управляемые и неуправляемые факторы:

тут - управляемые факторы; - неуправляемые факторы, - параметры оптимизации, которые могут охарактеризовать работу объекта.

Факторы. Каждый фактор может принимать определенное количество значений называемых уровнями факторов. Множество возможных уровней фактора называется областью определения фактора, которые могут быть непрерывными или дискретными, ограниченными и неограниченными. Факторы могут быть:

- совместимыми: предполагается допустимость любой комбинации факторов, которая не должна влиять на сохранение изучаемого процесса;

- независимыми: между факторами должна отсутствовать корреляционная связь, то есть имеется возможность изменять значение каждого из рассматриваемых в системе факторов независимо друг от друга. Нарушение хотя бы одно­го из этих требований приводит либо к невозможности применения планирования эксперимента, либо к весьма серьезным трудностям. Правильный выбор факторов позволяет четко задавать условия опыта.

Исследуемые параметры должны удовлетворять ряду требований:

- эффективность, способствующая скорейшему достижению цели;

- универсальность, характерная не только для исследуемого объекта;

- статистическая однородность, предполагающая соответствие с точностью до погрешности эксперимента определенному набору значений факторов определенного значения фактора ;

- количественное выражение одним числом;

- простота вычислений;

- существование при любом состоянии объекта.

Модель . Зависимость между выходным параметром (откликом) и входными параметрами (факторами) называется функцией откли­ка и имеет следующий вид:

(1)

Тут - отклик (результат эксперимента); - незави­симые переменные (факторы), которые можно варьировать при постановке экспериментов.

Отклик. Отклик – это результат опыта в соответствующих условиях, который также называют функцией цели, критерием эффективности, критерием оптимальности, параметром оптимизации и др.

В теории планирования эксперимента к параметру оптимизации предъявляются требования, выполнение которых необходимо для успешного решения задачи. Выбор параметра оптимизации должен базироваться на четко сформулированной задаче, на ясном понима­нии конечной цели исследования. Параметр оптими­зации должен быть эффективным в статистическом смысле, то есть определяться с достаточной точностью. При большой ошибке его определения необходимо увеличивать число параллельных опытов.

Желательно, чтобы параметров оптимизации было как можно меньше. Однако не следует добиваться уменьшения числа параметров оптимизации за счет полноты характеристики системы. Желатель­но также, чтобы система во всей полноте характеризовалась просты­ми параметрами оптимизации, имеющими ясный физический смысл. Естественно, что простой, с ясным физическим смыслом параметр оптимизации защищает экспериментатора от многих ошибок и избавляет его от многих трудностей, связанных с решением различных методических вопросов экспериментирования и технологиче­ской интерпретации полученных результатов.

Геометрический аналог параметра (функции отклика), соответствующий уравнению (1), называется поверхностью отклика, а пространство, в котором строят указанную поверхность,- факторным пространством. В простейшем случае, когда исследу­ется зависимость отклика от одного фактора, поверхность откли­ка представляет собой линию на плоскости, то есть в двухмерном пространстве. В общем случае, когда рассматриваются факто­ров, уравнение (1) описывает поверхность отклика в - мерном пространстве. Так, например, при двух факторах факторное пространство представляет собой факторную плоскость.

Целью планирования эксперимента является получение математической модели исследуемого объекта или процесса. При весьма ограниченных знаниях о механизме процесса аналитическое выражение функции отклика неизвестно, поэтому обычно используют полиномиальные математические модели (алгебраические полиномы) называемые уравнениями регрессии, общий вид которых:

(2)

где – выборочные коэффициенты регрессии, которые можно получить, пользуясь результатами эксперимента.

4. К основным этапам планирования эксперимента можно отнести:

1.Сбор, изучение, анализ всех данных об объекте.

2. Кодирование факторов.

3. Составление матрицы планирования эксперимента.

4. Проверка воспроизводимости опытов.

5. Расчет оценок коэффициентов регрессионного уравнения.

6. Проверка значимости коэффициентов регрессии.

7. Проверка адекватности полученной модели.

8. Переход к физическим переменным.

Литература

1. Конспект лекций.

4.1 Цепи Маркова. Случайные функции. Метод Монте - Карло. Имитационное моделирование. Сетевое планирование. Динамическое и целочисленное программирование

План лекции.

1. Методы Монте-Карло.

2. Метод статистических испытаний (методы Монте-Карло)

Вопросы лекции.

Что изучает теория вероятностей?

Теория вероятностей изучает так называемые случайные события и устанавливает закономерности в проявлении таких событий, можно сказать, что теория вероятностей является разделом математики, в котором изучаются математические модели случайных экспериментов, т.е. экспериментов, исходы которых нельзя определить однозначно условиями проведения опыта.

Для введения понятия случайного события необходимо рассмотреть некоторые примеры реальных экспериментов.

2. Дать понятие случайного эксперимента и привести примеры случайных экспериментов.

Приведем примеры случайных экспериментов:

1. Однократное подбрасывание монеты.

2.Однократное подбрасывание игральной кости.

3. Случайный выбор шара из урны.

4. Измерение времени безотказной работы электрической лампочки.

5. Измерение числа вызовов, поступающих на АТС за единицу времени.

Эксперимент является случайным, если нельзя предсказать исход не только первого опыта, но и всех дальнейших . Например, проводится некоторая химическая реакция, исход которой неизвестен. Если её один раз провести и получить определённый результат, то при дальнейшем проведении опыта в одних и тех же условиях случайность исчезает.

Примеров такого рода можно привести сколь угодно много. В чём же состоит общность опытов со случайными исходами? Оказывается, несмотря на то, что результата каждого из перечисленных выше экспериментов предсказать невозможно, на практике для них уже давно была замечена закономерность определённого вида, а именно: при проведении большого количества испытаний наблюдённые частоты появления каждого случайного события стабилизируются, т.е. всё меньше отличаются от некоторого числа, называемого вероятностью события.

Наблюдённой частотой события А () называется отношение числа появлений события А () к общему числу испытаний (N):

Такое свойство устойчивости частоты позволяет, не имея возможности предсказать исход отдельного опыта достаточно точно прогнозировать свойства явлений, связанных с рассматриваемым опытом. Поэтому методы теории вероятностей в современной жизни проникли во все сферы деятельности человека, причём не только в естественнонаучные, экономические, но и гуманитарные, такие, как история, лингвистика и т.д. На этом подходе основано статистическое определение вероятности .

при (наблюденная частота события стремится к его вероятности при росте количества опытов, то есть при n ).

Однако определение вероятности через частоту не является удовлетворительным для теории вероятностей как математической науки. Это связано с тем, что практически нельзя провести бесконечное число испытаний и наблюдённая частота меняется от опыта к опыту. Поэтому А.Н. Колмогоров предложил аксиоматическое определение вероятности, которое принято в настоящее время.

Некоторые программисты после работы в области разработки обычных коммерческих приложений задумываются о том, чтобы освоить машинное обучение и стать аналитиком данных. Часто они не понимают, почему те или иные методы работают, и большинство методов машинного обучения кажутся магией. На самом деле, машинное обучение базируется на математической статистике, а та, в свою очередь, основана на теории вероятностей. Поэтому в этой статье мы уделим внимание базовым понятиям теории вероятностей: затронем определения вероятности, распределения и разберем несколько простых примеров.

Возможно, вам известно, что теория вероятностей условно делится на 2 части. Дискретная теория вероятностей изучает явления, которые можно описать распределением с конечным (или счетным) количеством возможных вариантов поведения (бросания игральных костей, монеток). Непрерывная теория вероятностей изучает явления, распределенные на каком-то плотном множестве, например на отрезке или в круге.

Можно рассмотреть предмет теории вероятностей на простом примере. Представьте себя разработчиком шутера. Неотъемлемой частью разработки игр этого жанра является механика стрельбы. Ясно, что шутер в котором всё оружие стреляет абсолютно точно, будет малоинтересен игрокам. Поэтому, обязательно нужно добавлять оружию разброс. Но простая рандомизация точек попадания оружия не позволит сделать его тонкую настройку, поэтому, корректировка игрового баланса будет сложна. В то же время, используя случайные величины и их распределения можно проанализировать то, как будет работать оружие с заданным разбросом, и поможет внести необходимые корректировки.

Пространство элементарных исходов

Допустим, из некоторого случайного эксперимента, который мы можем многократно повторять (например, бросание монеты), мы можем извлечь некоторую формализуемую информацию (выпал орел или решка). Эта информация называется элементарным исходом, при этом целесообразно рассматривать множество всех элементарных исходов, часто обозначаемое буквой Ω (Омега).

Структура этого пространства целиком зависит от природы эксперимента. Например, если рассматривать стрельбу по достаточно большой круговой мишени, - пространством элементарных исходов будет круг, для удобства размещенный с центром в нуле, а исходом - точка в этом круге.

Кроме того, рассматривают множества элементарных исходов - события (например, попадание в «десятку» - это концентрический круг маленького радиуса с мишенью). В дискретном случае всё достаточно просто: мы можем получить любое событие, включая или исключая элементарные исходы за конечное время. В непрерывном же случае всё гораздо сложнее: нам понадобится некоторое достаточно хорошее семейство множеств для рассмотрения, называемое алгеброй по аналогии с простыми вещественными числами, которые можно складывать, вычитать, делить и умножать. Множества в алгебре можно пересекать и объединять, при этом результат операции будет находиться в алгебре. Это очень важное свойство для математики, которая лежит за всеми этими понятиями. Минимальное семейство состоит всего из двух множеств - из пустого множества и пространства элементарных исходов.

Мера и вероятность

Вероятность - это способ делать выводы о поведении очень сложных объектов, не вникая в принцип их работы. Таким образом, вероятность определяется как функция от события (из того самого хорошего семейства множеств), которая возвращает число - некоторую характеристику того, насколько часто может происходить такое событие в реальности. Для определённости математики условились, что это число должно лежать между нулем и единицей. Кроме того, к этой функции предъявляются требования: вероятность невозможного события нулевая, вероятность всего множества исходов единичная, и вероятность объединения двух независимых событий (непересекающихся множеств) равна сумме вероятностей. Другое название вероятности - вероятностная мера. Чаще всего используется Лебегова мера , обобщающая понятия длина, площадь, объём на любые размерности (n -мерный объем), и таким образом она применима для широкого класса множеств.

Вместе совокупность множества элементарных исходов, семейства множеств и вероятностной меры называется вероятностным пространством . Рассмотрим, каким образом можно построить вероятностное пространство для примера со стрельбой в мишень.

Рассмотрим стрельбу в большую круглую мишень радиуса R , в которую невозможно промахнуться. Множеством элементарных событий положим круг с центром в начале координат радиуса R . Поскольку мы собираемся использовать площадь (меру Лебега для двумерных множеств) для описания вероятности события, то будем использовать семейство измеримых (для которых эта мера существует) множеств.

Примечание На самом деле, это технический момент и в простых задачах процесс определения меры и семейства множеств не играет особой роли. Но понимать, что эти два объекта существуют, необходимо, ведь во многих книгах по теории вероятности теоремы начинаются со слов: «Пусть (Ω,Σ,P) - вероятностное пространство … ».

Как уже сказано выше, вероятность всего пространства элементарных исходов должна равняться единице. Площадь (двумерная мера Лебега, которую мы обозначим λ 2 (A) , где А — событие) круга по хорошо известной со школы формуле равна π *R 2 . Тогда мы можем ввести вероятность P(A) = λ 2 (A) / (π *R 2) , и эта величина уже будет лежать между 0 и 1 для любого события А.

Если предположить, что попадание в любую точку мишени равновероятно, поиск вероятности попадания стрелком в какую-то то область мишени сводится к поиску площади этого множества (отсюда можно сделать вывод, что вероятность попадания в конкретную точку нулевая, ведь площадь точки равна нулю).

Например, мы хотим узнать, какова вероятность того, что стрелок попадёт в «десятку» (событие A — стрелок попал в нужное множество). В нашей модели, «десятка» представляется кругом с центром в нуле и радиусом r. Тогда вероятность попадания в этот круг P(A) = λ 2 /(A)π *R 2 = π * r 2 /(π R 2)= (r/R) 2 .

Это одна из самых простых разновидностей задач на «геометрическую вероятность», - большинство таких задач требуют поиска площади.

Случайные величины

Случайная величина — функция, переводящая элементарные исходы в вещественные числа. К примеру, в рассмотренной задаче мы можем ввести случайную величину ρ(ω) — расстояние от точки попадания до центра мишени. Простота нашей модели позволяет явно задать пространство элементарных исходов: Ω = {ω = (x,y) такие числа, что x 2 +y 2 ≤ R 2 } . Тогда случайная величина ρ(ω) = ρ(x,y) = x 2 +y 2 .

Средства абстракции от вероятностного пространства. Функция распределения и плотность

Хорошо, когда структура пространства хорошо известна, но на самом деле так бывает далеко не всегда. Даже если структура пространства известна, она может быть сложна. Для описания случайных величин, если их выражение неизвестно, существует понятие функции распределения, которую обозначают F ξ (x) = P(ξ < x) (нижний индекс ξ здесь означает случайную величину). Т.е. это вероятность множества всех таких элементарных исходов, для которых значение случайной величины ξ на этом событии меньше, чем заданный параметр x .

Функция распределения обладает несколькими свойствами:

  1. Во-первых, она находится между 0 и 1 .
  2. Во-вторых, она не убывает, когда ее аргумент x растёт.
  3. В третьих, когда число -x очень велико, функция распределения близка к 0 , а когда само х большое, функция распределения близка к 1 .

Вероятно, смысл этой конструкции при первом чтении не слишком понятен. Одно из полезных свойств — функция распределения позволяет искать вероятность того, что величина принимает значение из интервала. Итак, P (случайная величина ξ принимает значения из интервала ) = F ξ (b)-F ξ (a) . Исходя из этого равенства, можем исследовать, как изменяется эта величина, если границы a и b интервала близки.

Пусть d = b-a , тогда b = a+d . А следовательно, F ξ (b)-F ξ (a) = F ξ (a+d) - F ξ (a) . При малых значениях d , указанная выше разность так же мала (если распределение непрерывное). Имеет смысл рассматривать отношение p ξ (a,d)= (F ξ (a+d) - F ξ (a))/d . Если при достаточно малых значениях d это отношение мало отличается от некоторой константы p ξ (a) , не зависящей от d, то в этой точке случайная величина имеет плотность, равную p ξ (a) .

Примечание Читатели, которые ранее сталкивались понятием производной, могут заметить что p ξ (a) — производная функции F ξ (x) в точке a . Во всяком случае, можно изучить понятие производной в посвященной этой теме статье на сайте Mathprofi.

Теперь смысл функции распределения можно определить так: её производная (плотность p ξ , которую мы определили выше) в точке а описывает, насколько часто случайная величина будет попадать в небольшой интервал с центром в точке а (окрестность точки а) по сравнению с окрестностями других точек. Другими словами, чем быстрее растёт функция распределения, тем более вероятно появление такого значения при случайном эксперименте.

Вернемся к примеру. Мы можем вычислить функцию распределения для случайной величины, ρ(ω) = ρ(x,y) = x 2 +y 2 , которая обозначает расстояние от центра до точки случайного попадания в мишень. По определению F ρ (t) = P(ρ(x,y) < t) . т.е. множество {ρ(x,y) < t)} — состоит из таких точек (x,y) , расстояние от которых до нуля меньше, чем t . Мы уже считали вероятность такого события, когда вычисляли вероятность попадания в «десятку» - она равна t 2 /R 2 . Таким образом, Fρ(t) = P(ρ(x,y) < t) = t 2 /R 2 , для 0

Мы можем найти плотность p ρ этой случайной величины. Сразу заметим, что вне интервала она нулевая, т.к. функция распределения на этом промежутке неизменна. На концах этого интервала плотность не определена. Внутри интервала её можно найти, используя таблицу производных (например из на сайте Mathprofi) и элементарные правила дифференцирования. Производная от t 2 /R 2 равна 2t/R 2 . Значит, плотность мы нашли на всей оси вещественных чисел.

Ещё одно полезное свойство плотности — вероятность того, что функция принимает значение из промежутка, вычисляется при помощи интеграла от плотности по этому промежутку (ознакомиться с тем, что это такое, можно в статьях о собственном , несобственном , неопределенном интегралах на сайте Mathprofi).

При первом чтении, интеграл по промежутку от функции f(x) можно представлять себе как площадь криволинейной трапеции. Ее сторонами являются фрагмент оси Ох, промежуток (горизонтальной оси координат), вертикальные отрезки, соединяющие точки (a,f(a)), (b,f(b)) на кривой с точками (a,0), (b,0) на оси Ох. Последней стороной является фрагмент графика функции f от (a,f(a)) до (b,f(b)) . Можно говорить об интеграле по промежутку (-∞; b] , когда для достаточно больших отрицательных значений, a значение интеграла по промежутку будет меняться пренебрежимо мало по сравнению с изменением числа a. Аналогичным образом определяется и интеграл по промежуткам }

© 2024 Про уют в доме. Счетчики газа. Система отопления. Водоснабжение. Система вентиляции