Алгебра – 11 класс. Статистическая обработка данных

Урок и презентация на тему: "Статистическая обработка данных"

Дополнительные материалы
Уважаемые пользователи, не забывайте оставлять свои комментарии, отзывы, пожелания! Все материалы проверены антивирусной программой.



Скачать: Статистическая обработка данных (PPTX)

Обучающие пособия и тренажеры в интернет-магазине "Интеграл" для 11 класса
Интерактивное пособие для 9–11 классов "Тригонометрия"
Интерактивное пособие для 10–11 классов "Логарифмы"





Ребята, мы переходим к изучению нового раздела, связанного с вопросами обработки данных различных экспериментов и элементов теории вероятности. Теория вероятности и математическая статистика находят свое применение практически во всех областях жизни. Заметим, что частично мы уже изучали данный раздел раньше, поэтому некоторые моменты вы должны помнить.
Давайте рассмотрим какой-нибудь пример, где нам пригодиться обработка информации. Пусть у нас есть десять футболистов - основной состав некоторой команды. Наши футболисты пробивают по десять пенальти и результаты каждого игрока записываются. После окончания серии пенальти есть некоторый набор результатов, на первый взгляд просто набор чисел. Что можно сделать с этими числами? Какую пользу они нам могут принести?
В первую очередь надо сгруппировать и упорядочить полученную информацию. Группировать информацию можно различными способами, все зависит от поставленной задачи. В нашем случае мы можем сгруппировать данные по фамилии игрока или по номеру игрока команды.

Сгруппируем по номеру игрока. Статистическая обработка данных
Сгруппируем по количеству забитых голов. Статистическая обработка данных
Представим первую таблицу графически.
На координатной плоскости по оси абсцисс отложим номер игрока, а по оси ординат - количество забитых голов. Статистическая обработка данных
Полученная кривая называется многоугольником распределения.
Теперь давайте построим гистограмму: она позволяет наглядно представить значения нашего ряда распределений. Мы строим прямоугольники с "центром" в значениях нашего ряда. Получаются такие прыгающие столбики. Статистическая обработка данных
Нам осталось построить еще один тип диаграммы – круговую. Предположим, что наш круг включает все 100% забитых голов (55), тогда игрок с номером два займет 3/55 площади круга, игроки с номерами 5 и 6 займут 1/11 часть круга, так как 5/55=1/11. Давайте построим для всех игроков круговую диаграмму. Статистическая обработка данных
Мы научились обрабатывать данные. Давайте напишем небольшой алгоритм первичной обработки данных:
  • Упорядочить и сгруппировать данные.
  • Составить таблицу распределения данных.
  • Графическое представление данных. В зависимости от задачи построить один из графиков распределения: Многоугольник распределения, Гистограмму или круговую диаграмму.

На этом обработка информации не заканчивается, для нашего ряда распределения можно найти многие числовые характеристики. Давайте рассмотрим их.

Первая числовая характеристика - это объем выборки, в нашем случае он равен десяти, так как мы рассматривали десять футболистов.

Размах измерения – разница между наибольшим и наименьшим значениями выборки. Больше всего голов забил игрок под номером 10 – 8 голов. Меньше всего, игрок под номером 2 – 3 гола. Тогда размах нашего измерения: $8-3=5$.

Самое популярное или наиболее часто встречаемое значение называется модой выборки. В нашем примере мода равна 10 – игрок, забивший наибольшее количество голов. В реальности тренер команды мог назначить этого игрока штатным "пенальтистом".

Среднее значение выборки. Суммируя все результаты и поделив на объем выборки, можно получить среднее значение. Для подсчета среднего значения удобнее использовать данные второй построенной таблицы.

(0*0+1*0+2*0+3*1+4*2+5*2 +6*2+7*2+8*1+9*0+ 10*0)/10=5,5
Округлив до целых, получим, что в среднем игроки забивали по шесть голов. Тренер команды мог бы запомнить данное значение, и через некоторое время провести еще раз такой эксперимент и проверить растут ли показатели команды или нет.
Варианта измерения – каждое число, встретившиеся в результате измерения. В нашем случае для первой таблицы – количество забитых голов, для второй – количество игроков, забивших гол.
Медиана измерения – среднее варианта, встречающиеся в выборке. Она делит нашу выборку пополам. Для второй выборки медиана равняется 5, так как это значение делит наш ряд ровно пополам. Если число вариант четно, как в первой выборке, то берутся два средних значения и делятся пополам: $\frac{6+7}{2}=6,5$.
Кратность или абсолютная частота варианты – то сколько раз встречается конкретная варианта. Для второй таблица кратность 0 равна 0, кратность 4 равна 2, кратность 8 равна 1.

При составлении таблицы, не всегда получается, что варианты расположены через равные промежутки. Варианта измерения может принимать фактически любые значения: и положительные, и отрицательные. Кратность варианты всегда больше нуля, если кратность равна нулю, то фактически в нашем эксперимента данное значение не встретилось, поэтому вторую таблицу "Распределения целесообразней" записать в таком виде:

Статистическая обработка данных
Частота варианты – числовая характеристика, показывающая часть или долю которую составляет варианта от всей выборки, которая равна:
Статистическая обработка данных
Перепишем нашу вторую таблицу с учетом частот и объема выборки: Статистическая обработка данных
Сумма всех частот всегда равна 1, а сумма частот в процентах всегда равна 100%.
Вернемся к среднему значению, данная числовая характеристика часто является очень полезной, но не во всех задачах имеет смысл ее вычислять. В нашем примере эта числовая характеристика показывала, сколько в среднем забивает команда. Со временем можно делать выводы об эффективности или неэффективности методов тренировки. Если среднее значение забитых голов растет, то видимо и тренировка эффективна, если - не растет, а даже падает то видимо, методы тренировки неэффективны.

Еще одна важная числовая характеристика – дисперсия или разброс значений вокруг среднего значения. Чем меньше дисперсия, тем плотнее результаты эксперимента сосредоточены около своего среднего значения. Подсчет дисперсии довольно таки трудоемкая операция, опишем алгоритм поиска дисперсии.
Пусть нам даны данные измерений: $x_{1}, x_{2}, .., x_{n}$.

1. Найдем среднее значение М: $M=\frac{x_{1}+x_{2}+⋯+x_{n}}{n}$.

2. Отклонение данных от среднего: $x_{1}-M, x_{2}-M,..., x_{n}-M$.
3. Квадраты отклонений найденных на предыдущем шаге: $({x_{i}-M})^2$, $i=1...n$.
4. Среднее значение всех квадратов отклонений и есть дисперсия:
$D=\frac{(x_{1}-M)^2+(x_{2}-M)^2+⋯+(x_{n}-M)^2}{n}$, $δ=\sqrt{D}$ –среднее квадратическое отклонение.

Давайте вычислим дисперсию для нашего примера:
1. Вспомним, среднее значение у нас равнялось 5,5.
2. Вычислим каждое отклонение и квадрат отклонения.
Статистическая обработка данных
3. Вычислим дисперсию.

D=(6,25+2,25+0,25+0,25+ 0,25+2,25+2,25+2,25+ 6,25+0,25)/10=2,25.

Методы математической статистики позволяют обрабатывать практически любые данные, главное подходить к обработке данных обдуманно и исходя из здравого смысла.


Домашнее задание:
Игроки команды провели повторный эксперимент с пенальти, результаты 10 игроков: Статистическая обработка данных
Составить различные ряды распределений, представить данные графически, вычислить числовые характеристики: Объем, разброс, моду, медиану, среднее, дисперсию, частоту выборки.