Участник:Riabenko/tmp

Материал из MachineLearning.

< Участник:Riabenko(Различия между версиями)
Перейти к: навигация, поиск
м (Задание 2. Проверка гипотез на реальных данных)
Текущая версия (19:11, 25 сентября 2018) (править) (отменить)
м
 
(84 промежуточные версии не показаны)
Строка 1: Строка 1:
-
= Задание 2. Проверка гипотез на реальных данных =
+
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2009|Практические задания для студентов каф. ММП ВМК (2009 год)]]
-
Требуется подобрать и применить наилучший статистический метод, позволяющий ответить на вопрос прикладной задачи. Обосновать применимость метода и его оптимальность. Помимо выводов, касающихся математических особенностей решения, необходимо в терминах предметной области сформулировать выводы, которые могли бы быть понятны гипотетическому заказчику-нематематику.
+
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2010|Практические задания для студентов каф. ММП ВМК (2010 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2011, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2011 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2011|Практические задания для студентов каф. ММП ВМК (2011 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2012, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2012 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2012|Практические задания для студентов каф. ММП ВМК (2012 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2013, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2013 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2013|Практические задания для студентов каф. ММП ВМК (2013 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2014 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014|Практические задания для студентов каф. ММП ВМК (2014 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2015|Практические задания для студентов каф. ММП ВМК (2015 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2015, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2015 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2016, ММП|Практические задания для студентов каф. ММП ВМК (2016 год)]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2016, ФУПМ|Практические задания для студентов ФУПМ МФТИ (2016 год)]]
-
Необходимо сдать: подробный отчёт по проведённому исследованию, содержащий визуализацию исходных данных, описания и выводы каждого этапа анализа — используемые методы, обоснование их применимости, промежуточные результаты вычислений, графики.
+
<tex>
-
 
+
\frac{1}{\sum_i { N_{X_i}}} \left(\sum_i { N_{X_i} \mu_{X_i}}\right) +1.96 \sqrt{\frac{1}{\sum_i {N_{X_i} - 1}} \left( \sum_i { \left[(N_{X_i} - 1) \sigma_{X_i}^2 + N_{X_i} \mu_{X_i}^2\right] } - \left[\sum_i {N_{X_i}}\right]\mu_X^2 \right) }
-
Задание принимается до '''23:59 22.03'''.
+
</tex>
-
 
+
-
[[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ/2|Подстраница с индивидуальными постановками задач]].
+
-
 
+
-
::Студент 3: производитель богатых клетчаткой крекеров рассматривает возможность построить рекламную кампанию
+
-
 
+
-
::Студент 4: оценка объёма устриц
+
-
 
+
-
::Студент 5: продолжительность жизни батареек
+
-
 
+
-
::Студент 6: 12 родителей
+
-
 
+
-
===Цифры числа пи ===
+
-
Даны первые десять тысяч цифр числи пи. <!--- pi10000.txt --->
+
-
::Студент 1: Можно ли сказать, что все цифры встречаются с одинаковой частотой? Есть ли корреляция между подряд идущими цифрами?
+
-
 
+
-
===Maryland's Pick-3 Lottery===
+
-
Даны результаты розыгрыша лотереи Maryland's Pick-3 Lottery за 218 подряд идущих дней. Результатом является трёхзначное число. <!--- lottery.txt --->
+
-
::Студент 2: можно ли считать розыгрыш случайным?
+
-
 
+
-
=== Вакцина против вируса папилломы человека ===
+
-
Собраны данные по 1413 пациенткам клиник при университете Джона Хопкинса, проходившим с 2006 по 2008 вакцинацию против папилломавируса человека препаратом Гардасил. Рекомендуемый курс&nbsp;— три укола в течение года&nbsp;— был пройдён только 469 пациентками. Производитель препарата исследует, в каких демографических группах и каком способе получения вакцины проведение полного курса наиболее вероятно. <!---gardasil.xls http://www.amstat.org/publications/jse/v19n1/barat.pdf --->
+
-
::Студент 7: оценить влияние клиники и её расположения на число сделанных пациенткам уколов.
+
-
::Студент 8: связаны ли возраст и раса с готовностью прохождения полного курса вакцинации в течение года?
+
-
::Студент 9: связаны ли с готовностью прохождения полного курса вакцинации в течение года тип медицинской страховки и специализация порекомендовавшего вакцинацию врача?
+
-
 
+
-
===Размеры черепа древних египтян===
+
-
Измерено 150 черепов, найденных при раскопках в Египте. Находки относятся к пяти различным временным периодам. Для каждого черепа известны: максимальная ширина, базибрегматическая высота, базиальвеолярная длина, высота носа, примерная дата формирования. <!---skulls.txt--->
+
-
::Студент 10: проверить, есть ли различия между размерами черепов различных временных периодов, если есть, то какие периоды отличаются друг от друга.
+
-
 
+
-
=== Условия размножения штаммов золотистого стафилококка===
+
-
При подозрении на инфекционное заболевание для правильной постановки диагноза часто бывает важно из взятых у пациентов образцов вырастить как можно более многочисленную колонию бактерий, чтобы её было удобнее исследовать. Считается, что оптимальные параметры для размножения штаммов стафилококка в лабораторных условиях следующие: температура 35 градусов, концентрация триптона в питательном растворе 1.0%, время выдержки 24 часа. Для проверки оптимальности этих условий было проведено 30 экспериментов над пятью различными штаммами стафилококка. Для каждого из экспериментов известны время выдержки, температура, концентрация триптона, а также измеренное по окончании выдержки число колониеобразующих единиц (КОЕ) бактерий каждого штамма. <!--- Staphylococcus aureus.txt --->
+
-
::Студент 11: одинакова ли зависимость итогового числа КОЕ разных штаммов стафилококка от внешних условий?
+
-
 
+
-
===Засеивание облаков и уровень осадков===
+
-
Исследовалось воздействие засеивания облаков на обилие дождей. Измерения проводились в течение 108 периодов на пяти участках земли в Тасмании&nbsp;— участки обозначены в файле как западный, восточный, южный, северный и северо-восточный. В выборке содержатся данные об уровне осадков (в миллиметрах) на каждом из пяти участков, о времени года, к которому относится период, и о том, проводилось ли засеивание. <!---cloudseeding.txt--->
+
-
::Студент 12: проверить, как засеивание облаков повлияло на уровень осадков отдельно по каждому из пяти экспериментальных участков. Одинаково ли проявляется эффект засеивания на каждом из них, или, возможно, он как-то зависит от исходного уровня осадков на участке?
+
-
 
+
-
===Продолжительность жизни раковых больных===
+
-
Выборка состоит из 64 пациентов, у которых был диагностирован неизлечимый рак какого-либо органа. Всем им в качестве поддерживающей терапии был назначен к приёму витамин C (считалось, что он может способствовать выздоровлению раковых больных). Приведены данные об остаточной продолжительности жизни пациентов в днях. <!--- cancer.txt --->
+
-
::Студент 13: исследовать связь между остаточной продолжительностью жизни и типом рака.
+
-
 
+
-
===Краш-тест с манекенами===
+
-
Имеются результаты 352 краш-тестов, при которых происходило лобовое столкновение автомобилей с бетонной стеной на скорости около 60 км/ч. Измерены показатели повреждения манекенов: критерий тяжести повреждений головы, замедление грудной клетки, нагрузка на левое и правое бедро. <!--- crush.xls --->
+
-
::Студент 14: исследовать зависимость показателей повреждения от типа кузова, вида средств защиты, места манекена.
+
-
 
+
-
===Продолжительность жизни и активность размножения самцов дрозофилы===
+
-
Для изучения влияния активности размножения самцов дрозофилы на продолжительность их жизни был организован следующий эксперимент. По 25 самцов в пяти группах содержались в одинаковых условиях, за исключением одного отличия: в первой группе к каждому самцу ежедневно подсаживалась готовая к размножению самка, во второй&nbsp;— восемь готовых к размножению самок, в третьей и четвёртой&nbsp;— соответственно, одна и восемь беременных самок, не готовых к размножению, наконец, к самцам четвёртой группы не подсаживали никого. Для каждого самца измерена продолжительность жизни, длина грудной клетки и доля времени, проводимого во сне. <!--- fly.txt --->
+
-
::Студент 15: исследовать связь между продолжительностью жизни самцов дрозофилы и наличием самок разного типа и количества.
+
-
 
+
-
===Линька metacarcinus magister===
+
-
У 472 самок metacarcinus magister измерена ширина панциря до и после линьки. Часть особей проживала в лаборатории, часть&nbsp;— в естественной среде обитания; для последних известен также год вылова.
+
-
::Студент 16: исследовать различия между изменениями размеров панциря особей, линька которых проходила в лабораторных условиях и в естественных; для последних оценить влияние года вылова.
+
-
 
+
-
=== Пассажиры Титаника ===
+
-
Приведены данные о 1309 пассажирах Титаника. Для каждого пассажира указано имя, пол, возраст, класс и цена билета, число родственников на борту, и, кроме того, удалось ли ему выжить. <!--- titanic.xls --->
+
-
::Студент 17: по каким признакам отличаются выжившие пассажиры от погибших?
+
-
 
+
-
===Эффективность раскройки джинсов===
+
-
Для пяти поставщиков фабрики Levi's в Альбукерке имеются данные по доле материала, попадающего в обрезки; из всех величин вычтена средняя доля обрезков, получающаяся при оптимизации раскройки с помощью компьютера. <!--- jeans.txt http://lib.stat.cmu.edu/DASL/Datafiles/wasterunupdat.html --->
+
-
::Студент 18: есть ли различия между поставщиками?
+
-
 
+
-
=== Прочность промышленных вентиляторов ===
+
-
Измерен разрушающий крутящий момент 64 промышленных вентиляторов; для каждого известны тип отверстия, форма барабана и метод соединения. <!--- fans.txt http://www.amstat.org/publications/jse/v10n1/datasets.franklin.html --->
+
-
::Студент 19: связан ли разрушающий крутящий момент с характеристиками вентилятора?
+
-
 
+
-
=== Размер яиц кукушки ===
+
-
Известно, что кукушки откладывают яйца в гнёзда других птиц. Даны длины 115 яиц кукушки, найденных в гнёздах птиц 6 видов. <!---cuckoo.txt http://lib.stat.cmu.edu/DASL/Datafiles/cuckoodat.html--->
+
-
::Студент 20: как размер яйца зависит от вида птицы, в чьём гнезде оно было найдено?
+

Текущая версия


\frac{1}{\sum_i { N_{X_i}}} \left(\sum_i { N_{X_i} \mu_{X_i}}\right) +1.96  \sqrt{\frac{1}{\sum_i {N_{X_i} - 1}} \left( \sum_i { \left[(N_{X_i} - 1) \sigma_{X_i}^2 + N_{X_i} \mu_{X_i}^2\right] } - \left[\sum_i {N_{X_i}}\right]\mu_X^2 \right) }