Участник:Kropotov/Песочница
Материал из MachineLearning.
Вариант 1
1. Рассматривается задача классификации объектов на два класса по одному неотрицательному признаку. Предполагается, что значение признака для объектов из классов распределено по закону Рэлея:
- Пусть . Требуется найти области значений признака , соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.1 и 0.9.
2. Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
- Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
3. Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков и . Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
2.7 | 3.4 | 4.1 | -4.5 | -3.3 | -3.3 | |||
4.2 | 3.1 | 2.9 | -1.2 | -1.5 | -0.6 |
4. При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 1000, наблюдателей~--- 100 и доля <<грязных>> участков~--- 20\%. При этом под оптимальностью понимается максимизация количества честных участков.
Чувствительность | Ложная тревога |
---|---|
0.52 | 0.11 |
0.70 | 0.19 |
0.99 | 0.32 |
5. Задана таблица совместных значений прогнозируемой переменной и объясняющей переменной . Требуется вычислить ковариацию между и , коэффициент корреляции между и , коэффициенты одномерной линейной регрессии.
6. Заданы таблицы значений бинарных признаков для классов и . Требуется найти все тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
Класс 1 | Класс 2 | |||||||
---|---|---|---|---|---|---|---|---|
X1 | X2 | X3 | X4 | X1 | X2 | X3 | X4 | |
0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | |
0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | |
1 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | |
1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 |
Вариант 2
- Рассматривается задача классификации объектов на два класса по одному признаку. Предполагается, что значение признака $x$ для объектов из двух классов $K_1,K_2$ распределено по лапласовскому закону
$$ p(x|K_j) = \frac{\alpha_j}{2}\exp(-\alpha_j|x-\mu_j|),\ j=1,2, $$ с параметрами $\mu_1 = -2,\alpha_1 = 4,\mu_2 = 2,\alpha_2 = 4$. Требуется найти области значений признака $x$, соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.8 и 0.2.
- Имеется задача распознавания с 4-мя классами и одним признаком. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
\begin{align*} &f_1(x) = -1.8-0.1x,&\quad &f_3(x) = 2.2-3.6x,\\ &f_2(x) = -1.2-3.8x,&\quad &f_4(x) = -3.1+4.5x. \end{align*} Требуется изобразить на графике области, соответствующие отнесению к каждому из четырех классов.
- Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков $x_1$ и $x_2$. Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
\begin{center} \begin{tabular}{ccc} Класс 1 & & Класс 2 \\ \begin{tabular}{c|ccc} $x_1$ & 2.7 & 2.5 & 1.1 \\ $x_2$ & 1.5 & 1.2 & 2.7 \end{tabular} & \qquad\qquad & \begin{tabular}{c|cccc} $x_1$ & -3.2 & -3.7 & -4.2 & -4.1 \\ $x_2$ & -4.9 & -1.2 & -3.6 & -5.1 \end{tabular} \end{tabular} \end{center}
- Банком тестируется два метода идентификации недобросовестных заёмщиков. Известно, что средний доход от одного добросовестного заёмщика составляет 3 единиц, средняя величина потерь от одного недобросовестного заёмщика~--- 9 единиц. Известно, что доля недобросовестных заёмщиков 30\%. Известно несколько точек графика ROC–кривой для двух распознающих операторов. Требуется установить на основании этой информации целесообразность использования банком одной из технологий распознавания, оценить максимальный дополнительный доход на одного заёмщика.
\begin{center} \begin{tabular}{cc} \begin{tabular}{cc} Чувствительность & Ложная тревога \\ \hline 0.58 & 0.11 \\ 0.67 & 0.19 \\ 0.93 & 0.19 \\ \end{tabular} & \begin{tabular}{cc} Чувствительность & Ложная тревога \\ \hline 0.53 & 0.04 \\ 0.90 & 0.27 \\ 0.92 & 0.33 \\ \end{tabular} \end{tabular} \end{center}
- Задана таблица совместных значений прогнозируемой переменной $Y$ и объясняющей переменной $X$. Требуется вычислить ковариацию между $Y$ и $X$, коэффициент корреляции между $Y$ и $X$, коэффициенты одномерной линейной регрессии.
\begin{center} \begin{tabular}{c|ccccc} $Y$ & 0.8 & 1.9 & 7.2 & 8.5 & 9.6 \\ $X$ & -1.9 & 4.3 & 5.4 & 6.9 & 8.3 \end{tabular} \end{center}
- Заданы таблицы значений бинарных признаков для классов $K_1$ и $K_2$. Требуется найти \textbf{все} тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
\begin{center} \begin{tabular}{ccc} Класс 1 & & Класс 2 \\ \begin{tabular}{cccc} X1 & X2 & X3 & X4 \\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 0\\ 0 & 0 & 1 & 1\\ 0 & 0 & 1 & 0 \end{tabular} & \qquad\qquad & \begin{tabular}{cccc} X1 & X2 & X3 & X4 \\ 0 & 1 & 1 & 0 \\ 1 & 1 & 1 & 1 \\ 1 & 0 & 1 & 0 \\ 1 & 0 & 1 & 0 \end{tabular} \end{tabular} \end{center} \end{enumerate}
Вариант 3
- Рассматривается задача классификации объектов на два класса по одному \textit{дискретному} признаку. Предполагается, что значение признака $x$ для объектов из первого класса имеет равномерное дискретное распределение на интервале $[a,b]$, а для второго класса~--- по геометрическому закону:
$$ \mathbb{P}(x=k|q) = q^k(1-q),\ k=0,1,2,\dots $$ Пусть $a=0,b=4,q=0.9$. Требуется найти области значений признака $x$, соответствующие отнесению объектов в каждый из двух классов байесовским классификатором, если априорные вероятности классов равны, соответственно, 0.7 и 0.3.
- Имеется задача распознавания с 3-мя классами и 2-мя признаками. Предполагается, что с использованием метода <<Линейная машина>> для каждого класса найдены следующие линейные разделяющие функции:
\begin{align*} &f_1(x_1,x_2) = -5+x_1+3x_2,\\ &f_2(x_1,x_2) = -2+4x_1+5x_2,\\ &f_3(x_1,x_2) = 5+4x_1+2x_2. \end{align*} Требуется изобразить на двумерной диаграмме области, соответствующие отнесению к классам 1, 2 и 3.
- Предполагается, что линейный дискриминант Фишера используется для распознавания объектов из двух классов по паре признаков $x_1$ и $x_2$. Требуется вычислить вектор, задающий направление перпендикуляра к прямой, разделяющей объекты двух классов:
\begin{center} \begin{tabular}{ccc} Класс 1 & & Класс 2 \\ \begin{tabular}{c|cccc} $x_1$ & 1.9 & 0.8 & 1.3 & 1.6 \\ $x_2$ & 3.3 & -0.1 & 1.8 & 1.8 \end{tabular} & \qquad\qquad & \begin{tabular}{c|ccc} $x_1$ & -1.9 & -1.6 & -0.4 \\ $x_2$ & -3.0 & -3.4 & -1.1 \end{tabular} \end{tabular} \end{center}
- При проведении выборов на ряде избирательных участков производятся фальсификации результатов голосования. Посылка наблюдателя на такой участок предотвращает фальсификации. Пусть известно несколько точек ROC-кривой для метода идентификации <<грязных>> участков. Требуется определить оптимальную стратегию распределения наблюдателей по участкам и максимальный выигрыш относительно стратегии равномерного распределения по участкам, если всего участков 3000, наблюдателей~--- 600 и доля <<грязных>> участков~--- 20\%. При этом под оптимальностью понимается максимизация количества честных участков.
\begin{center} \begin{tabular}{cc} Чувствительность & Ложная тревога \\ \hline 0.54 & 0.01 \\ 0.68 & 0.33 \\ 0.71 & 0.35 \\ \end{tabular} \end{center}
- Задана таблица совместных значений прогнозируемой переменной $Y$ и объясняющей переменной $X$. Требуется вычислить ковариацию между $Y$ и $X$, коэффициент корреляции между $Y$ и $X$, коэффициенты одномерной линейной регрессии.
\begin{center} \begin{tabular}{c|ccccc} $Y$ & 9.2 & 8.6 & 8.1 & 5.9 & 4.7 \\ $X$ & 7.9 & 5.9 & 3.2 & 1.6 & -0.1 \end{tabular} \end{center}
- Заданы таблицы значений бинарных признаков для классов $K_1$ и $K_2$. Требуется найти \textbf{все} тупиковые тесты минимальной длины, а также указать для каждого класса по одному представительному набору, который не совпадает по признакам с тупиковым тестом.
\begin{center} \begin{tabular}{ccc} Класс 1 & & Класс 2 \\ \begin{tabular}{cccc} X1 & X2 & X3 & X4 \\ 1 & 0 & 1 & 0\\ 1 & 0 & 0 & 0\\ 1 & 0 & 0 & 0\\ 0 & 0 & 1 & 0 \end{tabular} & \qquad\qquad & \begin{tabular}{cccc} X1 & X2 & X3 & X4 \\ 0 & 0 & 0 & 1 \\ 1 & 0 & 0 & 1 \\ 1 & 0 & 0 & 1 \\ 1 & 0 & 1 & 1 \end{tabular} \end{tabular} \end{center}