Частичное обучение
Материал из MachineLearning.
(Новая: Частичное обучение(semi-supervised lerning) — один из методов машинного обучения, использу...) |
(викификация) |
||
Строка 1: | Строка 1: | ||
- | Частичное обучение(semi-supervised lerning) | + | '''Частичное обучение''' (semi-supervised lerning) — один из методов [[машинное обучение|машинного обучения]], использующий при обучении как размеченные, так и неразмеченные данные. |
+ | |||
Обычно используется небольшое количество размеченных и значительный объём неразмеченных данных. | Обычно используется небольшое количество размеченных и значительный объём неразмеченных данных. | ||
Частичное обучение является компромисом между [[обучение без учителя|обучением без учителя]] (без каких-либо размеченных обучающих данных) и [[обучение с учителем|обучением с учителем]] (с полностью размеченным набором обучения). | Частичное обучение является компромисом между [[обучение без учителя|обучением без учителя]] (без каких-либо размеченных обучающих данных) и [[обучение с учителем|обучением с учителем]] (с полностью размеченным набором обучения). | ||
Строка 7: | Строка 8: | ||
В подобных ситуациях ценность частичного обучения сложно переоценить. | В подобных ситуациях ценность частичного обучения сложно переоценить. | ||
- | Примером частичного обучения может послужить сообучение: два или более обучаемых используют один и тот же набор данных, но каждый при обучении использует | + | Примером частичного обучения может послужить сообучение: два или более обучаемых используют один и тот же набор данных, но каждый при обучении использует различные — в идеале независимые — наборы признаков объектов. |
Альтернативный подход заключается в моделировании совместного распределения признаков и меток. В таком случае для неразмеченых данных метки могут трактоваться как пропущенные данные. Для построения модели максимального правдоподобия обычно используется [[EM-алгоритм]]. | Альтернативный подход заключается в моделировании совместного распределения признаков и меток. В таком случае для неразмеченых данных метки могут трактоваться как пропущенные данные. Для построения модели максимального правдоподобия обычно используется [[EM-алгоритм]]. | ||
== Смотри также == | == Смотри также == | ||
- | *[[Трансдуктивное обучение]] | + | * [[Трансдуктивное обучение]] |
- | *[http://en.wikipedia.org/wiki/Constrained_clustering Constrained clustering] | + | * [http://en.wikipedia.org/wiki/Constrained_clustering Constrained clustering] |
== Ссылки == | == Ссылки == |
Версия 08:00, 5 ноября 2008
Частичное обучение (semi-supervised lerning) — один из методов машинного обучения, использующий при обучении как размеченные, так и неразмеченные данные.
Обычно используется небольшое количество размеченных и значительный объём неразмеченных данных. Частичное обучение является компромисом между обучением без учителя (без каких-либо размеченных обучающих данных) и обучением с учителем (с полностью размеченным набором обучения). Было замечено, что неразмеченные данные, будучи использованными совместно с небольшим количеством размеченных данных, могут обеспечить значительный прирост точности обучения. Сбор размеченных данных для задачи обучения зачастую требует, чтобы квалифицированный эксперт вручную классифицировал объекты обучения. Затраты, связанные с процессом разметки, могут сделать построение полностью размеченного набора прецедентов невозможным, в то время как сбор неразмеченных данных сравнительно недорог. В подобных ситуациях ценность частичного обучения сложно переоценить.
Примером частичного обучения может послужить сообучение: два или более обучаемых используют один и тот же набор данных, но каждый при обучении использует различные — в идеале независимые — наборы признаков объектов.
Альтернативный подход заключается в моделировании совместного распределения признаков и меток. В таком случае для неразмеченых данных метки могут трактоваться как пропущенные данные. Для построения модели максимального правдоподобия обычно используется EM-алгоритм.
Смотри также
Ссылки
Wikipedia: Semi-supervised learning