Зима искусственного интеллекта

Материал из MachineLearning.

(Различия между версиями)

Версия 14:51, 17 июня 2026

Перекрёстная проверка (кросс-валидация)

- Перекрёстная проверка**, или **кросс-валидация** (от англ. *cross-validation*), — это метод оценки обобщающей способности и стабильности статистических моделей и алгоритмов машинного обучения. Основная идея заключается в многократном разбиении доступной выборки данных на две части: **обучающую** (*training set*) и **проверочную** (*validation set* или *test set*). Модель строится (обучается) на обучающей части, а затем её качество оценивается на проверочной части, которая не участвовала в построении модели. Такой подход позволяет получить более реалистичную оценку того, как модель будет работать на новых, ранее не виденных данных, и является ключевым инструментом для борьбы с **переобучением** (*overfitting*) .

1. Определение и основная мотивация

В статистике и машинном обучении главной целью часто является не простое описание имеющихся данных, а построение модели, способной делать точные прогнозы для новых наблюдений. Однако, если модель слишком сложна, она может «запомнить» шум и случайные особенности обучающей выборки, что приведёт к отличным показателям на этих данных, но к плохим результатам на новых. Это явление и есть переобучение .

Перекрёстная проверка решает эту проблему, имитируя наличие новых данных. Вместо того чтобы оценивать модель на тех же данных, на которых она обучалась (что даёт смещённую, завышенную оценку), кросс-валидация использует часть данных исключительно для проверки. Процесс многократно повторяется, и результаты усредняются, что даёт более стабильную и надёжную оценку **ошибки обобщения** (*generalization error*) — ожидаемой ошибки модели на новых данных .

1. История

Идея разделения данных и перекрёстной проверки имеет глубокие исторические корни, уходящие в область психометрики и статистики первой половины XX века.

- Ранние работы.** Проблема завышения множественного коэффициента корреляции *R* при его вычислении на той же выборке, где были получены регрессионные веса, была осознана уже в 1930-х годах. Сельмер Ларсон в 1931 году отметил, что корреляция, полученная на исходной выборке, будет «обманчиво велика», и предложил корректирующие формулы .

- Появление метода разделения данных.** Термин «перекрёстная проверка» (cross-validation) и метод, как отдельный подход, начали формироваться в 1950-х годах. На симпозиуме по психометрике в 1950 году Чарльз Мозье (Charles Mosier) фактически предложил *k*-кратную кросс-валидацию с *k*=2, подчеркнув необходимость проверки эффективности предикторов на независимой выборке . Эдвард Кьюртон (Edward Cureton) в том же году прямо указал на проблему переобучения: метод наименьших квадратов «подгоняет ошибки так же, как и систематические тренды в данных» .

- Метод «складного ножа» (Jackknife).** Важным предшественником современных методов является **джекнайф** (*jackknife*). Он был предложен Морисом Кенуйем (Maurice Quen

Источник — «http://www.machinelearning.ru/wiki/index.php?title=%D0%97%D0%B8%D0%BC%D0%B0_%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82%D0%B0»

@@ Строка 1: / Строка 1: @@
-**Зима искусственного интеллекта** (англ. *AI winter*) — период затяжного снижения финансирования, интереса общественности и оптимизма в области исследований искусственного интеллекта (ИИ). Этот термин, проведённый по аналогии с «ядерной зимой», описывает состояние кризиса, наступающее после периода «лета» — бума и завышенных ожиданий, когда реальные результаты не оправдывают данных обещаний . За свою историю ИИ пережил по крайней мере две масштабные зимы, каждая из которых стала следствием совпадения технических ограничений и управленческих просчётов, и каждая кардинально изменила траекторию развития дисциплины .
+# Перекрёстная проверка (кросс-валидация)
-## Первая зима (1974–1980)
+**Перекрёстная проверка**, или **кросс-валидация** (от англ. *cross-validation*), — это метод оценки обобщающей способности и стабильности статистических моделей и алгоритмов машинного обучения. Основная идея заключается в многократном разбиении доступной выборки данных на две части: **обучающую** (*training set*) и **проверочную** (*validation set* или *test set*). Модель строится (обучается) на обучающей части, а затем её качество оценивается на проверочной части, которая не участвовала в построении модели. Такой подход позволяет получить более реалистичную оценку того, как модель будет работать на новых, ранее не виденных данных, и является ключевым инструментом для борьбы с **переобучением** (*overfitting*) .
-Первая зима ИИ наступила в середине 1970-х годов и стала тяжёлым ударом по ранним исследованиям. Её наступление было вызвано двумя ключевыми причинами.
+## Определение и основная мотивация
-Во-первых, это **критический доклад Джеймса Лайтхилла**, представленный Британскому научному исследовательскому совету в 1973 году . В своём докладе Лайтхилл дал крайне пессимистичную оценку состояния дел в области ИИ. Главный аргумент заключался в том, что фундаментальные проблемы, такие как **комбинаторный взрыв** — экспоненциальный рост вычислительной сложности при попытке решать реальные задачи, — делают большинство подходов бесперспективными. Исследователи, по мнению Лайтхилла, потерпели неудачу в создании систем, способных справляться со сложностью и неоднозначностью реального мира, и их «грандиозные цели» остались невыполненными . Этот доклад привёл к «практически полному демонтажу исследований ИИ в Великобритании» и стал образцом для критики в других странах .
+В статистике и машинном обучении главной целью часто является не простое описание имеющихся данных, а построение модели, способной делать точные прогнозы для новых наблюдений. Однако, если модель слишком сложна, она может «запомнить» шум и случайные особенности обучающей выборки, что приведёт к отличным показателям на этих данных, но к плохим результатам на новых. Это явление и есть переобучение .
-Вторым, не менее важным фактором стала **критика персептронов**. В 1969 году вышла книга Марвина Минского и Сеймура Пейперта «Персептроны», в которой математически доказывались фундаментальные ограничения однослойных нейронных сетей . Авторы показали, что такие сети неспособны решать даже простые логические задачи, например, функцию XOR (исключающее ИЛИ), если только данные не являются линейно разделимыми . Эта работа нанесла серьёзный удар по ранним нейросетевым исследованиям, фактически заморозив их почти на десятилетие, и переключила внимание научного сообщества на символьные подходы, которые рассматривались как более многообещающие .
+Перекрёстная проверка решает эту проблему, имитируя наличие новых данных. Вместо того чтобы оценивать модель на тех же данных, на которых она обучалась (что даёт смещённую, завышенную оценку), кросс-валидация использует часть данных исключительно для проверки. Процесс многократно повторяется, и результаты усредняются, что даёт более стабильную и надёжную оценку **ошибки обобщения** (*generalization error*) — ожидаемой ошибки модели на новых данных .
-Последствия первой зимы были катастрофическими. Ведущие мировые агентства по финансированию, такие как DARPA (Агентство перспективных исследовательских проектов Министерства обороны США), разочаровавшись в отсутствии практических результатов, резко сократили вложения в фундаментальные исследования ИИ . Оптимизм сменился разочарованием, многие исследовательские проекты были свёрнуты, а сам термин «искусственный интеллект» стал восприниматься в академической среде как маркер неоправданного хайпа.
+## История
-## Вторая зима (1987–1993)
+Идея разделения данных и перекрёстной проверки имеет глубокие исторические корни, уходящие в область психометрики и статистики первой половины XX века.
-Вторая зима, наступившая в конце 1980-х, по своим масштабам была не менее суровой, чем первая, и её причины были тесно связаны с переоценкой возможностей так называемых **экспертных систем**.
+**Ранние работы.** Проблема завышения множественного коэффициента корреляции *R* при его вычислении на той же выборке, где были получены регрессионные веса, была осознана уже в 1930-х годах. Сельмер Ларсон в 1931 году отметил, что корреляция, полученная на исходной выборке, будет «обманчиво велика», и предложил корректирующие формулы .
-Экспертные системы, основанные на символьном представлении знаний и логическом выводе, стали главным коммерческим успехом ИИ в 1980-х годах . Однако к концу десятилетия их фундаментальные недостатки стали очевидны. Основной проблемой стал **«узкий горлышек» (bottleneck) извлечения знаний**: оказалось чрезвычайно сложно и дорого переносить знания экспертов-людей в формальные правила, на которых строились эти системы . Системы были «хрупкими» (англ. *brittle*): они давали сбои при малейшем отклонении от ожидаемого ввода, не могли обучаться и требовали колоссальных затрат на поддержание и обновление баз знаний . К началу 1990-х годов стало ясно, что, несмотря на отдельные успешные внедрения (например, система XCON для компании DEC), поддерживать такие системы в рабочем состоянии экономически нецелесообразно .
+**Появление метода разделения данных.** Термин «перекрёстная проверка» (cross-validation) и метод, как отдельный подход, начали формироваться в 1950-х годах. На симпозиуме по психометрике в 1950 году Чарльз Мозье (Charles Mosier) фактически предложил *k*-кратную кросс-валидацию с *k*=2, подчеркнув необходимость проверки эффективности предикторов на независимой выборке . Эдвард Кьюртон (Edward Cureton) в том же году прямо указал на проблему переобучения: метод наименьших квадратов «подгоняет ошибки так же, как и систематические тренды в данных» .
-Вторым важным фактором стал **крах рынка LISP-машин**. Для работы с символьным ИИ и, в частности, с экспертными системами, были разработаны специализированные компьютеры, оптимизированные под язык программирования Lisp . Однако быстрое развитие производительности универсальных рабочих станций от Sun Microsystems и других производителей сделало дорогостоящие Lisp-машины ненужными. В 1987 году этот рынок, оценивавшийся в полмиллиарда долларов, рухнул, что привело к банкротству ключевых игроков, таких как Symbolics и Lisp Machines Inc. .
+**Метод «складного ножа» (Jackknife).** Важным предшественником современных методов является **джекнайф** (*jackknife*). Он был предложен Морисом Кенуйем (Maurice Quen
-Наконец, своё влияние оказало **фиаско японского проекта «Пятое поколение» (FGCS)**. Запущенный в 1982 году с грандиозными амбициями создать компьютеры на основе логического программирования и массового параллелизма, проект привлёк огромное внимание и финансирование по всему миру . Однако к началу 1990-х стало ясно, что его изначальные цели — создание «машины для логического вывода» — остались невыполнимыми, что нанесло серьёзный удар по репутации символьного подхода и привело к сворачиванию финансирования .
-Последствия второй зимы были столь же серьёзны. Финансирование было «жестоко сокращено» , интерес к ИИ в индустрии сошёл на нет, и многие компании были вынуждены переименовывать свои исследовательские отделы, избегая термина «искусственный интеллект» . Именно в этот период область нейронных сетей и статистического обучения, переименованная в «машинное обучение», начала своё возрождение, которое в итоге привело к современному буму .
-## Причины наступления «зим»
-Анализ двух крупнейших «зим» ИИ позволяет выделить повторяющиеся паттерны, лежащие в их основе. Все они сводятся к одному фундаментальному циклу: **грандиозные обещания → приток финансирования → столкновение с технической реальностью → разочарование и отток капитала** .
-Ключевым техническим фактором всегда был **разрыв между возможностями доминирующей парадигмы и сложностью задач реального мира**.
-*   В первую зиму символьные системы и ранние нейросети потерпели неудачу при попытке выйти за рамки «игрушечных» микро-миров. Они не могли справляться с комбинаторным взрывом и неопределённостью .
-*   Во вторую зиму экспертные системы натолкнулись на неразрешимую проблему представления знаний и их «хрупкость» .
-Этот разрыв часто усугублялся **экономическими и политическими факторами**, когда государственные и частные инвесторы, очарованные ранними успехами, начинали требовать быстрой отдачи от вложенных средств, что было невозможно в условиях нерешённых научных проблем .
-## Уроки для современного машинного обучения
-«Зимы» ИИ — это не просто исторические анекдоты; это важнейшие уроки, сформировавшие современную культуру исследований в области машинного обучения (ML).
-.  **От символьных подходов к статистическому обучению.** Главный вывод из «зим» — отказ от попыток напрямую запрограммировать человеческий интеллект в пользу создания алгоритмов, которые *обучаются* на данных. Современный ML, основанный на статистике и нейросетях, изначально развивался как альтернатива «символьному ИИ», и именно его успех позволил преодолеть последствия второй зимы .
-.  **Скептицизм в отношении «серебряных пуль».** Опыт двух «зим» научил сообщество критически относиться к обещаниям и искать подтверждение эффективности на эмпирических данных. Он напоминает, что успех в ограниченных задачах (например, игра в шахматы) не гарантирует решения проблем в общем случае.
-.  **Важность постановки реалистичных целей.** Движение ML в 1990-х годах во многом было связано с отказом от амбициозной цели создания «сильного ИИ» (AGI) и сосредоточением на решении конкретных, хорошо сформулированных задач, таких как распознавание образов или классификация текстов .
-.  **Ценность инженерной дисциплины.** «Зимы» показали, что поддержка сложных систем (как экспертные) требует строгой инженерии. Именно это понимание привело к развитию современных подходов к MLOps и управлению жизненным циклом моделей.
-Современный бум глубокого обучения несёт в себе те же риски. Умение распознавать признаки приближающейся «зимы» — неоправданный хайп, кризис воспроизводимости, стагнация ключевых метрик на сложных бенчмарках — является важнейшим профессиональным навыком для современного инженера и исследователя .
-## См. также
-*   [[Дартмутский семинар]]
-*   [[Персептрон]]
-*   [[Экспертные системы]]
-*   [[История искусственного интеллекта]]
-## Примечания
-<div style="font-size:0.9em;">
-.  Автор статьи не несёт ответственности за перевод терминов, устоявшихся в русскоязычной научной литературе. Предпочтение отдаётся наиболее распространённым вариантам.
-.  Для единообразия цитирования использована сквозная нумерация источников.
-</div>
-## Литература
-<div style="font-size:0.9em;">
-.  Crevier, D. (1993). *AI: The Tumultuous History of the Search for Artificial Intelligence*. New York: Basic Books.
-.  Lighthill, J. (1973). «Artificial Intelligence: A General Survey». In *Artificial Intelligence: a paper symposium*. Science Research Council.
-.  Minsky, M., & Papert, S. (1969). *Perceptrons: An Introduction to Computational Geometry*. MIT Press.
-.  Haigh, T. (2024). «The AI Winter». *Communications of the ACM*, 67(2).
-.  Russell, S. J., & Norvig, P. (2020). *Artificial Intelligence: A Modern Approach* (4th ed.). Pearson. (Включает подробный исторический обзор)
-.  Nilsson, N. J. (2009). *The Quest for Artificial Intelligence: A History of Ideas and Achievements*. Cambridge University Press.
-</div>

Зима искусственного интеллекта

Материал из MachineLearning.

Версия 14:51, 17 июня 2026

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты