Участник:Buddismdotru

Материал из MachineLearning.

Версия от 14:36, 26 мая 2016; Buddismdotru (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Добрый день! Для распознавания древних манускриптов создается программа оптического распознавания и машинного перевода восточных текстов. В качестве графической свертки признаков мы использовали фокальные точки и фокальные линии изображения, описанные кривыми Безье. На конечном этапе сравнение ведется по признакам на основе трехслойного неокогнитрона. Этот метод свертки более медленный, но обладает очень высокой различающей способностью и устойчивостью к шуму в пределах до 1/5 от линейного размера признака. Реализация неокогнитрона на базе регистровых команд позволила добиться скорости распознавания. Такой подход хорошо себя показал при распознавании печатных текстов. Задача. На следующем этапе для уверенного распознавания рукописного и ксилографического текста необходимо решить задачу машинного обучения. Каждый текст отличается от предыдущего, часто даже страницы в рукописи не похожи одна на другую. Одним из методов, позволяющим обучить нейросеть и выявлять закономерности в графическом узоре является генетический алгоритм. Этот алгоритм позволяет создать множество вариаций сети для решения задачи и выбрать наилучший. Постепенно в результате скрещивания и отбора вариантов построения нейросети выявляется оптимальная конфигурация. Метод позволяет например обучить сеть играть в компьютерные игры. Пример реализации этого алгоритма для игры Марио: Мы воспроизвели код целиком на с++ и будем рады поделится. Для распознавания рукописного текста необходимо решить задачу выявления паттернов и их сочетаний в графическом узоре. Нужно научить программу разделять задачу на этапы, выявлять закономерности, создавать на их основе гипотезы и подтверждать или опровергать эти гипотезы на основе опыта. В первом приближении задачу можно рассмотреть как выбор метода графических сверток и задачу оптимизации Беллмана решаемую методом сверточной нейросети. Однако сложность в том, что в отличие от печатного текста не удается определить вероятность сочетания признаков на основе только размеченной обучающей выборки. Необходимо понять, как применить машинное обучение для поиска и классификации закономерностей распределения признаков на основе самого текста. Решение этой задачи имеет применение и в других задачах машинного обучения. Например при выявлении графических образов, колоризации изображения и машинном переводе. Одним из вариантов обучения является программное создание онтологии. Этот подход применяется при машинном переводе и создании чат-ботов. В этом случае взаимосвязь образов и понятий записывается в виде небольшой подпрограммы на скриптовом языке и выполняется в момент распознавания. Подход аналогичен записи весовых коэффициентов в нейронной сети.

Личные инструменты