Разработка и исследование методов автоматической коррекции орфографических ошибок при машинном чтении текстов.
Июнь 4, 2008 – 10:54 ппАннотация.
В данной работе рассматривается проблема коррекции грамматических ошибок в сканированных текстах естественного языка. В связи с этим в работе поставлены следующие задачи:
- Исследовать существующие методики диагностики и коррекции одиночных грамматических ошибок в текстах русского языка.
- Провести сравнительный анализ методов.
- Улучшить метод диагностики и коррекции одиночных грамматических ошибок в текстах русского языка, основанный на морфологическом
анализе, за счет уменьшения количества вариантов коррекции.
Реализован программный комплекс диагностики и коррекции орфографических ошибок в сканированных текстах русского языка. Уменьшено количество вариантов коррекции в методе, основанном на морфологическом анализе, за счет применения частотного словаря, что позволило повысить процент корректно исправленных слов в 4 раза.