что такое орфографический контроль

3.2.3.1. Орфографический контроль

3.2.3.1. Орфографический контроль

Программы орфографического контроля обнаруживают (и предлагают варианты исправления) мотивированные грамматические ошибки в основах и окончаниях (флексиях) слов, записанных в словарь системы, и слов, встретившихся ей впервые (незнакомых), а также случайные, или немотивированные, ошибки.

Основные классы учитываемых случайных ошибок таковы:

– пропуск одной буквы (асемблер),

– одна лишняя буква (авттокод),

– замена одной буквы (конпьютер),

– перестановка двух соседних букв (аглоритм).

Признаком ошибки служит появление в обрабатываемом тексте формы незнакомого системе слова.

Предпринимается попытка «свести» такое незнакомое слово к знакомому с помощью преобразований, обратных перечисленным выше (считается, что ошибка могла возникнуть в результате одного из таких «прямых» преобразований знакомого слова). Для предварительной оценки близости слов (основ слов) используется специально разработанная метрика.

Одна из программ обнаруживает ошибки в датах, задаваемых в тексте с помощью конструкций вида ДД.ММ.ГГ. Если задан и диапазон возможных дат, проверяется также принадлежность всех представленных в исследуемом тексте дат этому диапазону.

Примеры работы программ:

ОЖИДАЕМОЕ СЛОВО: прочитана

ОЖИДАЕМОЕ СЛОВО : расчета

Читайте также

Родительский контроль

Родительский контроль В любой семье, где есть несовершеннолетние дети, рано или поздно возникает проблема ограничения доступа ребенка к компьютеру. Не секрет, что в последние годы серьезно обострилась проблема компьютерной зависимости детей и подростков. Над этой

3.2.3.3. Стилистический контроль

3.2.3.3. Стилистический контроль Программы данного блока фиксируют внешние характеристики фраз, свидетельствующие о сложности их структуры, а следовательно, и о сложности восприятия смысла. Имеются, например, программы, контролирующие длину фраз, количество запятых,

3.2.3.5. Синтаксический контроль

3.2.3.5. Синтаксический контроль Программа СИНТ1Программа СИНТ1 находит в указанной области именные словосочетания вида ‹прилагательное› + ‹существительное› и ‹существительное› + ‹существительное в форме родит. падежа› и др. Программа может оказаться

3.2.3.6. Пунктуационный контроль

3.2.3.6. Пунктуационный контроль Пунктуационные ошибки в реальных предложениях русского языка встречаются довольно часто. Разделим их условно на две группы. Ошибки одной группы связаны с уровнем пунктуационной грамотности и появляются в основном в тех типах текстов

3.2.3.7. Семантический контроль

3.2.3.7. Семантический контроль Программа СЕМ1Программа обнаруживает несовпадение ожидаемых семантических признаков актантов (подлежащее, дополнения) глагола и признаков слов (групп слов), реально занимающих соответствующие позиции. Такое несовпадение мешает завершить

Родительский контроль

Родительский контроль Дети очень быстро учатся пользоваться компьютером. Безо всяких книг, систем помощи или компьютерных курсов.Правда, пользуются дети компьютером только для игр (где они этого насмотрелись?!). Ну, еще для путешествий по Интернету, где они только болтают

Контроль над Помощником

Контроль над Помощником Используйте свойства объекта Assistant (табл. 14.1) для контроля за тем, как и когдаПомощник по Office будет появляться на экране. Пока вы не уверены в том. что Помощник уже включен, убедитесь в том, что его свойство On имеет значение True, прежде чем пытаться

Контроль анимации

Контроль анимации Следующей задачей является обеспечение гарантий того, что тип Timer сместит текущий фрейм визуализации в рамках PictureBox. Снова напомним, что число фреймов в цикле анимации зависит от текущей скорости автомобиля. Необходимость изменений изображений в PictureBox

Контроль ошибок

Контроль ошибок Существует широко распространенная проблема, связанная с вводом в машину данных, которые должны использоваться определенным образом. Один из методов ее решения состоит в «контроле ошибок». Это означает, что, перед тем как приступить к обработке данных,

Родительский контроль

Родительский контроль Существует способ ограничить доступ детей к определенным сайтам, играм, да и, вообще, к самому компьютеру. Скажем, после 21 часа работа на компьютере запрещена.Для этого в панели управления создается для ребенка учетная запись с ограниченными

Источник

Прикладное программное обеспечение: системы автоматической обработки текстов | Страница 11 | Онлайн-библиотека

Только что рассмотренный пример (программа ЛЕКС1) можно использовать и для иллюстрации четвертого критерия классификации программ контроля. Эта программа, как и ряд других, выдает некоторую глобальную информацию об исследуемом фрагменте текста, не фиксируя, в каких позициях (абзацах, фразах или строках) были обнаружены в тексте формы различных слов. Другие программы, например программы проверки орфографии, локализуют обнаруживаемые ими свойства (дефекты) текста.

И наконец, отметим еще одно (формальное) различие программ контроля. Для всех программ основным параметром является подлежащий обработке фрагмент текста. Однако для некоторых программ нужно обязательно указать дополнительные параметры, конкретизирующие задание. Например, при вызове программы ЛЕКС2 нужно указать, какие именно грамматические признаки слов интересуют пользователя.

Некоторые программы контроля получают в качестве параметра предельно допустимые (пороговые) числовые значения количественно оцениваемых параметров текста. Отметим, что, меняя порог, можно варьировать уровень требований, предъявляемых к тексту, моделируя тем самым оценку его разными адресатами. Например, можно установить в качестве предельно допустимой длины фразы 25 слов или ограничить число придаточных предложений (в составе сложного предложения) двумя. Фразы, в которых эти пороговые значения превышены, будут классифицированы соответствующими программами контроля как недопустимые.

3.2.3.1. Орфографический контроль

Программы орфографического контроля обнаруживают (и предлагают варианты исправления) мотивированные грамматические ошибки в основах и окончаниях (флексиях) слов, записанных в словарь системы, и слов, встретившихся ей впервые (незнакомых), а также случайные, или немотивированные, ошибки.

Основные классы учитываемых случайных ошибок таковы:

– пропуск одной буквы ( асемблер ),

– одна лишняя буква ( авттокод ),

– замена одной буквы ( конпьютер ),

– перестановка двух соседних букв ( аглоритм ).

Признаком ошибки служит появление в обрабатываемом тексте формы незнакомого системе слова.

Предпринимается попытка «свести» такое незнакомое слово к знакомому с помощью преобразований, обратных перечисленным выше (считается, что ошибка могла возникнуть в результате одного из таких «прямых» преобразований знакомого слова). Для предварительной оценки близости слов (основ слов) используется специально разработанная метрика.

Одна из программ обнаруживает ошибки в датах, задаваемых в тексте с помощью конструкций вида ДД.ММ.ГГ. Если задан и диапазон возможных дат, проверяется также принадлежность всех представленных в исследуемом тексте дат этому диапазону.

Примеры работы программ:

ОЖИДАЕМОЕ СЛОВО: прочитана

ОЖИДАЕМОЕ СЛОВО : расчета

3.2.3.2. Анализ лексического состава текста

Программа подсчитывает, сколько раз в тексте (области) употребляется то или иное слово. Программа формирует полный список всех различных слов текста с указанием частот их встречаемости. Можно задать диапазон частот (например, от 10 до 20 вхождений или ровно 15 вхождений) и сформировать список слов, количество употреблений которых лежит в границах этого диапазона. Если диапазон не задан, формируется полный частотный словарь текста.

Программа формирует список слов, обладающих указанными лексико-грамматическими характеристиками, например, находит все существительные, все причастия или все аббревиатуры, встретившиеся в тексте (области). Слова упорядочиваются по алфавиту, для каждого слова подсчитывается число его вхождений в исследуемый текст. Программа предназначена для анализа словарного состава текста.

В списке N 1 поиск ведется в последнюю очередь так как он, во-первых, самый большой, и во-вторых, если, например, в списках N 3 и N 1 присутствует одно и то же сокращение, но с различными расшифровками, то приоритет имеет сокращение из списка N 3. Результатом работы является список используемых в тексте аббревиатур с указанием их локализации в тексте и типа аббревиатуры.

Программа проверяет правильность расшифровки, то есть тот факт, что аббревиатура читается в расшифровке по началам слов, причем некоторые слова расшифровки могут не участвовать в образовании аббревиатуры. Пример работы программы:

НЕСООТВЕТСТВИЕ АББРЕВИАТУРЫ И РАСШИФРОВКИ:

ОБРАБАТЫВАЕТСЯ ПЕРЕЧЕНЬ АББРЕВИАТУР:

4 : ОЗУ * НЕТ РАСШИФРОВКИ

5 : МПК * НАРУШЕНИЕ АЛФ. ПОРЯДКА

7 : ПНП * РАСШИФРОВКА НЕ ЯВЛЯЕТСЯ ГРУППОЙ СУЩЕСТВИТЕЛЬНОГО

9 : СПТ * НЕСООТВ: АББР.-РАСШ.

3.2.3.3. Стилистический контроль

Михаил Георгиевич Мальковский, Татьяна Юрьевна Грацианова, И. Н. Полякова: Прикладное программное обеспечение: системы автоматической обработки текстов1
1. Сферы применения систем автоматической обработки текстов1
1.1. Машинный перевод1
1.2. Генерация текста2
1.3. Локализация и интернационализация3
1.4. Работа на ограниченном языке3
1.5. Создание текстовых документов (ввод, редактирование, исправление ошибок)3
1.6. Поиск информации3
2. Лингвистическое обеспечение систем автоматической обработки текстов4
2.1. Лингвистические банки данных4
2.2. Библиотека программ «Русская морфология»4
2.2.1. Словарь Зализняка4
2.2.2. Формальная модель русского словоизменения5
2.2.3. Основные программы6
3. Исправление ошибок в русскоязычных текстах8
3.1. Проблема речевых ошибок8
3.2. Система комплексного контроля качества текста ЛИНАР9
3.2.1. Функции системы ЛИНАР; сценарии работы с системой9
3.3.2. База знаний системы10
2.3.3. Программы контроля10
3.2.3.1. Орфографический контроль11
3.2.3.2. Анализ лексического состава текста11
3.2.3.3. Стилистический контроль11
3.2.3.4. Контроль структуры текста12
3.2.3.5. Синтаксический контроль12
3.2.3.6. Пунктуационный контроль12
3.2.3.7. Семантический контроль12
4. Информационно-поисковые системы13
4.1. Основные определения13
4.2. Тезаурус13
4.3. Релевантность14
4.4. Языковой компонент15

Источник

Что такое орфографический контроль

Для хранения текста на диске очень часто используются специальный формат файла, который называется текстовым файлом.

Текстовый файл – простейший способ организации данных в компьютере. Состоит он только из кодов таблицы символьной кодировки.

Для работы с разнообразными по содержанию и форме текстовыми документами существуют прикладные программы, которые называются текстовыми редакторами.

Текстовый редактор (ТР) – это прикладная программа, позволяющая создавать текстовые документы, редактировать их, просматривать содержимое документа на экране, распечатывать документ, изменять формат документа.

Текстовый редактор — это программа, используемая специально для ввода и редактирования текстовых данных.

Этими данными могут быть программа или какой-либо документ или же книга. Редактируемый текст выводится на экран, и пользователь может в диалоговом режиме вносить в него свои изменения.

Текстовые редакторы могут обеспечивать выполнение разнообразных функций, а именно:

Рабочее поле – отображает набираемый на клавиатуре текст.

Курсор – имеет вид перемещающейся по экрану черточки.

Строка состояния – в ней указываются координаты курсора (номер текущей строки, позиции в строке) номер страницы, формат текста, текущий шрифт и др.

Меню команд – это команды изменения режимов работы, файловых операций, печати, форматирования текста, обращения за справкой и др.

Возможности текстовых редакторов различны — от программ, предназначенных для подготовки небольших документов простой структуры, до программ для набора, оформления и полной подготовки к типографскому изданию книг и журналов (издательские системы).

Наиболее известный текстовый редактор — Microsoft Word.

Полнофункциональные издательские системы — Microsoft Publisher, Corel Ventura и Adobe PageMaker. Издательские системы незаменимы для компьютерной верстки и графики. Значительно облегчают работу с многостраничными документами, имеют возможности автоматической разбивки текста на страницы, расстановки номеров страниц, создания заголовков и т.д. Создание макетов любых изданий — от рекламных листков до многостраничных книг и журналов — становится очень простым, даже для новичков.

Вопросы для закрепления темы:

2. Для чего предназначены текстовые редакторы?

3. Изучить все элементы среды используемого в работе редактора.

Домашнее задание: Шауцукова Л.З. Информатика. 10-11 кл.,

парагр. ______стр:_________, читать конспект, выучить определения.

Тема урока: Оформление текста (шрифты, цвет символов, обрамление).

Цель урока: Рассмотреть р азнообразные шрифты и начертания.

1. Организация класса: Д/з §___, стр.______, учить конспекты, выучить определения.

2. Проверка Д/з: Опросить по дом. §____, опрос с места по конспекту (определения).

Ввод-редактирование — это основной режим работы тек стового редактора.

При записи текста на бумаге мы пользуемся ручкой или карандашом. Ввод (запись) текста в память компьютера производится с помощью клавиатуры. Если в прежние вре мена, до массового распространения ПК, быстро набирать текст на клавишах пишущих машинок умели только про фессиональные машинистки, то сейчас этот навык стано вится необходимым для большинства людей. На занятиях в компьютерном классе вам поможет овладеть этим навыком учитель. Кроме того, существуют специальные учебные программы-тренажеры, развивающие умение быстро рабо тать с клавиатурой.

При работе с текстовым редактором в режиме ввода-ре дактирования по экрану дисплея перемещается курсор, ко торый указывает текущую позицию для ввода. Символ, со ответствующий нажатой клавише, помещается в позицию курсора, который после этого перемещается на один шаг вправо или, если достигнут конец строки, в начало следую щей строки.

Под редактированием понимается внесение любых изме нений в набранный текст. Чаще всего приходится стирать ошибочный символ, слово, строку; заменять один символ на другой; вставлять пропущенные символы, слова, строки. В процессе редактирования текста пользователь может из­ менять шрифты, форматировать текст, выделять фрагменты и манипулировать ими (переносить, уничтожать, копиро вать). В многооконных редакторах можно «разложить» сразу несколько документов в разных окнах и быстро перехо дить от одного к другому.

Это обычное начертание шрифта Times New Roman

Это курсив шрифта Times New Roman

Это полужирное начертание шрифта Times New Roman

Это полужирный курсив шрифта Times New Roman

Это пример подчеркнутого текста.

Сдедует иметь в виду, что если текстовый редактор позво ляем менять шрифты, начертания и размеры, то в памяти приходится хранить не только коды символов, но и указа ние да способ их изображения. Это увеличивает размер файла о текстом. Информацию о шрифтах воспринимают про граммы, управляющие выводом текста на экран или на печать. Именно они и создают изображение символов в нуж ной форме.

Практически все редакторы, распространенные в нашей стреле, позволяют использовать как русский, так и анг лийский алфавиты.

This is an example of English text.

ТЕМА УРОКА: Форматирование абзацев.

Абзац является одним из основных объектов текстового документа. Абзац с литературной точки зрения — это часть текста, представляющая собой законченный по смыслу фрагмент произведения, окончание которого служит естественной паузой для перехода к новой мысли.

В компьютерных документах абзацем считается любой текст, заканчивающийся управляющим символом (маркером) конца абзаца. Ввод конца абзаца обеспечивается нажатием клавиши <Еп t е r > и отображается символом ¶, если включен режим отображения непечатаемых символов.

1. Форматирование абзацев

1. Для включения режима ото­бражения непечатаемых сим­волов абзаца ввести команду [Сервис-Параметры. ] и на диалоговой панели Парамет­ры на вкладке Вид установить флажок символы абзацев.

Абзац может состоять из любого набора символов, рисунков и объектов других приложений. Форматирование абзацев позволяет подготовить правильно и красиво оформленный документ.

Выравнивание абзацев. Выравнивание отражает расположение текста относительно границ полей страницы. Чаще всего используют четыре способа выравнивания абзацев:

По левому краю — левый край ровный, а правый рваный.

По центру — оба края имеют неровные очертания, однако каждая строка абзаца симметрична относительно середины.

По правому краю — правый край ровный, а левый рваный.

По ширине — оба края ровные, то есть располагаются точно по границам страницы. В этом случае последняя строка абзаца ведет себя как при левостороннем выравнивании.

Отступ первой строки (красная строка). Чаще всего абзац начинается отступом первой строки. Отступ может быть различных типов.

Положительный отступ (отступ), когда первая строка начинается правее всех остальных строк абзаца, применяется в обычном тексте.

Отрицательный отступ (выступ), когда первая строка выходит влево относительно остальных строк абзаца, применяется в словарях и определениях.

Нулевой отступ, применяется для абзацев, выровненных по центру и для обычного текста.

Отступ абзаца слева, все строки абзаца смещены на заданное расстояние вправо.

Отступ абзаца справа, все строки абзаца смещены на заданное расстояние влево.

2. Для выравнивания абзаца ввести команду [Формат-Абзац. ] и на появившейся диалоговой панели Абзац сделать необходимые установки. На вкладке Отступы и интервалы для установки типа выравнивания выделенных абзацев выбрать соответствующий элемент раскрывающегося списка Выравнивание:.

Для установки типа отступа первой строки абзаца выбрать необходимое значение в раскрывающемся списке первая строка: и установить конкретное числовое значение отступа с помощью счетчика. Для задания отступа абзаца целиком от границ полей страницы выбрать нужное значение отступа с помощью счетчиков Отступ слева: и справа:.

Для того чтобы текст выходил на левое (правое) поле страницы, задать отрицательное значение отступа.

Расстояние между строками документа можно изменять, задавая различные значения междустрочных интервалов (одинарный, двойной и так далее). Для визуального отделения абзацев друг от друга можно устанавливать увеличенные интервалы между абзацами.

3. Межстрочный интервал выбирают с помощью выпадающего списка междустрочный:, а интервал перед (после) абзаца — с помощью счетчиков Интервал перед: и после.

4. Вкладка Положение на странице позволяет установить требуемое распределение абзацев по страницам, то есть можно запретить разрывать абзац между страницами, оставлять на странице первую или последнюю (висячую) строку и так далее. Часто бывает полезно запретить в абзаце автоматический перенос слов.

Абзац с выравниванием по левому краю, отступ пер­ вой строки, шрифт Times New Roman, размер 10 пт, курсив.

Абзац с выравниванием по левому краю, отступ пер­ вой строки, шрифт Times New Roman, размер 12 пт, подчеркнутый.

Тема урока: Форматирование текста.

Цель урока: Рассмотреть понятие формата текста. Орфографический контроль. Работа с файлами.

1. Организация класса: Д/з §___, стр.______, учить конспекты, выучить определения.

2. Проверка Д/з: Опросить по дом. §____, опрос с места по конспекту (определения).

Под форматом печатного текста понимается расположение строк (длина строки, межстрочное расстояние, выравнивание текста по краю или по середине строки); размеры полей, страниц.

Параметры формата (размер строки, межстрочное расстояние) устанавливаются пользователем перед вводом текста и в дальнейшем автоматически выдерживаются текстовым редактором. Пользователю остается только набирать текст.

Так, например, текстовый редактор управляет размером строки. После установки размера строки текстовый редактор сам следит за окончанием строк: как только длина набираемой строки достигнет предела, происходит переход к новой строке (в память записывается символ конца строки).
При переходе к новой строке может происходить автома­тическое выравнивание набранной строки по краям или по центру текста, если режим выравнивания установлен в текстовом редакторе. Вот два примера текста: в первом режим выравнивания правого края был установлен, во втором — нет.

У лукоморья дуб зеленый,

Златая цепь на дубе том.

И днем и ночью кот ученый

Все ходит по цепи кругом.

У лукоморья дуб зеленый,

Златая цепь на дубе том.

И днем и ночью кот ученый

Все ходит по цепи кругом.

Некоторые текстовые редакторы производят автоматический перенос слов, соблюдая правила переноса.

Если вы ввели текст в определенном формате, а потом решили изменить формат, то с помощью текстового редактора это легко сделать. Достаточно установить новые параметры формата и отдать команду «Переформатировать текст» (весь текст, или абзац, или выделенный фрагмент текста).

Редкий человек не делает при письме ошибок. Когда воз­никают сомнения в написании какого-нибудь слова, мы за­глядываем в орфографический словарь. Современный текстовый редактор может помочь пользователю и в такой ситуации. В тех текстовых редакторах, в которых реализован режим орфографического (лексического) контроля, во внешней памяти хранится достаточно большой словарь. Благодаря этому становится возможным автоматический поиск ошибок в тексте.

Часто текстовые редакторы дают возможность пользова­телю дополнять свой орфографический словарь. Пользуясь э той возможностью, будьте очень внимательны. Не внесите в словарь ошибок!

Дисковая память — хранилище текстов, создаваемых с помощью текстового редактора. Значит, работая с текстовым редактором, пользователь должен иметь возможность выполнять основные файловые операции:

— создать новый файл;

— сохранить текст в файле;

— открыть файл (загрузить текст из файла в оперативную
память).

В системе команд текстового редактора имеется коман­да включения режима работы с файлами. Обычно она так и называется: ФАЙЛ. Затем пользователь отдает одну из команд: СОЗДАТЬ, СОХРАНИТЬ, ОТКРЫТЬ. Обращение к конкретному файлу происходит путем указания его имени.

Тексты, создаваемые с помощью текстового редактора, в конечном итоге распечатываются на бумаге. Для этого предусмотрен режим печати. Он включается командой ПЕЧАТЬ.

Во-первых, компьютер для этого должен быть оснащен устройством печати — принтером. Во-вторых, поскольку существует очень много разных типов принтеров, то компьютер должен быть настроен на работу именно с тем принтером, который имеется в наличии. Настройка на тип принтера происходит путем установки специальной системной программы управления принтером, называемой драйвером. Поэтому имейте в виду, что если на вашей машине не пошла печать, то это еще не значит, что неисправен принтер. Вполне возможно, что с принтером работает «чужой» драйвер.

Обычно текстовые редакторы позволяют настроить рабо­ту принтера на определенный режим. Можно, например, выполнить черновую печать, которая производится быстрее всего, но с низким качеством, можно установить режим вы­сококачественной печати, если требуется получить «краси­вый» документ.

Одно из главных условий «дружественности» программно­го обеспечения — наличие помощи пользователю. Это делается в форме подсказки, справочника, учебника, хранимого во внешней памяти компьютера. Обычно обращение к режиму помощи происходит по команде СПРАВКА или ПОМОЩЬ или «?». Получив справку, пользователь выходит из режи­ма помощи и возвращается к тому этапу работы, который был прерван.

Основные режимы работы текстового редактора:

1. Перечислите основные режимы работы текстового редактора.

2. Какие основные типы шрифтов используются в текстовом ре дакторе?

3. Что понимается под форматированием текста?

4. Что такое фрагмент текста? Какие действия с ним можно вы полнять?

5. Какие возможности предоставляет многооконный редактор?

6. Как осуществляется в текстовом редакторе поиск и замена?

7. Что такое орфографический контроль? На каком устройстве хранится орфографический словарь?

8. Какие файловые операции можно выполнять, работая в тексто вом редакторе?

9. Как распечатать текст на бумаге? Какие технические и про граммные средства для этого необходимы?

10. Как воспользоваться режимом помощи?

Что должны научиться делать, изучив данную тему ученики:

o Набирать текст в одном из текстовых редакторов.

o Выполнять основные операции над текстом, допускаемые этим редактором.

o Сохранять текст на диске, загру­ жать его с диска, выводить на пе чать.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *