Вычислительные системы, сети и телекоммуникации. ЛекцииРефераты >> Программирование и компьютеры >> Вычислительные системы, сети и телекоммуникации. Лекции
ТЕКСТОВЫЕ ПРОЦЕССОРЫ
1. Виды текстов.
Все современные вычислительные машины имеют пакеты прикладных программ. На автоматизированных рабочих местах пользователей происходит централизация пакетов и их интеграция.
Интеграция ППП требует от пользователя достаточно высокой квалификации. Многие пакеты содержат не только прикладные проги, но и имеют встроенные средства разработки приложений.
Изначально все ВМ создавались для автоматизации вычислителей. Однако в настоящее время доля чистых вычислений мала - 9-10%, а остальное время уходит для обработки специфических видов информации. Доля обработки текстов, справок - 20% - для обработки графики.
Для обработки специфической информации (текстовой, графической, рисунков, фотографий) современные классические структуры ЭВМ подходят плохо. Только в последних разработках CPU Pentium MMX включены 57 новых команд для обработки специальной информации.
Суть команд: большой операцией можно обрабатывать большое количество точек находящихся на экране.
Программное обеспечение связанное с обработкой текстов получило название текстовых процессоров.
С каждым текстом связаны определенные особенности.
Текст - документ.
С понятием документа связано 4 аспекта:
1 аспект - содержательный, предполагает ясность и точность изложения, лаконизм достоверность информации, ее полнота, своевременность.
2 аспект - изобразительный (как выглядит документ). Визуальное впечатление от документа, какие средства использованы, шрифт, стиль, рубрикация документа.
3 аспект - операционный (какие средства использованы для подготовки документа)
4 аспект - внутримашинный (способ обработки и хранения). Он показывает, какая память нужна для обработки документа, какие средства должны привлекаться для работы документа.
Различают следующие виды документов:
1. Прозаический (от справки)
2. Табличный (символы)
3. Программный текст (для записи различных программ). Исторически этот тип появился первым.
Практически любые ППП содержат собственные средства для разработки собственные прог. Например: турбо-паскаль, турбо-си.
4. Поэтический (четверостишья и т.д.)
5. Графический (нет определяющих символов, а поле экрана предоставляется в определенной яркости и цветности). Каждая точка 16 цветов. Наиболее простые текстовые процессоры вместо графики используют псевдографику (для построения таблиц и т.д.).
6. Формульный текст (наличие строк, подстрок). Имеются верхние и нижние индексы.
7. Шаблонный
8. Смешанный (включающий любые сочетания из перечисленных).
2. Классификация текстовых процессоров.
В зависимости от используемого программного обеспечения пользователь имеет дело с различными текстовыми редакторами. Все они различаются своими возможностями и используемыми средствами.
В порядке нарастания их мощности:
1. Самые простые - встроенный редактор ДОС (F6 + ctrl Z) позволяет работать только с одной строчкой.
2. Встроенный редактор Norton, до 32 кб (позволяет обрабатывать до 20 страниц).
3. Редакторы компьютерных прог (турбо-паскаль, турбо-си).
4. Общепользовательские редакторы (Word, Lexicon, Multedit (только тексты), Wordstar).
5. Редакторы научных документов, использующихся для записи формул Unveditor, Chiwriter, Rt-chk.
6. Редакторы издательских систем. Имеют большой спектр для разработки издательских документов большой сложности (Word (самая маломощная), Page Marker, Ventura Publisher.
Размещение текстов по странице - верстка.
7. Корректоры текстов (исправляющие ошибки).
Спеллеры - средства для обнаружения ошибок, воспроизведение текста. Orfo.
8. Перекодировщики текстов. В интернете существует 4 различных кодировки текста.
3. Основные операции.
Любой текстовый процессор должен содержать следующие процедуры:
- процедуры набора и ввода текста
- редактирование текста
- печати документов
- ведение архивов
1 символ - 1 байт
256 различных комбинаций
Кроме стандартов имеются символы управляющие печатью. Управляющие символы включают в действие определенные проги.
Нажатие на enter, означает то, что в стандартном буфере данных, рассчитанном на 80 символов, закончить заполнение буфера на данной позиции. Содержимое буфера поместить в оперативную память, затем очистить. Буфер и курсор поместить в начало буфера для заполнения.
4. Тенденции развития.
4.1. Понятие гипертекста.
В настоящее время большое количество текстовых документов оседает в хранилищах автоматизированных данных, например в интернете. Организация хранилища, выборки и обработки текстовых документов предполагает их формализацию. При этом эта формализация несколько скрыта от пользователя.
Формализация в процессе поиска осущест. сл. обр.
1. Выявляются признаки, по которым мы будем осуществлять поиск необходимых документов. В количестве таких документов берутся ключевые слова.
Обычно в качестве ключевых слов рассматривают корни основных терминов + суффиксы.
Кроме ключевых слов каждая отрасль оперирует ключевыми понятиями. Это группы слов или определенные значения известных слов.
Словарь ключевых понятий называется «тезаурус». В пространстве ключевых понятий каждый документ образует своеобразный вектор. Вес каждого понятия определяется частотой его повторения в документе. Для поиска необходимых документов составляется поисковый образ, вектор которого показывает какой документ нам требуется.
Пример: А=16 (1), 27 (3), 195 (4), 327 (1), 592 (3).
16 - 16 слово
(1) - встречается 1 раз
Предположим, что в документе Д1 - 16 (2), 82 (3), 195 (2), 327 (2), 984 (2).
16 слово - 2 разряда
Белый шум - это выдача ложных сообщений на поисковый образ.
Чтобы ослабить влияние белого шума используется обратная связь. Обратная связь пользователей, в которой он дает свое отношение к результатам поиска позволяет усилить или ослабить веса отдельных составляющих вектора, что позволит в большей степени учесть интересы пользователей и усилить эффект работы системы.
4.1. Ключевые слова в документе позволяют провести нелинейную организацию текста. При этом поиск данных и их обработка осуществляется ассоциативно.
В интернете существует язык HTML - позволяет описывать ключевые слова в гипер-тексе.
4.1.2. Продукты мультимедиа предполагают дополнение гипертекста звуковыми и видео эффектами, что усиливает психологическое и эмоциональное воздействие на человека. Считается, что 70% информации человек принимает через органы зрения, 20% через органы слуха, смысловой канал - 8%.
Все продукты мультимедиа затрагивают в основном программное обеспечение ЭВМ, однако количественное воспроизведение звуковых и видеоэффектов накладывает требования и на технические средства. Продукты мультимедиа находят свое применение в интерактивных видеодисках (игры). Мультимедиа - различные тренажеры (летчики), обучающие среды, изучение различных новых технологий.