Основные способы обработки большого количества текстовой информации
Состав работы
|
|
|
|
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
АННОТАЦИЯ
Реферат составлен на страницах. Содержит 2 рисунка, 3 таблицы и 2 приложения.
Ключевые слова: адресация, автокоррекция, сжатие.
Целью реферата является разработка и описание трех практических задач современной информатики:
адресации элементов баз данных, множества или списка, для определения по первичному ключу местоположения элемента в блоке информации;
автокоррекции языковых текстов для обнаружения и исправления ошибок в текстах;
сжатии данных, для хранения данных в предельно компактной форме.
СОДЕРЖАНИЕ
АННОТАЦИЯ 2
СОДЕРЖАНИЕ 3
Введение 4
ЧАСТЬ 1. МЕТОДЫ АДРЕСАЦИИ 5
ВВЕДЕНИЕ 5
1. Теоретическая часть 5
1.1. Последовательное сканирование списка 5
1. 2. Блочный поиск 5
1.3. Двоичный поиск 5
1.4. Индексно-последовательная организация 6
1.5. Индексно-произвольная организация 6
1.6. Адресация с помощью ключа, эквивалентного адресу 7
1.7. Алгоритм преобразования ключа в адрес 8
Выводы по части 1. 10
ЧАСТЬ 2. АВТОКОРРЕКЦИЯ ТЕКСТА 11
ВВЕДЕНИЕ 11
1. Теоретическая часть 11
1.1. Методы обнаружения ошибок 11
1.2. Автоматизация процесса исправления 11
1.3. Диалоговый и пакетный режимы 12
Выводы по части 2. 13
ЧАСТЬ 3. СЖАТИЕ ИНФОРМАЦИИ 13
ВВЕДЕНИЕ 13
Теоретическая часть 13
1.1. Сжатие числовых данных 13
1.2. Сжатие словарей 13
1.3. Сжатие специальных текстов 14
1.4. Сжатие структурированных данных 15
1.5. Сжатие текстовой информации общего вида 15
1.5.1. Адаптивные алгоритмы 16
1.5.2. Статистические алгоритмы. 16
1.5.2.1. Кодирование фрагментов фиксированной длины 16
1.5.2.2. Кодирование фрагментов переменной длины 17
Выводы по части 3. 17
ПРИЛОЖЕНИЕ 1. Методы сжатия данных 18
Метод Шеннона-Фано 18
Метод Хаффмена 18
Заключение. 20
Список литературы 20
Введение
Настоящий реферат состоит из трех самостоятельных частей, в которых излагаются три практические задачи современной информатики – адресация элементов данных линейного списка, автокоррекция естественно языковых текстов, сжатие данных.
Они призваны, с одной стороны, для ознакомления с некоторыми практическими задачами информатики, а с другой – закрепить навыки прикладного программирования и составления блок-схем.
Первая задача нашла свое применение в таких программных продуктах, как системы управления базами данных, операционные системы (организация поисковых операций в системных данных), компиляторы (работа с таблицами идентификаторов) и многих других. Алгоритмы адресации имеют универсальный характер и используются практически во всех задачах, в которых ведется организация и поиск информации в одномерных массивах, независимо от места ее нахождения – основная память или внешняя.
Вторая задача носит более частный характер, а изложенные методы используются при проверке орфографии в текстовых и табличных процессорах, издательских системах, а также как средство верификации результатов работы сканера – после распознавания текста для устранения возможных ошибок выполняется его орфографический анализ.
Проблема сжатия данных решается в современных архиваторах. Они, как правило, используют комбинацию методов, изложенных в третьей части.
Реферат составлен на страницах. Содержит 2 рисунка, 3 таблицы и 2 приложения.
Ключевые слова: адресация, автокоррекция, сжатие.
Целью реферата является разработка и описание трех практических задач современной информатики:
адресации элементов баз данных, множества или списка, для определения по первичному ключу местоположения элемента в блоке информации;
автокоррекции языковых текстов для обнаружения и исправления ошибок в текстах;
сжатии данных, для хранения данных в предельно компактной форме.
СОДЕРЖАНИЕ
АННОТАЦИЯ 2
СОДЕРЖАНИЕ 3
Введение 4
ЧАСТЬ 1. МЕТОДЫ АДРЕСАЦИИ 5
ВВЕДЕНИЕ 5
1. Теоретическая часть 5
1.1. Последовательное сканирование списка 5
1. 2. Блочный поиск 5
1.3. Двоичный поиск 5
1.4. Индексно-последовательная организация 6
1.5. Индексно-произвольная организация 6
1.6. Адресация с помощью ключа, эквивалентного адресу 7
1.7. Алгоритм преобразования ключа в адрес 8
Выводы по части 1. 10
ЧАСТЬ 2. АВТОКОРРЕКЦИЯ ТЕКСТА 11
ВВЕДЕНИЕ 11
1. Теоретическая часть 11
1.1. Методы обнаружения ошибок 11
1.2. Автоматизация процесса исправления 11
1.3. Диалоговый и пакетный режимы 12
Выводы по части 2. 13
ЧАСТЬ 3. СЖАТИЕ ИНФОРМАЦИИ 13
ВВЕДЕНИЕ 13
Теоретическая часть 13
1.1. Сжатие числовых данных 13
1.2. Сжатие словарей 13
1.3. Сжатие специальных текстов 14
1.4. Сжатие структурированных данных 15
1.5. Сжатие текстовой информации общего вида 15
1.5.1. Адаптивные алгоритмы 16
1.5.2. Статистические алгоритмы. 16
1.5.2.1. Кодирование фрагментов фиксированной длины 16
1.5.2.2. Кодирование фрагментов переменной длины 17
Выводы по части 3. 17
ПРИЛОЖЕНИЕ 1. Методы сжатия данных 18
Метод Шеннона-Фано 18
Метод Хаффмена 18
Заключение. 20
Список литературы 20
Введение
Настоящий реферат состоит из трех самостоятельных частей, в которых излагаются три практические задачи современной информатики – адресация элементов данных линейного списка, автокоррекция естественно языковых текстов, сжатие данных.
Они призваны, с одной стороны, для ознакомления с некоторыми практическими задачами информатики, а с другой – закрепить навыки прикладного программирования и составления блок-схем.
Первая задача нашла свое применение в таких программных продуктах, как системы управления базами данных, операционные системы (организация поисковых операций в системных данных), компиляторы (работа с таблицами идентификаторов) и многих других. Алгоритмы адресации имеют универсальный характер и используются практически во всех задачах, в которых ведется организация и поиск информации в одномерных массивах, независимо от места ее нахождения – основная память или внешняя.
Вторая задача носит более частный характер, а изложенные методы используются при проверке орфографии в текстовых и табличных процессорах, издательских системах, а также как средство верификации результатов работы сканера – после распознавания текста для устранения возможных ошибок выполняется его орфографический анализ.
Проблема сжатия данных решается в современных архиваторах. Они, как правило, используют комбинацию методов, изложенных в третьей части.
Другие работы
Ответы на тест. Управление в социальной сфере. Синергия
ann1111
: 17 февраля 2024
Управление в социальной сфере (обучение)
Тема 1. Понятия и концепции социального развития
Тема 2. Государственное регулирование доходов населения
Тема 3. Регулирование труда и занятости. Социальная поддержка населения
Тема 4. Управление отраслями социальной сферы
Тема 5. Управление отраслями социальной сферы
270 руб.
Пневмокомпенсатор ПК-70-25 Сборочный чертеж-Чертеж-Оборудование для бурения нефтяных и газовых скважин-Курсовая работа-Дипломная работа
https://vk.com/aleksey.nakonechnyy27
: 10 июня 2016
Пневмокомпенсатор ПК-70-25 Сборочный чертеж-(Формат Компас-CDW, Autocad-DWG, Adobe-PDF, Picture-Jpeg)-Чертеж-Оборудование для бурения нефтяных и газовых скважин-Курсовая работа-Дипломная работа
349 руб.
Домкрат - А6ГР.01.22.00.000 Деталирование
HelpStud
: 17 сентября 2025
По заданию выполнено:
-3D модели всех деталей;
-3D сборка (с разносом компонентов);
-Сборочный чертеж;
-Спецификация.
- Чертежи всех деталей и стандартных изделий (деталирование)
А6ГР.01.22.00.000 СБ - Домкрат Сборочный чертеж
А6ГР.01.22.01.000 СБ - Корпус сварной Сборочный чертеж
А6ГР.01.22.00.001 - Втулка
А6ГР.01.22.00.002 - Винт подъемный
А6ГР.01.22.00.003 - Пята
А6ГР.01.22.00.004 - Рукоятка
А6ГР.01.22.00.005 - Кольцо
А6ГР.01.22.01.001 - Основание
А
250 руб.
Технология и организация работ по укладке магистрального газопровода Dy700мм методом продавливания-Сооружение газонефтепроводов и газонефтехранилищ-Оборудование транспорта и хранения нефти и газа-Курсовая работа
nakonechnyy.1992@list.ru
: 7 июня 2023
Технология и организация работ по укладке магистрального газопровода Dy700мм методом продавливания-Сооружение газонефтепроводов и газонефтехранилищ-Оборудование транспорта и хранения нефти и газа-Курсовая работа
Актуальность работы: наиболее часто встречающимися искусственными преградами при прокладке магистральных газопроводов являются автомобильные и железные дороги. На магистральных дорогах движение транспорта настолько интенсивно, что даже в ночное время трудно выбрать отрезок времени для ус
794 руб.