Основные способы обработки большого количества текстовой информации
Состав работы
|
|
|
|
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
АННОТАЦИЯ
Реферат составлен на страницах. Содержит 2 рисунка, 3 таблицы и 2 приложения.
Ключевые слова: адресация, автокоррекция, сжатие.
Целью реферата является разработка и описание трех практических задач современной информатики:
адресации элементов баз данных, множества или списка, для определения по первичному ключу местоположения элемента в блоке информации;
автокоррекции языковых текстов для обнаружения и исправления ошибок в текстах;
сжатии данных, для хранения данных в предельно компактной форме.
СОДЕРЖАНИЕ
АННОТАЦИЯ 2
СОДЕРЖАНИЕ 3
Введение 4
ЧАСТЬ 1. МЕТОДЫ АДРЕСАЦИИ 5
ВВЕДЕНИЕ 5
1. Теоретическая часть 5
1.1. Последовательное сканирование списка 5
1. 2. Блочный поиск 5
1.3. Двоичный поиск 5
1.4. Индексно-последовательная организация 6
1.5. Индексно-произвольная организация 6
1.6. Адресация с помощью ключа, эквивалентного адресу 7
1.7. Алгоритм преобразования ключа в адрес 8
Выводы по части 1. 10
ЧАСТЬ 2. АВТОКОРРЕКЦИЯ ТЕКСТА 11
ВВЕДЕНИЕ 11
1. Теоретическая часть 11
1.1. Методы обнаружения ошибок 11
1.2. Автоматизация процесса исправления 11
1.3. Диалоговый и пакетный режимы 12
Выводы по части 2. 13
ЧАСТЬ 3. СЖАТИЕ ИНФОРМАЦИИ 13
ВВЕДЕНИЕ 13
Теоретическая часть 13
1.1. Сжатие числовых данных 13
1.2. Сжатие словарей 13
1.3. Сжатие специальных текстов 14
1.4. Сжатие структурированных данных 15
1.5. Сжатие текстовой информации общего вида 15
1.5.1. Адаптивные алгоритмы 16
1.5.2. Статистические алгоритмы. 16
1.5.2.1. Кодирование фрагментов фиксированной длины 16
1.5.2.2. Кодирование фрагментов переменной длины 17
Выводы по части 3. 17
ПРИЛОЖЕНИЕ 1. Методы сжатия данных 18
Метод Шеннона-Фано 18
Метод Хаффмена 18
Заключение. 20
Список литературы 20
Введение
Настоящий реферат состоит из трех самостоятельных частей, в которых излагаются три практические задачи современной информатики – адресация элементов данных линейного списка, автокоррекция естественно языковых текстов, сжатие данных.
Они призваны, с одной стороны, для ознакомления с некоторыми практическими задачами информатики, а с другой – закрепить навыки прикладного программирования и составления блок-схем.
Первая задача нашла свое применение в таких программных продуктах, как системы управления базами данных, операционные системы (организация поисковых операций в системных данных), компиляторы (работа с таблицами идентификаторов) и многих других. Алгоритмы адресации имеют универсальный характер и используются практически во всех задачах, в которых ведется организация и поиск информации в одномерных массивах, независимо от места ее нахождения – основная память или внешняя.
Вторая задача носит более частный характер, а изложенные методы используются при проверке орфографии в текстовых и табличных процессорах, издательских системах, а также как средство верификации результатов работы сканера – после распознавания текста для устранения возможных ошибок выполняется его орфографический анализ.
Проблема сжатия данных решается в современных архиваторах. Они, как правило, используют комбинацию методов, изложенных в третьей части.
Реферат составлен на страницах. Содержит 2 рисунка, 3 таблицы и 2 приложения.
Ключевые слова: адресация, автокоррекция, сжатие.
Целью реферата является разработка и описание трех практических задач современной информатики:
адресации элементов баз данных, множества или списка, для определения по первичному ключу местоположения элемента в блоке информации;
автокоррекции языковых текстов для обнаружения и исправления ошибок в текстах;
сжатии данных, для хранения данных в предельно компактной форме.
СОДЕРЖАНИЕ
АННОТАЦИЯ 2
СОДЕРЖАНИЕ 3
Введение 4
ЧАСТЬ 1. МЕТОДЫ АДРЕСАЦИИ 5
ВВЕДЕНИЕ 5
1. Теоретическая часть 5
1.1. Последовательное сканирование списка 5
1. 2. Блочный поиск 5
1.3. Двоичный поиск 5
1.4. Индексно-последовательная организация 6
1.5. Индексно-произвольная организация 6
1.6. Адресация с помощью ключа, эквивалентного адресу 7
1.7. Алгоритм преобразования ключа в адрес 8
Выводы по части 1. 10
ЧАСТЬ 2. АВТОКОРРЕКЦИЯ ТЕКСТА 11
ВВЕДЕНИЕ 11
1. Теоретическая часть 11
1.1. Методы обнаружения ошибок 11
1.2. Автоматизация процесса исправления 11
1.3. Диалоговый и пакетный режимы 12
Выводы по части 2. 13
ЧАСТЬ 3. СЖАТИЕ ИНФОРМАЦИИ 13
ВВЕДЕНИЕ 13
Теоретическая часть 13
1.1. Сжатие числовых данных 13
1.2. Сжатие словарей 13
1.3. Сжатие специальных текстов 14
1.4. Сжатие структурированных данных 15
1.5. Сжатие текстовой информации общего вида 15
1.5.1. Адаптивные алгоритмы 16
1.5.2. Статистические алгоритмы. 16
1.5.2.1. Кодирование фрагментов фиксированной длины 16
1.5.2.2. Кодирование фрагментов переменной длины 17
Выводы по части 3. 17
ПРИЛОЖЕНИЕ 1. Методы сжатия данных 18
Метод Шеннона-Фано 18
Метод Хаффмена 18
Заключение. 20
Список литературы 20
Введение
Настоящий реферат состоит из трех самостоятельных частей, в которых излагаются три практические задачи современной информатики – адресация элементов данных линейного списка, автокоррекция естественно языковых текстов, сжатие данных.
Они призваны, с одной стороны, для ознакомления с некоторыми практическими задачами информатики, а с другой – закрепить навыки прикладного программирования и составления блок-схем.
Первая задача нашла свое применение в таких программных продуктах, как системы управления базами данных, операционные системы (организация поисковых операций в системных данных), компиляторы (работа с таблицами идентификаторов) и многих других. Алгоритмы адресации имеют универсальный характер и используются практически во всех задачах, в которых ведется организация и поиск информации в одномерных массивах, независимо от места ее нахождения – основная память или внешняя.
Вторая задача носит более частный характер, а изложенные методы используются при проверке орфографии в текстовых и табличных процессорах, издательских системах, а также как средство верификации результатов работы сканера – после распознавания текста для устранения возможных ошибок выполняется его орфографический анализ.
Проблема сжатия данных решается в современных архиваторах. Они, как правило, используют комбинацию методов, изложенных в третьей части.
Другие работы
Токарний верстат з найбільшим діаметром обробки 320 мм і розробка технологічного процесу виготовлення деталі Вал
Aronitue9
: 23 декабря 2014
1.Тема проекту(роботи)__ Проект токарного верстата з найбiльшим дiаметром обробки 320 мм і розробкою технологічного процесу виготовлення деталі”Вал”
3. Вихiднi данi до проекту(роботи)_Верстат нормальної точності, відстань між центрами 750 мм, потужність головного двигуна 4.5 кВт, границі швидкостей шпинделю 20-2000 об/хвил.,_границі значень подач 0.05 - 2.8 мм/об___________________
4. Змiст розрахунково-пояснювальноi записки(перелiк питань, що iх належить розробити)
Вибір компоновки та тех
350 руб.
Сети радиодоступа (часть 2-я) . Вариант №35
IT-STUDHELP
: 26 ноября 2021
Курсовая работа
по дисциплине «Сети радиодоступа часть 2»
на тему «Проектирования сети беспроводного широкополосного доступа»
Оглавление
Введение 3
1. Сравнение существующих систем радиодоступа и обоснование выбора для проектируемой сети 4
2. Описание и технические характеристики аппаратуры, реализующей технологию WiMAX 6
3. Разработка структуры проектируемой сети 9
4. Расчет зоны обслуживания с использованием модели Окамуры-Хата 10
5. Расчет радиуса зоны в свободном пространстве 18
6. Определ
1000 руб.
Экзаменационная работа по дисциплине: Дискретная математика. Билет 9
Александр404
: 15 мая 2019
Билет № 9
Факультет ИВТ (ДО) Курс 1 Семестр 2
Дисциплина Дискретная математика
1) Чем отличаются разбиения и покрытия? Что такое отношение эквивалентности? (дать определения, проиллюстрировать на примерах).
2) Карты Карно: построение, определения, использование для нахождения упрощенного представления функции, для упрощения частично определенной функции. Привести примеры.
3) Используя полиномиальную теорему, определить, чему равен коэффициент при x^(5)*y*z^(4) в выражениях: (2x+3y+2z^(2))^(10
300 руб.
Система регулювання зовнішньоекономічної діяльності в Україні
Qiwir
: 22 ноября 2013
План
Організаційна структура управління зовнішньоекономічною діяльністю в Україні.
Система методів державного регулювання зовнішньої торгівлі.
1. Згідно закону України “Про зовнішньоекономічну діяльність” Україна самостійно формує систему та структуру державного регулювання зовнішньоекономічної діяльності на своїй території.
Державне регулювання зовнішньоекономічної діяльності повинно забезпечити:
захист економічних інтересів України і законних інтересів суб’єктів зовнішньоекономічної діяль
10 руб.