Страницу Назад
Поискать другие аналоги этой работы

40

Теория информации. Лабораторная работа № 1- № 5

ID: 176399
Дата закачки: 05 Января 2017
Продавец: gnv1979 (Напишите, если есть вопросы)
    Посмотреть другие работы этого продавца

Тип работы: Работа Лабораторная
Сдано в учебном заведении: ДО СИБГУТИ

Описание:
Тема: Вычисление энтропии Шеннона
Цель работы: Экспериментальное изучение свойств энтропии Шеннона.
Среда программирования: любая с С-подобным языком программирования.
Результат: программа, тестовые примеры, отчет.
Задание:
1. Для выполнения данной лабораторной работы необходимо предварительно сгенерировать два файла. Каждый файл содержит последовательность символов, количество различных символов больше 2 (3,4 или 5). Объем файлов больше 10 Кб, формат txt.
Первый файл (назовем его F1) должен содержать последовательность символов с равномерным распределением, т.е. символы встречаются в последовательности равновероятно и независимо.
Второй файл (F2) содержит последовательность символов с неравновероятным распределением.
2. Составить программу, определяющую несколько оценок энтропии созданных текстовых файлов. Оценки энтропии необходимо вычислить по формуле Шеннона двумя способами, т.е. используя частоты отдельных символов и используя частоты пар символов. По желанию можно продолжить процесс вычисления оценок с использованием частот троек, четверок символов и т.д.
3. После тестирования программы необходимо заполнить таблицу для отчета и проанализировать полученные результаты.
 Оценка энтропии
(частоты отдельных символов) Теоретическое значение энтропии
(отдельные символы) Оценка энтропии
(частоты пар символов) Теоретическое значение энтропии
(для пар символов)
F1    
F2    

Тема: Вычисление энтропии Шеннона
Цель работы: Экспериментальное изучение свойств энтропии Шеннона.
Среда программирования: любая с С-подобным языком программирования.
Результат: программа, тестовые примеры, отчет.
Задание:
1. Составить программу, определяющую несколько оценок энтропии текстового файла (размер не менее 10 Кб). Оценки энтропии необходимо вычислить по формуле Шеннона двумя способами, т.е. используя частоты отдельных символов и используя частоты пар символов. По желанию можно продолжить процесс вычисления оценок с использованием частот троек, четверок символов и т.д.
Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают. При использовании текста программы учитываются все символы, кроме знаков табуляции.
2. После тестирования программы необходимо заполнить таблицу для отчета и проанализировать полученные результаты. Сравнить полученные результаты с результатами лабораторной работы 1.
Название текста Максимально возможное значение энтропии Оценка энтропии
(одиночные символы) Оценка энтропии
(частоты пар символов)
Текст №1
(фрагмент художественного произведения)     
Текст №2 (фрагмент художественного произведения)     
Текст написанной программы     

Тема: Оптимальное побуквенное кодирование.
Цель работы: Изучение метода оптимального кодирования Хаффмана.
Среда программирования: любая с С-подобным языком программирования.
Результат: программа, тестовые примеры, отчет.
1. Запрограммировать процедуру двоичного кодирования текстового файла методом Хаффмана. Текстовые файлы использовать те же, что и в лабораторных работах №1,2. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают.
2. Проверить, что полученный код является префиксным.
3. После кодирования текстового файла вычислить оценки энтропии выходной последовательности, используя частоты отдельных символов, пар символов и троек символов.
4. Заполнить таблицу и проанализировать полученные результаты.
Метод
кодирования Название текста Оценка
избыточности кодирования  Оценка энтропии выходной посл-ти (частоты символов) Оценка энтропии выходной посл-ти (частоты пар символов) Оценка энтропии выходной посл-ти (частоты троек символов)
Метод Хаффмана Текст №1    
 Текст №2    
Избыточность кодирования определяется как , где H – энтропия текста, Lcp – средняя длина кодового слова.
Тема: Методы почти оптимального кодирования.
Цель работы: Изучение метода почти оптимального кодирования Фано.
Среда программирования: любая с С-подобным языком программирования.
Результат: программа, тестовые примеры, отчет.
1. Запрограммировать процедуры двоичного кодирования текстового файла методом Фано. Текстовые файлы использовать те же, что и в лабораторной работе №1 и 2. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают.
2. Проверить, что полученный код является префиксным.
3 После кодирования текстового файла вычислить оценки энтропии выходной последовательности, используя частоты отдельных символов, пар символов и тройки символов.
4. После тестирования программы необходимо заполнить таблицу и проанализировать полученные результаты.
Метод
кодирования Название текста Оценка
избыточности кодирования Оценка энтропии выходной посл-ти (частоты символов) Оценка энтропии выходной посл-ти (частоты пар символов) Оценка энтропии выходной посл-ти (частоты троек символов)
Метод Хаффмана Текст №1    
 Текст №2    
Метод Фано Текст №1    
 Текст №2    
Избыточность кодирования определяется как , где H – энтропия текста, Lcp – средняя длина кодового слова.
Тема: Почти оптимальное кодирование
Цель работы: Изучение метода почти оптимального кодирования Шеннона.
Среда программирования: любая с С-подобным языком программирования.
Результат: программа, тестовые примеры, отчет.
1. Запрограммировать процедуру двоичного кодирования текстового файла методом Шеннона. Текстовые файлы использовать те же, что и в лабораторной работе №1-4. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают.
2. Проверить, что полученный код является префиксным.
3. После кодирования текстового файла вычислить оценки энтропии выходной последовательности, используя частоты отдельных символов, пар символов и троек символов.
4. Заполнить таблицу и проанализировать полученные результаты.
Метод
кодирования Название текста Оценка
избыточности кодирования  Оценка энтропии выходной посл-ти (частоты символов) Оценка энтропии выходной посл-ти (частоты пар символов) Оценка энтропии выходной посл-ти (частоты троек символов)
Метод Хаффмана Текст №1    
 Текст №2    
Метод Шеннона Текст №1    
 Текст №2    
Метод Фано Текст №1    
 Текст №2    

Избыточность кодирования определяется как , где H – энтропия текста, Lcp – средняя длина кодового слова.



Комментарии: Год сдачи лабораторных работ 2016. Оценка зачет. Работы выполнена без замечаний на С++.

Размер файла: 1,8 Мбайт
Фаил: Упакованные файлы (.rar)

   Скачать

   Добавить в корзину


    Скачано: 16         Коментариев: 0


Не можешь найти то что нужно? Мы можем помочь сделать! 

От 350 руб. за реферат, низкие цены. Просто заполни форму и всё.

Спеши, предложение ограничено !



Что бы написать комментарий, вам надо войти в аккаунт, либо зарегистрироваться.

Страницу Назад

  Cодержание / Теория информации / Теория информации. Лабораторная работа № 1- № 5
Вход в аккаунт:
Войти

Забыли ваш пароль?

Вы еще не зарегистрированы?

Создать новый Аккаунт


Способы оплаты:
UnionPay СБР Ю-Money qiwi Payeer Крипто-валюты Крипто-валюты


И еще более 50 способов оплаты...
Гарантии возврата денег

Как скачать и покупать?

Как скачивать и покупать в картинках


Сайт помощи студентам, без посредников!