Лабораторная работа №2 по предмету «Анализ данных»
Состав работы
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Лабораторная работа №2
Тема: «Методы классификации анализа данных»
Лабораторная работа состоит из двух частей:
Часть 1. Классификация данных методов наивного Байеса.
Цель задания: Изучение методов наивного байесовского классификатора при построении моделей машинного обучения и их применения, получение и закрепление умений и навыков при работе с наивным байесовским классификатором для решения задач линейной классификации.
Часть 2. Применение методов машинного обучения, дерево решений и случайные леса.
Цель задания: Изучение и применение классификации и регрессии данных методами построения дерева решений и случайного леса.
Часть 1. Задание
С помощью данный методических указаний, рекомендуемой литературы (см., например, [1], глава 5) и материалов сети Интернет изучить основные теоретические сведения и инструкции по применению стандартных НБК.
Разработать модель классификации коротких документов по категориям. Для обучения использовать набор данных с разреженными признаками количеств слов из корпуса текста 20 Newsgroups («20 дискуссионных групп»). Для этого необходимо:
1. Скачать и загрузить данные. Набор данных доступен из библиотеки sklearn: from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups()
2. Вывести заголовок набора данных, изучить признаки, выбрать целевые переменные.
3. Для простоты обучения, выбрать несколько категорий.
4. Вывести образец записи на экран.
5. Определить количество классов и уникальных записей.
6. Подключить классы TfidfVectorizer и MultinomialNB из библиотеки sklearn.
7. Преобразовать содержимое каждой строки в числовой вектор. Для этого использовать векторизатор TF-IDF (https://scikit-learn.ru/).
8. При помощи функции make_pipeline преобразовать данные и передать в классификатор.
9. Обучить модель.
10. Выполнить предсказание на примере разных предложений.
11. Проверить эффективность работы оценивателя. Построить матрицу различий между настоящими и предсказанными метками для контрольных данных (confusion_matrix). Сделать выводы по значениям полученной матрицы ошибок.
12. Построить модель, применив другие алгоритмы семейства байесовских классификаторов с различными параметрами. Сравнить результаты.
Тема: «Методы классификации анализа данных»
Лабораторная работа состоит из двух частей:
Часть 1. Классификация данных методов наивного Байеса.
Цель задания: Изучение методов наивного байесовского классификатора при построении моделей машинного обучения и их применения, получение и закрепление умений и навыков при работе с наивным байесовским классификатором для решения задач линейной классификации.
Часть 2. Применение методов машинного обучения, дерево решений и случайные леса.
Цель задания: Изучение и применение классификации и регрессии данных методами построения дерева решений и случайного леса.
Часть 1. Задание
С помощью данный методических указаний, рекомендуемой литературы (см., например, [1], глава 5) и материалов сети Интернет изучить основные теоретические сведения и инструкции по применению стандартных НБК.
Разработать модель классификации коротких документов по категориям. Для обучения использовать набор данных с разреженными признаками количеств слов из корпуса текста 20 Newsgroups («20 дискуссионных групп»). Для этого необходимо:
1. Скачать и загрузить данные. Набор данных доступен из библиотеки sklearn: from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups()
2. Вывести заголовок набора данных, изучить признаки, выбрать целевые переменные.
3. Для простоты обучения, выбрать несколько категорий.
4. Вывести образец записи на экран.
5. Определить количество классов и уникальных записей.
6. Подключить классы TfidfVectorizer и MultinomialNB из библиотеки sklearn.
7. Преобразовать содержимое каждой строки в числовой вектор. Для этого использовать векторизатор TF-IDF (https://scikit-learn.ru/).
8. При помощи функции make_pipeline преобразовать данные и передать в классификатор.
9. Обучить модель.
10. Выполнить предсказание на примере разных предложений.
11. Проверить эффективность работы оценивателя. Построить матрицу различий между настоящими и предсказанными метками для контрольных данных (confusion_matrix). Сделать выводы по значениям полученной матрицы ошибок.
12. Построить модель, применив другие алгоритмы семейства байесовских классификаторов с различными параметрами. Сравнить результаты.
Дополнительная информация
Вид работы: лабораторная
Оценка: зачет
Данилова Любовь Филипповна
Оценка: зачет
Данилова Любовь Филипповна
Похожие материалы
Лабораторная работа №2 по предмету «Эконометрика»
ДО Сибгути
: 25 сентября 2013
Практическое занятие №2. «Применение Eviews при построении и анализе линейной однофакторной модели регрессии»
Пример 2. Имеются следующие данные по 10 фермерским хозяйствам области:
№ п\п 1 2 3 4 5 6 7 8 9 10
Урожайность зерновых ц\га 15 12 17 21 25 20 24 14 23 13
Внесено удобрений на 1 га посевов, кг 4,0 2,5 5,0 5,8 7,5 5,7 7,0 3,0 6,0 3,5
1. Создать файл с исходными данными в среде Excel (файл example_02.xls).
2.Осуществить импорт исходных данных в Eviews.
3. Создать workfile (рабочий файл).
100 руб.
Лабораторная работа №2 по предмету "Физика"
leokitty
: 3 февраля 2012
Тема: Определение удельного заряда электрона методом магнетрона
Цель работы: Познакомиться с законами движения заряженных частиц в электрическом и магнитном полях, определить удельный заряд электрона с помощью цилиндрического магнетрона.
Основные теоретические сведения
Магнетроном называется электровакуумное устройство, в котором движение электронов происходит во взаимно перпендикулярных электрическом и магнитном полях. Магнетрон является источником электромагнитного излучения СВЧ диапазона.
50 руб.
Лабораторная работа №2 по предмету Сетевое программирование
svladislav987
: 6 декабря 2021
Лабораторная работа № 2. Программирование обменов в локальнной сети
IPX/SPX.
Цель работы: Приобрести навыки сетевого программирования обменом
данными в локальных сетях на основе протокола IPX/SPX.
Теория
Для выполнения лабораторной работы необходимо изучить содержимое главы 7
теоретического материала по сетевому программированию.
Порядок выполнения работы:
Для программирования в среде DOS можно воспользоваться виртуальной
машиной, например Dosbox, который поддерживает работу с IPX- протоколом, у
300 руб.
Лабораторная работа № 2 по предмету: Интернет-технологии
svladislav987
: 16 апреля 2021
Первая часть задания. Таблицы
Создать документ, в котором в заголовке окна браузера должна быть надпись "Лабораторная 2-1". С использованием команд создания таблицы сформировать таблицу по указанному варианту.
Обратить внимание на ширину первого столбца (задать в процентах от ширины таблицы), шрифт (курсив, Courier New, Arial) и расположение текста (по центру, слева, справа).
Вторая часть задания. Фреймы
Используя описанные команды, создать документ, в котором в заголовке окна браузера должна б
100 руб.
Лабораторная работа №2 по предмету "Интернет-технологии"
dipost
: 18 мая 2014
Cоздать документ, в котором в заголовке окна браузера должна быть надпись "Лабораторная 2".
Задать разный цвет для непосещенной, посещенной и активной гиперссылок.
Фон задать в виде рисунка из имеющихся в директории FONS.
Обратить внимание на использование шрифтов Arial и Courier New.
"Лабораторная № 1" - гиперссылка на соответствующий файл - должна быть справа на экране;
"Лабораторная № 2" - заголовок (по центру экрана и соответствующим шрифтом);
"Предметы" оформить в виде вложенных списков по
50 руб.
Лабораторная работа №2 по предмету «Основы схемотехники»
Елена22
: 23 октября 2013
Лабораторная работа № 2
ИССЛЕДОВАНИЕ РЕЗИСТОРНОГО КАСКАДА ШИРОКОПОЛОСНОГО УСИЛИТЕЛЯ НА ПОЛЕВОМ ТРАНЗИСТОРЕ
Цель работы: Исследовать влияние элементов схемы каскада широкополосного усилителя на полевом транзисторе с общим истоком на его показатели (коэффициент усиления, частотные и переходные характеристики).
1. Исследуемая схема
2. Предварительный расчет
3. Исследование амплитудно-частотные характеристик.
3.1. Для схемы без коррекции: переключатель S3 замкнут, S1 и S2 – разомкнуты
3.2. Для сх
200 руб.
Лабораторная работа № 2 по предмету « Основы схемотехники».
Aleksandr1234
: 20 февраля 2012
“Исследование резисторного каскада широкополосного усилителя на полевом транзисторе”
1. Цель работы
Исследовать влияние элементов схемы каскада широкополосного усилителя на полевом транзисторе с общим истоком на его показатели (коэффициент усиления, частотные и переходные характеристики).
Задание к работе в лаборатории
Ознакомиться с методикой проведения измерений с применением программы Electronics Workbench.
Исследовать амплитудно-частотные характеристики:
• схемы без коррекции;
• схемы с НЧ
100 руб.
Лабораторная работа №2 по предмету "Дискретная математика".
Greenberg
: 29 июля 2011
Работа № 2 Отношения и их свойства
Бинарное отношение R на конечном множестве A: – задано списком упорядоченных пар вида (a,b). Требования на множество – те же, что и раньше (в нем не должно встречаться повторяющихся элементов, кроме того, оно должно быть упорядочено по возрастанию). Программа должна определять свойства заданного отношения: рефлексивность, симметричность, антисимметричность, транзитивность (по материалам главы 1, п.1.3). Проверку свойств выполнять по матрице бинарного отношения,
79 руб.
Другие работы
Контрольная работа по дисциплине: Химия радиоматериалов Вариант№1
glec
: 5 февраля 2012
Задача 3.1.1.
Определить падение напряжения в линии электропередач длинной L при температуре , , , если провод имеет сечение S и по нему течет ток I.
Задача 3.1.2.
Определить длину проволоки для намотки проволочного резистора с номиналом R, и допустимой мощностью рассеяния P.
70 руб.
Организация материально-технического снабжения, сбыта продукции и складского обслуживания
evelin
: 7 ноября 2013
Оглавление:
Введение:………………………………………………………………………….3
1. Организация материально-технического снабжения, сбыта продукции и складского обслуживания на предприятии ………………………………………..4
2. Организация сбыта продукции и складского обслуживания……..…………13
3. Организация материально-технического снабжения, сбыта продукции и складского обслуживания на ………………………….………27
Заключение……………………………………………………………….……....39
Библиографический список……………………………………………….……..36
Введение.
Для бесперебойного функционир
5 руб.
Роль местного бюджета в социально-экономическом развитии региона
GnobYTEL
: 30 августа 2012
ВВЕДЕНИЕ…………………………………………………………………….…3
РАЗДЕЛ 1. БЮДЖЕТНЫЙ ПРОЦЕСС КАК СОСТАВЛЯЮЩАЯ СОЦИАЛЬНО-ЭКОНОМИЧЕСКООЙ СТРАТЕГИИ РАЗВИТИЯ РЕГИОНА
1.1. Местные бюджеты, их роль и значение в финансовой системе Украины…………………………………………………………………..……….7
1.2. Роль местных бюджетов в социально-экономическом развитии региона……………………………………………………………………………15
1.3. Содержание и особенности межбюджетных отношений в бюджетной системе ….………………………………………………………………………..24
РАЗДЕЛ 2. АНАЛИЗ ПРОЦЕССА ФОРМИРОВАНИЯ И ИСПОЛНЕНИЯ
200 руб.
Теплотехника КГАУ 2015 Задача 5 Вариант 52
Z24
: 5 февраля 2026
Определить удельный лучистый тепловой поток q между двумя параллельно расположенными плоскими стенками, имеющими температуру t1 и t2 и степени (коэффициенты) черноты ε1 и ε2, если между ними нет экрана.
Определить q при наличии экрана со степенью (коэффициентом) черноты εэ (с обеих сторон).
180 руб.