Лабораторная работа №2 по предмету «Анализ данных»
Состав работы
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Лабораторная работа №2
Тема: «Методы классификации анализа данных»
Лабораторная работа состоит из двух частей:
Часть 1. Классификация данных методов наивного Байеса.
Цель задания: Изучение методов наивного байесовского классификатора при построении моделей машинного обучения и их применения, получение и закрепление умений и навыков при работе с наивным байесовским классификатором для решения задач линейной классификации.
Часть 2. Применение методов машинного обучения, дерево решений и случайные леса.
Цель задания: Изучение и применение классификации и регрессии данных методами построения дерева решений и случайного леса.
Часть 1. Задание
С помощью данный методических указаний, рекомендуемой литературы (см., например, [1], глава 5) и материалов сети Интернет изучить основные теоретические сведения и инструкции по применению стандартных НБК.
Разработать модель классификации коротких документов по категориям. Для обучения использовать набор данных с разреженными признаками количеств слов из корпуса текста 20 Newsgroups («20 дискуссионных групп»). Для этого необходимо:
1. Скачать и загрузить данные. Набор данных доступен из библиотеки sklearn: from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups()
2. Вывести заголовок набора данных, изучить признаки, выбрать целевые переменные.
3. Для простоты обучения, выбрать несколько категорий.
4. Вывести образец записи на экран.
5. Определить количество классов и уникальных записей.
6. Подключить классы TfidfVectorizer и MultinomialNB из библиотеки sklearn.
7. Преобразовать содержимое каждой строки в числовой вектор. Для этого использовать векторизатор TF-IDF (https://scikit-learn.ru/).
8. При помощи функции make_pipeline преобразовать данные и передать в классификатор.
9. Обучить модель.
10. Выполнить предсказание на примере разных предложений.
11. Проверить эффективность работы оценивателя. Построить матрицу различий между настоящими и предсказанными метками для контрольных данных (confusion_matrix). Сделать выводы по значениям полученной матрицы ошибок.
12. Построить модель, применив другие алгоритмы семейства байесовских классификаторов с различными параметрами. Сравнить результаты.
Тема: «Методы классификации анализа данных»
Лабораторная работа состоит из двух частей:
Часть 1. Классификация данных методов наивного Байеса.
Цель задания: Изучение методов наивного байесовского классификатора при построении моделей машинного обучения и их применения, получение и закрепление умений и навыков при работе с наивным байесовским классификатором для решения задач линейной классификации.
Часть 2. Применение методов машинного обучения, дерево решений и случайные леса.
Цель задания: Изучение и применение классификации и регрессии данных методами построения дерева решений и случайного леса.
Часть 1. Задание
С помощью данный методических указаний, рекомендуемой литературы (см., например, [1], глава 5) и материалов сети Интернет изучить основные теоретические сведения и инструкции по применению стандартных НБК.
Разработать модель классификации коротких документов по категориям. Для обучения использовать набор данных с разреженными признаками количеств слов из корпуса текста 20 Newsgroups («20 дискуссионных групп»). Для этого необходимо:
1. Скачать и загрузить данные. Набор данных доступен из библиотеки sklearn: from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups()
2. Вывести заголовок набора данных, изучить признаки, выбрать целевые переменные.
3. Для простоты обучения, выбрать несколько категорий.
4. Вывести образец записи на экран.
5. Определить количество классов и уникальных записей.
6. Подключить классы TfidfVectorizer и MultinomialNB из библиотеки sklearn.
7. Преобразовать содержимое каждой строки в числовой вектор. Для этого использовать векторизатор TF-IDF (https://scikit-learn.ru/).
8. При помощи функции make_pipeline преобразовать данные и передать в классификатор.
9. Обучить модель.
10. Выполнить предсказание на примере разных предложений.
11. Проверить эффективность работы оценивателя. Построить матрицу различий между настоящими и предсказанными метками для контрольных данных (confusion_matrix). Сделать выводы по значениям полученной матрицы ошибок.
12. Построить модель, применив другие алгоритмы семейства байесовских классификаторов с различными параметрами. Сравнить результаты.
Дополнительная информация
Вид работы: лабораторная
Оценка: зачет
Данилова Любовь Филипповна
Оценка: зачет
Данилова Любовь Филипповна
Похожие материалы
Лабораторная работа №2 по предмету «Эконометрика»
ДО Сибгути
: 25 сентября 2013
Практическое занятие №2. «Применение Eviews при построении и анализе линейной однофакторной модели регрессии»
Пример 2. Имеются следующие данные по 10 фермерским хозяйствам области:
№ п\п 1 2 3 4 5 6 7 8 9 10
Урожайность зерновых ц\га 15 12 17 21 25 20 24 14 23 13
Внесено удобрений на 1 га посевов, кг 4,0 2,5 5,0 5,8 7,5 5,7 7,0 3,0 6,0 3,5
1. Создать файл с исходными данными в среде Excel (файл example_02.xls).
2.Осуществить импорт исходных данных в Eviews.
3. Создать workfile (рабочий файл).
100 руб.
Лабораторная работа №2 по предмету "Физика"
leokitty
: 3 февраля 2012
Тема: Определение удельного заряда электрона методом магнетрона
Цель работы: Познакомиться с законами движения заряженных частиц в электрическом и магнитном полях, определить удельный заряд электрона с помощью цилиндрического магнетрона.
Основные теоретические сведения
Магнетроном называется электровакуумное устройство, в котором движение электронов происходит во взаимно перпендикулярных электрическом и магнитном полях. Магнетрон является источником электромагнитного излучения СВЧ диапазона.
50 руб.
Лабораторная работа №2 по предмету Сетевое программирование
svladislav987
: 6 декабря 2021
Лабораторная работа № 2. Программирование обменов в локальнной сети
IPX/SPX.
Цель работы: Приобрести навыки сетевого программирования обменом
данными в локальных сетях на основе протокола IPX/SPX.
Теория
Для выполнения лабораторной работы необходимо изучить содержимое главы 7
теоретического материала по сетевому программированию.
Порядок выполнения работы:
Для программирования в среде DOS можно воспользоваться виртуальной
машиной, например Dosbox, который поддерживает работу с IPX- протоколом, у
300 руб.
Лабораторная работа № 2 по предмету: Интернет-технологии
svladislav987
: 16 апреля 2021
Первая часть задания. Таблицы
Создать документ, в котором в заголовке окна браузера должна быть надпись "Лабораторная 2-1". С использованием команд создания таблицы сформировать таблицу по указанному варианту.
Обратить внимание на ширину первого столбца (задать в процентах от ширины таблицы), шрифт (курсив, Courier New, Arial) и расположение текста (по центру, слева, справа).
Вторая часть задания. Фреймы
Используя описанные команды, создать документ, в котором в заголовке окна браузера должна б
100 руб.
Лабораторная работа №2 по предмету "Интернет-технологии"
dipost
: 18 мая 2014
Cоздать документ, в котором в заголовке окна браузера должна быть надпись "Лабораторная 2".
Задать разный цвет для непосещенной, посещенной и активной гиперссылок.
Фон задать в виде рисунка из имеющихся в директории FONS.
Обратить внимание на использование шрифтов Arial и Courier New.
"Лабораторная № 1" - гиперссылка на соответствующий файл - должна быть справа на экране;
"Лабораторная № 2" - заголовок (по центру экрана и соответствующим шрифтом);
"Предметы" оформить в виде вложенных списков по
50 руб.
Лабораторная работа №2 по предмету «Основы схемотехники»
Елена22
: 23 октября 2013
Лабораторная работа № 2
ИССЛЕДОВАНИЕ РЕЗИСТОРНОГО КАСКАДА ШИРОКОПОЛОСНОГО УСИЛИТЕЛЯ НА ПОЛЕВОМ ТРАНЗИСТОРЕ
Цель работы: Исследовать влияние элементов схемы каскада широкополосного усилителя на полевом транзисторе с общим истоком на его показатели (коэффициент усиления, частотные и переходные характеристики).
1. Исследуемая схема
2. Предварительный расчет
3. Исследование амплитудно-частотные характеристик.
3.1. Для схемы без коррекции: переключатель S3 замкнут, S1 и S2 – разомкнуты
3.2. Для сх
200 руб.
Лабораторная работа № 2 по предмету « Основы схемотехники».
Aleksandr1234
: 20 февраля 2012
“Исследование резисторного каскада широкополосного усилителя на полевом транзисторе”
1. Цель работы
Исследовать влияние элементов схемы каскада широкополосного усилителя на полевом транзисторе с общим истоком на его показатели (коэффициент усиления, частотные и переходные характеристики).
Задание к работе в лаборатории
Ознакомиться с методикой проведения измерений с применением программы Electronics Workbench.
Исследовать амплитудно-частотные характеристики:
• схемы без коррекции;
• схемы с НЧ
100 руб.
Лабораторная работа №2 по предмету "Дискретная математика".
Greenberg
: 29 июля 2011
Работа № 2 Отношения и их свойства
Бинарное отношение R на конечном множестве A: – задано списком упорядоченных пар вида (a,b). Требования на множество – те же, что и раньше (в нем не должно встречаться повторяющихся элементов, кроме того, оно должно быть упорядочено по возрастанию). Программа должна определять свойства заданного отношения: рефлексивность, симметричность, антисимметричность, транзитивность (по материалам главы 1, п.1.3). Проверку свойств выполнять по матрице бинарного отношения,
79 руб.
Другие работы
Региональная экология (Калининградская область)
Slolka
: 19 марта 2013
Содержание
Введение
1. Оценка природно-ресурсного потенциала Калининградской области
2. Административные методы решения экологических проблем
3. Экономические методы решения экологических проблем
Заключение
Библиографический список
Введение
Калининградская область расположена на юго-восточном побережье Балтийского моря, она является самой маленькой областью в РФ, поскольку занимает площадь в 15,1 тыс. км2. Максимальная протяженность территории области с запада на восток достигает 195 км, с севе
10 руб.
Этика юриста
Laguz
: 28 марта 2015
Глава 1. Служебный этикет юриста 4
1.1 Понятие юридического статуса 5
Глава 2. Эстетическая культура юриста 6
Глава 3. Эстетика внешнего вида юриста 8
Заключение 9
Список использованной литературы: 10
50 руб.
Клиноременный вариатор с раздвижными шкивами - И71.91.00.00 СБ
.Инженер.
: 11 января 2025
Иванов Ю.Б. Атлас чертежей общих видов для деталирования. И71.91.00.00 СБ - Клиноременный вариатор с раздвижными шкивами. Сборочный чертеж. Деталирование. Модели.
Вариатор является бесступенчатой передачей, позволяющей передавать крутящий момент от двигателя к машине с плавным изменением скорости вращения. Ведущая ступица 1 ведущего шкива закреплена на вале двигателя, а ведомая ступица 11 ведомого шкива — на вале машины. Изменение передаточного числа вариатора осуществляют изменением расстояния
900 руб.
Объектно-ориентированное программирование. Лабораторная работа №2. Для всех вариантов (2019)
nik200511
: 16 мая 2019
Лабораторная работа №2
Тема: Принцип наследования. Статические методы.
Задание:
Создать иерархию графических классов в соответствии с рисунком (или использовать свой вариант). Описания классов желательно оформить в отдельном модуле.
ТОЧКА ОКРУЖНОСТЬ ЭЛЛИПС
ОТРЕЗОК ТРЕУГОЛЬНИК
ПРЯМОУГОЛЬНИК
Добавить методы движения фигур (в каждый класс). Использовать статические методы.
Написать программу, позволяющую выбирать фигуру для движения и вид движения: случайный или
52 руб.