Лабораторная работа №2 по предмету «Анализ данных»
Состав работы
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Лабораторная работа №2
Тема: «Методы классификации анализа данных»
Лабораторная работа состоит из двух частей:
Часть 1. Классификация данных методов наивного Байеса.
Цель задания: Изучение методов наивного байесовского классификатора при построении моделей машинного обучения и их применения, получение и закрепление умений и навыков при работе с наивным байесовским классификатором для решения задач линейной классификации.
Часть 2. Применение методов машинного обучения, дерево решений и случайные леса.
Цель задания: Изучение и применение классификации и регрессии данных методами построения дерева решений и случайного леса.
Часть 1. Задание
С помощью данный методических указаний, рекомендуемой литературы (см., например, [1], глава 5) и материалов сети Интернет изучить основные теоретические сведения и инструкции по применению стандартных НБК.
Разработать модель классификации коротких документов по категориям. Для обучения использовать набор данных с разреженными признаками количеств слов из корпуса текста 20 Newsgroups («20 дискуссионных групп»). Для этого необходимо:
1. Скачать и загрузить данные. Набор данных доступен из библиотеки sklearn: from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups()
2. Вывести заголовок набора данных, изучить признаки, выбрать целевые переменные.
3. Для простоты обучения, выбрать несколько категорий.
4. Вывести образец записи на экран.
5. Определить количество классов и уникальных записей.
6. Подключить классы TfidfVectorizer и MultinomialNB из библиотеки sklearn.
7. Преобразовать содержимое каждой строки в числовой вектор. Для этого использовать векторизатор TF-IDF (https://scikit-learn.ru/).
8. При помощи функции make_pipeline преобразовать данные и передать в классификатор.
9. Обучить модель.
10. Выполнить предсказание на примере разных предложений.
11. Проверить эффективность работы оценивателя. Построить матрицу различий между настоящими и предсказанными метками для контрольных данных (confusion_matrix). Сделать выводы по значениям полученной матрицы ошибок.
12. Построить модель, применив другие алгоритмы семейства байесовских классификаторов с различными параметрами. Сравнить результаты.
Тема: «Методы классификации анализа данных»
Лабораторная работа состоит из двух частей:
Часть 1. Классификация данных методов наивного Байеса.
Цель задания: Изучение методов наивного байесовского классификатора при построении моделей машинного обучения и их применения, получение и закрепление умений и навыков при работе с наивным байесовским классификатором для решения задач линейной классификации.
Часть 2. Применение методов машинного обучения, дерево решений и случайные леса.
Цель задания: Изучение и применение классификации и регрессии данных методами построения дерева решений и случайного леса.
Часть 1. Задание
С помощью данный методических указаний, рекомендуемой литературы (см., например, [1], глава 5) и материалов сети Интернет изучить основные теоретические сведения и инструкции по применению стандартных НБК.
Разработать модель классификации коротких документов по категориям. Для обучения использовать набор данных с разреженными признаками количеств слов из корпуса текста 20 Newsgroups («20 дискуссионных групп»). Для этого необходимо:
1. Скачать и загрузить данные. Набор данных доступен из библиотеки sklearn: from sklearn.datasets import fetch_20newsgroups data = fetch_20newsgroups()
2. Вывести заголовок набора данных, изучить признаки, выбрать целевые переменные.
3. Для простоты обучения, выбрать несколько категорий.
4. Вывести образец записи на экран.
5. Определить количество классов и уникальных записей.
6. Подключить классы TfidfVectorizer и MultinomialNB из библиотеки sklearn.
7. Преобразовать содержимое каждой строки в числовой вектор. Для этого использовать векторизатор TF-IDF (https://scikit-learn.ru/).
8. При помощи функции make_pipeline преобразовать данные и передать в классификатор.
9. Обучить модель.
10. Выполнить предсказание на примере разных предложений.
11. Проверить эффективность работы оценивателя. Построить матрицу различий между настоящими и предсказанными метками для контрольных данных (confusion_matrix). Сделать выводы по значениям полученной матрицы ошибок.
12. Построить модель, применив другие алгоритмы семейства байесовских классификаторов с различными параметрами. Сравнить результаты.
Дополнительная информация
Вид работы: лабораторная
Оценка: зачет
Данилова Любовь Филипповна
Оценка: зачет
Данилова Любовь Филипповна
Похожие материалы
Лабораторная работа №2 по предмету «Эконометрика»
ДО Сибгути
: 25 сентября 2013
Практическое занятие №2. «Применение Eviews при построении и анализе линейной однофакторной модели регрессии»
Пример 2. Имеются следующие данные по 10 фермерским хозяйствам области:
№ п\п 1 2 3 4 5 6 7 8 9 10
Урожайность зерновых ц\га 15 12 17 21 25 20 24 14 23 13
Внесено удобрений на 1 га посевов, кг 4,0 2,5 5,0 5,8 7,5 5,7 7,0 3,0 6,0 3,5
1. Создать файл с исходными данными в среде Excel (файл example_02.xls).
2.Осуществить импорт исходных данных в Eviews.
3. Создать workfile (рабочий файл).
100 руб.
Лабораторная работа №2 по предмету "Физика"
leokitty
: 3 февраля 2012
Тема: Определение удельного заряда электрона методом магнетрона
Цель работы: Познакомиться с законами движения заряженных частиц в электрическом и магнитном полях, определить удельный заряд электрона с помощью цилиндрического магнетрона.
Основные теоретические сведения
Магнетроном называется электровакуумное устройство, в котором движение электронов происходит во взаимно перпендикулярных электрическом и магнитном полях. Магнетрон является источником электромагнитного излучения СВЧ диапазона.
50 руб.
Лабораторная работа №2 по предмету Сетевое программирование
svladislav987
: 6 декабря 2021
Лабораторная работа № 2. Программирование обменов в локальнной сети
IPX/SPX.
Цель работы: Приобрести навыки сетевого программирования обменом
данными в локальных сетях на основе протокола IPX/SPX.
Теория
Для выполнения лабораторной работы необходимо изучить содержимое главы 7
теоретического материала по сетевому программированию.
Порядок выполнения работы:
Для программирования в среде DOS можно воспользоваться виртуальной
машиной, например Dosbox, который поддерживает работу с IPX- протоколом, у
300 руб.
Лабораторная работа № 2 по предмету: Интернет-технологии
svladislav987
: 16 апреля 2021
Первая часть задания. Таблицы
Создать документ, в котором в заголовке окна браузера должна быть надпись "Лабораторная 2-1". С использованием команд создания таблицы сформировать таблицу по указанному варианту.
Обратить внимание на ширину первого столбца (задать в процентах от ширины таблицы), шрифт (курсив, Courier New, Arial) и расположение текста (по центру, слева, справа).
Вторая часть задания. Фреймы
Используя описанные команды, создать документ, в котором в заголовке окна браузера должна б
100 руб.
Лабораторная работа №2 по предмету "Интернет-технологии"
dipost
: 18 мая 2014
Cоздать документ, в котором в заголовке окна браузера должна быть надпись "Лабораторная 2".
Задать разный цвет для непосещенной, посещенной и активной гиперссылок.
Фон задать в виде рисунка из имеющихся в директории FONS.
Обратить внимание на использование шрифтов Arial и Courier New.
"Лабораторная № 1" - гиперссылка на соответствующий файл - должна быть справа на экране;
"Лабораторная № 2" - заголовок (по центру экрана и соответствующим шрифтом);
"Предметы" оформить в виде вложенных списков по
50 руб.
Лабораторная работа №2 по предмету «Основы схемотехники»
Елена22
: 23 октября 2013
Лабораторная работа № 2
ИССЛЕДОВАНИЕ РЕЗИСТОРНОГО КАСКАДА ШИРОКОПОЛОСНОГО УСИЛИТЕЛЯ НА ПОЛЕВОМ ТРАНЗИСТОРЕ
Цель работы: Исследовать влияние элементов схемы каскада широкополосного усилителя на полевом транзисторе с общим истоком на его показатели (коэффициент усиления, частотные и переходные характеристики).
1. Исследуемая схема
2. Предварительный расчет
3. Исследование амплитудно-частотные характеристик.
3.1. Для схемы без коррекции: переключатель S3 замкнут, S1 и S2 – разомкнуты
3.2. Для сх
200 руб.
Лабораторная работа № 2 по предмету « Основы схемотехники».
Aleksandr1234
: 20 февраля 2012
“Исследование резисторного каскада широкополосного усилителя на полевом транзисторе”
1. Цель работы
Исследовать влияние элементов схемы каскада широкополосного усилителя на полевом транзисторе с общим истоком на его показатели (коэффициент усиления, частотные и переходные характеристики).
Задание к работе в лаборатории
Ознакомиться с методикой проведения измерений с применением программы Electronics Workbench.
Исследовать амплитудно-частотные характеристики:
• схемы без коррекции;
• схемы с НЧ
100 руб.
Лабораторная работа №2 по предмету "Дискретная математика".
Greenberg
: 29 июля 2011
Работа № 2 Отношения и их свойства
Бинарное отношение R на конечном множестве A: – задано списком упорядоченных пар вида (a,b). Требования на множество – те же, что и раньше (в нем не должно встречаться повторяющихся элементов, кроме того, оно должно быть упорядочено по возрастанию). Программа должна определять свойства заданного отношения: рефлексивность, симметричность, антисимметричность, транзитивность (по материалам главы 1, п.1.3). Проверку свойств выполнять по матрице бинарного отношения,
79 руб.
Другие работы
Телекоммуникационные системы СЦИ и ПЦИ. 7-й семестр. Лабораторная работа № 3.
skaser
: 10 сентября 2012
Принципы индикации неисправностей в ЦСП SDH
Цель работы: Экспериментальное исследование принципов индикации неисправностей в системах SDH.
Выполнение лабораторной работы:
1. Как формируется сигнал AIS?
2. Когда биты 6,7,8 в байте К2 в MSOH принимают значения 110?
3. В каком случае пятый бит байта G1 POH VC4 принимает значение 1?
4. В битах какого байта VC12 передается сигнал “Индикация ошибки на дальнем конце”?
5. В каком случае HOVC формирует в обратном направлении сигнал FERF?
6. Биты ка
55 руб.
Изучение конструкций, принцип действий и характеристик излучателей ВОСП.
Max7im
: 27 августа 2017
Цели и Задачи расчета ресурсов телекоммуникационных сетей.
Изучение конструкций, знакомство с принципом действия и исследование характеристик излучателей ВОСП.
два отчета, два варианта 3 и 6
99 руб.
Основы гидравлики МИИТ 2018 Задача 1.4 Вариант 1
Z24
: 9 декабря 2025
Перепад уровней ртути в левом и правом коленах ртутного манометра равен hр (рис. 1.1). Возвышение уровня воды над поверхностью ртути в левом колене манометра равно H.
Определить величину абсолютного давления р0 и высоту вакуума h для точки, взятой на поверхности воды в сосуде.
Плотность ртути принять равной ρр=13600 кг/м³. Атмосферное давление принять равным рат=98 кПа.
160 руб.
Понятие и сущность оборотных средств
Elfa254
: 1 ноября 2013
ОГЛАВЛЕНИЕ
Введение …………………………………………………………………………3
ГЛАВА I. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОБОРОТНЫХ СРЕДСТВ ПРЕДПРИЯТИЯ…………………………………………………………………5
1.1. Понятие и сущность оборотных средств предприятия…………………..5
1.2 Особенности использования оборотных средств предприятия…………12
ГЛАВА II. АНАЛИЗ ИСПОЛЬЗОВАНИЯ ОБОРОТНЫХ СРЕДСТВ ПРЕДПРИЯТИЯ………………………………………………………………..23
ГЛАВА III. ПРЕДЛОЖЕНИЯ ДЛЯ УЛУЧШЕНИЯ ИСПОЛЬЗОВАНИЯ ОБОРОТНЫХ ФОНДОВ ПРЕДПРИЯТИЯ…………………………………..36
3.1 Ускорение оборачиваемости оборотных средств…
10 руб.