Методы машинного обучения. Лабораторная работа 1,2,3,4. Python.
Состав работы
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Лабораторная работа №1. "Метод k ближайших соседей"
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Дополнительная информация
Вид работы: Лабораторная работа 1-4
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Похожие материалы
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
1) Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
2) Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрессии. При помощи полученно
700 руб.
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Контрольная работа состоит из нескольких заданий. От варианта студента зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Всем студентам предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (описание метода можно найти по ссылке). От варианта зависят весовая функция и значение k.
2) Построить классифик
1300 руб.
Методы машинного обучения. Билет №6
IT-STUDHELP
: 24 ноября 2021
Билет №6
1) Что такое правило Хэбба?
2) Что такое сингулярное разложение? Как оно используется для решения задачи наименьших квадратов?
350 руб.
Методы машинного обучения. Вариант №1
IT-STUDHELP
: 24 ноября 2021
Контрольная работа по методам классификации
Выбор варианта: N = 1
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=4.
Обучающая последовательность и тестовый объект:
4) (X,Y)={(7,9,1), (2,5,1), (5,6,1), (8,6,1), (7,6,1), (7,9,2), (14,7,2), (14,2,2), (6,7,2), (10,3,2), (11,9,2), (9,1,2)}: тестовый объект x’=(12,12).
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=3.
Весовая функция:
3) — метод парзеновского окна фиксированной ши
1000 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Выбор варианта:
N = 8
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=11
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=4
Вариант выборки для метода построения решающего дерева определяется по формуле:
N_вд=((N*N+2)mod11)+1=1
Обучающая последовательность и тестовый объект для метода ближайших соседей:
11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2), (11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}
1000 руб.
Методы машинного обучения. Билет №1
IT-STUDHELP
: 15 ноября 2021
Билет №1
1) Как определяется понятие отступа в метрических алгоритмах классификации?
2) Что такое ядерное сглаживание в регрессии?
350 руб.
Методы машинного обучения. Билет №12
IT-STUDHELP
: 15 ноября 2021
Билет №12
1) Что такое «выбросы»? Как осуществляется фильтрация выбросов в непараметрической регрессии?
2) Что такое «проблема мультиколлинеарности» в задачах многомерной линейной регрессии? Какие есть три подхода к её устранению?
350 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Задание на лабораторную работу
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрес
500 руб.
Другие работы
Бухгалтерский учет и анализ (курсовая работа) В-5
banderas0876
: 19 октября 2015
Задание №1
По данным таблицы 1 осуществить группировку имущества компании по видам и источникам их обеспечения на отчетную дату. Подобрать синтетические счета первого уровня для учета указанных наименований объектов. Полученные данные свести в таблицы 2,3,4.
Выбор варианта осуществляется по последней цифре пароля.
Задание №2.
Заполнить бухгалтерский баланс (ф.1). Данные вписать в графу «На начало отчетного года». (Форма таблицы имеется в приложении к конспекту лекций). Данные на конец года см
100 руб.
Программирование разветвляющихся процессов
Deamon
: 14 февраля 2010
ЛАБОРАТОРНАЯ РАБОТА №1
по дисциплине
«Информатика»
по теме «Программирование разветвляющихся процессов»
Цель работы: Получить навыки программирования разветвляющихся процессов на алгоритмическом языке.
Порядок выполнения лабораторной работы
1. Изучить следующие элементы алгоритмического языка: алфавит, идентификаторы, структура программы, константы, переменные, оператор присваивания, условный оператор.
2. Разработать схему алгоритма.
3. На основании схемы алгоритма разработать программу на алго
50 руб.
Теория массового обслуживания. Зачётная работа. Билет №21 + доп. вопрос.
student90s
: 22 июля 2015
Билет № 21.
1. Диаграмма интенсивностей переходов ПРГ.
2. Матрица вероятностей переходов вложенной цепи Маркова.
Дополнительный вопрос к первому вопросу билета:
Kак по диаграмме интенсивностей составить уравнения равновесия?
70 руб.