Методы машинного обучения. Лабораторная работа 1,2,3,4. Python.
Состав работы
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Лабораторная работа №1. "Метод k ближайших соседей"
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Дополнительная информация
Вид работы: Лабораторная работа 1-4
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Похожие материалы
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Контрольная работа состоит из нескольких заданий. От варианта студента зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Всем студентам предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (описание метода можно найти по ссылке). От варианта зависят весовая функция и значение k.
2) Построить классифик
1300 руб.
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
1) Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
2) Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрессии. При помощи полученно
700 руб.
Методы машинного обучения. Вариант №1
IT-STUDHELP
: 24 ноября 2021
Контрольная работа по методам классификации
Выбор варианта: N = 1
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=4.
Обучающая последовательность и тестовый объект:
4) (X,Y)={(7,9,1), (2,5,1), (5,6,1), (8,6,1), (7,6,1), (7,9,2), (14,7,2), (14,2,2), (6,7,2), (10,3,2), (11,9,2), (9,1,2)}: тестовый объект x’=(12,12).
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=3.
Весовая функция:
3) — метод парзеновского окна фиксированной ши
1000 руб.
Методы машинного обучения. Билет №6
IT-STUDHELP
: 24 ноября 2021
Билет №6
1) Что такое правило Хэбба?
2) Что такое сингулярное разложение? Как оно используется для решения задачи наименьших квадратов?
350 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Задание на лабораторную работу
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрес
500 руб.
Методы машинного обучения. Вариант №7
IT-STUDHELP
: 15 ноября 2021
Задание на лабораторную работу
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрес
500 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Выбор варианта:
N = 8
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=11
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=4
Вариант выборки для метода построения решающего дерева определяется по формуле:
N_вд=((N*N+2)mod11)+1=1
Обучающая последовательность и тестовый объект для метода ближайших соседей:
11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2), (11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}
1000 руб.
Методы машинного обучения. Билет №1
IT-STUDHELP
: 15 ноября 2021
Билет №1
1) Как определяется понятие отступа в метрических алгоритмах классификации?
2) Что такое ядерное сглаживание в регрессии?
350 руб.
Другие работы
Ионно-плазменные двигатели с высоко-частотной безэлектродной ионизацией рабочего тела
kostak
: 8 июня 2012
Введение
1. Сравнительный анализ ЭРДУ
1.1 Применение ЭРД
1.2 Применение РИД
1.3 Общие преимущества РИД
1.4 Радиочастотный ионный движитель РИД-10
1.5 Радиочастотный ионный движитель РИД-26
1.6 Радиочастотный двигатель с магнитным полем (РМД)
2 Разработка численной модели электроракетного двигателя с ВЧ нагревом рабочего тела
2.1 Математический аппарат численной модели термогазодинамических процессов, имеющих место в камере и сопловом аппарате ракетного двигателя
2.2 Термодинамические процессы, п
Тенденції та перспективи розвитку товарної структури зовнішньої торгівлі України
OstVER
: 9 сентября 2013
ПЛАН
Вступ.................................................................................................................... 3
Розділ 1. Теоретичні аспекти торгової політики України................................. 6
1.1. Система показників розвитку міжнародної торгівлі............................... 6
1.2 Поняття та методи торгової політики..................................................... 11
Розділ 2. Особливості товарної структури зовнішньої торгівлі України...... 18
2.1 Аналіз між
5 руб.
Расчет элементов автомобильных гидросистем МАМИ Задача 5.11 Вариант З
Z24
: 20 декабря 2025
Насосная установка включает нерегулируемый роторный насос и переливной клапан, через который часть подачи насоса направляет на слив (см. рисунок к задачам 5.9 и 5.11). Определить расход жидкости Qкл, сливающийся через клапан, если подача насосной установки известна Qну = Q. Найти на этом режиме полезную и потребляемую мощности насосной установки, приняв при этом полный кпд насоса η = 0,85. При решении воспользоваться характеристикой насосной установки, приведенной на рисунке к задачам 5.11 и 5.1
150 руб.
Лабораторная работа №3: Методы оптимальных решений. Вариант №3
Oscar85
: 28 декабря 2014
1. Решите аналитически матричную игру 2x2, заданную платежной матрицей.
2. Проведите моделирование результатов игры, с помощью таблицы равномерно распределенных случайных чисел, разыграв 30 партий; определите относительные частоты использования чистых стратегий каждым игроком и средний выигрыш, сравнив результаты с полученными теоретически в п.1.
10 14
22 9
130 руб.