Методы машинного обучения. Лабораторная работа 1,2,3,4. Python.
Состав работы
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Лабораторная работа №1. "Метод k ближайших соседей"
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Дополнительная информация
Вид работы: Лабораторная работа 1-4
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Похожие материалы
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
1) Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
2) Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрессии. При помощи полученно
700 руб.
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Контрольная работа состоит из нескольких заданий. От варианта студента зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Всем студентам предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (описание метода можно найти по ссылке). От варианта зависят весовая функция и значение k.
2) Построить классифик
1300 руб.
Методы машинного обучения. Билет №6
IT-STUDHELP
: 24 ноября 2021
Билет №6
1) Что такое правило Хэбба?
2) Что такое сингулярное разложение? Как оно используется для решения задачи наименьших квадратов?
350 руб.
Методы машинного обучения. Вариант №1
IT-STUDHELP
: 24 ноября 2021
Контрольная работа по методам классификации
Выбор варианта: N = 1
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=4.
Обучающая последовательность и тестовый объект:
4) (X,Y)={(7,9,1), (2,5,1), (5,6,1), (8,6,1), (7,6,1), (7,9,2), (14,7,2), (14,2,2), (6,7,2), (10,3,2), (11,9,2), (9,1,2)}: тестовый объект x’=(12,12).
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=3.
Весовая функция:
3) — метод парзеновского окна фиксированной ши
1000 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Выбор варианта:
N = 8
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=11
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=4
Вариант выборки для метода построения решающего дерева определяется по формуле:
N_вд=((N*N+2)mod11)+1=1
Обучающая последовательность и тестовый объект для метода ближайших соседей:
11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2), (11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}
1000 руб.
Методы машинного обучения. Билет №1
IT-STUDHELP
: 15 ноября 2021
Билет №1
1) Как определяется понятие отступа в метрических алгоритмах классификации?
2) Что такое ядерное сглаживание в регрессии?
350 руб.
Методы машинного обучения. Билет №12
IT-STUDHELP
: 15 ноября 2021
Билет №12
1) Что такое «выбросы»? Как осуществляется фильтрация выбросов в непараметрической регрессии?
2) Что такое «проблема мультиколлинеарности» в задачах многомерной линейной регрессии? Какие есть три подхода к её устранению?
350 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Задание на лабораторную работу
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрес
500 руб.
Другие работы
Девятиэтажный жилой дом с общественной пристройкой
alfFRED
: 28 августа 2013
Содержание:
1. Введение
2. Генеральный план
3. Объёмно-планировочное решение
4. Конструктивное решение
5. Теплотехнический расчёт
6. Решение фасада и внутренняя отделка помещения
Список используемой литературы
1. Введение
Требуется разработать архитектурно-конструктивный проект, где проектируемое здание относится к сооружениям для проживания, а также общественное здание – магазин «хлебо-кондитерский» торговой площадью 2
10 руб.
Лабораторная работа №1-3 по дисциплине: Технология разработки телекоммуникационных сервисов. Вариант №8
IT-STUDHELP
: 22 ноября 2021
Лабораторная работа No1
Приёмы объектно-ориентированного программирования
на языке Java
Цель работы:
Изучение принципов объектно-ориентированного программирования –наследования, инкапсуляции, полиморфизма.
Вариант задания:
Вариант задания:
No Варианта Суперкласс Поля Методы Подклассы
08 Оператор сотовой связи Торговая марка,
Количество абонентов в России Вывод торговой марки,
Вывод количества абонентов Beeline,
МТС,
Мегафон
Задание:
1. Разработать суперкласс в соответствии с вариантом за
900 руб.
Сертификация цели и задачи
Slolka
: 3 апреля 2014
В Российской Федерации обязательность подтверждения соответствия продукции и услуг устанавливается законодательными актами.Начало практической деятельности по обязательной сертификации было положено вступлением в силу в 1992 году закона Российской Федерации «О защите прав потребителей».Правовые основы сертификации продукции, услуг и иных объектов, а также права, обязанности и ответственность участников сертификации были установлены законом «О сертификации продукции и услуг».Для определения и огр
5 руб.
Задание 77. Вариант 25 - Серьга. Исправление ошибок на чертеже
Чертежи по сборнику Боголюбова 2007
: 11 апреля 2024
Возможные программы для открытия данных файлов:
WinRAR (для распаковки архива *.zip или *.rar)
КОМПАС 3D не ниже 16 версии для открытия файлов *.cdw, *.m3d
Любая программа для ПДФ файлов.
Боголюбов С.К. Индивидуальные задания по курсу черчения, 1989/1994/2007.
Задание 77. Вариант 25 - Серьга. Исправление ошибок на чертеже
Выполнить чертеж с исправлением допущенных на нём ошибок.
В состав выполненной работы входят 4 файла:
1. 3D модель детали, выполненная по данному заданию, расширение файла
100 руб.