Методы машинного обучения. Лабораторная работа 1,2,3,4. Python.
Состав работы
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Лабораторная работа №1. "Метод k ближайших соседей"
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Дополнительная информация
Вид работы: Лабораторная работа 1-4
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Похожие материалы
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Контрольная работа состоит из нескольких заданий. От варианта студента зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Всем студентам предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (описание метода можно найти по ссылке). От варианта зависят весовая функция и значение k.
2) Построить классифик
1300 руб.
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
1) Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
2) Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрессии. При помощи полученно
700 руб.
Методы машинного обучения. Вариант №1
IT-STUDHELP
: 24 ноября 2021
Контрольная работа по методам классификации
Выбор варианта: N = 1
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=4.
Обучающая последовательность и тестовый объект:
4) (X,Y)={(7,9,1), (2,5,1), (5,6,1), (8,6,1), (7,6,1), (7,9,2), (14,7,2), (14,2,2), (6,7,2), (10,3,2), (11,9,2), (9,1,2)}: тестовый объект x’=(12,12).
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=3.
Весовая функция:
3) — метод парзеновского окна фиксированной ши
1000 руб.
Методы машинного обучения. Билет №6
IT-STUDHELP
: 24 ноября 2021
Билет №6
1) Что такое правило Хэбба?
2) Что такое сингулярное разложение? Как оно используется для решения задачи наименьших квадратов?
350 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Задание на лабораторную работу
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрес
500 руб.
Методы машинного обучения. Вариант №7
IT-STUDHELP
: 15 ноября 2021
Задание на лабораторную работу
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрес
500 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Выбор варианта:
N = 8
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=11
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=4
Вариант выборки для метода построения решающего дерева определяется по формуле:
N_вд=((N*N+2)mod11)+1=1
Обучающая последовательность и тестовый объект для метода ближайших соседей:
11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2), (11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}
1000 руб.
Методы машинного обучения. Билет №1
IT-STUDHELP
: 15 ноября 2021
Билет №1
1) Как определяется понятие отступа в метрических алгоритмах классификации?
2) Что такое ядерное сглаживание в регрессии?
350 руб.
Другие работы
Себестоимость продукции промышленных предприятий
SerFACE
: 11 февраля 2013
1. Себестоимость и калькулирование себестоимости
1.1. Себестоимость продукции в машиностроении, и её виды.
Себестоимость машиностроительной продукции - это выраженные в денежной форме текущие затраты предприятий (объединений) на её производство и реализацию.
В укрупненном виде себестоимость продукции включает стоимость израсходованного сырья, материалов, топлива, энергии, инструмента, заработную плату промышленно-производственного персонала, затраты на амортизацию и ремонт основных фондов и
25 руб.
Кейс ответы админ право - Полномочны ли субъекты принимать законы о малом предпринимательстве
qwerty123432
: 20 ноября 2024
Законом Московской области № 14 от 28 июня 1995 года «Об основах малого предпринимательства в г. Москве» установлено, что субъектами малого
предпринимательства признаются коммерческие организации, среднесписочная
численность работающих в которых составляет: в промышленности и строительстве до 200 человек; в отраслях непроизводственной сферы до 60 человек; в туризме до 10 человек.
Соответствуют ли данные установления федеральному законодательству? Есть ли здесь противоречие или нет?
Полномочны л
150 руб.
Анализ финансового состояния предприятия банкрота
alfFRED
: 5 ноября 2013
Введение Стр.3
I. Анализ финансового состояния.
I.1. Анализ финансового состояния предприятия ОАО «Х». Стр.6
I.2. Место и роль банкротства в Российской экономике. Стр.21
II. Механизм реализации банкротства в современной России.
II.1. Экономическая сущность банкротства. Стр.24
II.2.Причины и признаки неплатежеспособности и банкротства российских предприятий. Стр.30
II.3.Организация финансово-правовых отношений при осуществлении процедуры банкротства. Стр.36
II.4.Финансовое состояние легко
10 руб.
Информационные технологии в экономике
mahaha
: 8 марта 2017
Контрольная работа
Дисциплина: «Информационные технологии в экономике»
Вариант № 6
. Опишите структуру локальной компьютерной сети предприятия: назначение, решаемые задачи, эффект от внедрения
50 руб.