Методы машинного обучения. Лабораторная работа 1,2,3,4. Python.
Состав работы
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Лабораторная работа №1. "Метод k ближайших соседей"
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разбиений. Разбиение выборки необходимо
выполнять программно, случайным образом, при этом, не нарушая
информативности обучающей выборки. Разбивать рекомендуется по
следующему правилу: делим выборку на 3 равных части, 2 части используем
в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая
выборка должна быть сгенерирована таким образом, чтобы минимизировать
разницу между количеством представленных в ней объектов разных классов
Вариант
1)Классификатор: “Метод парзеновского окна с относительным размером окна”
2)Функция ядра K[z]: “Т – треугольное K(x) = (1 — r) [r < 1]”
Лабораторная работа №2. "Решающие деревья"
Данная работа носит творческий характер и призвана показать,
насколько студент подготовлен к реальному применению полученных знаний
на практике. Как известно, в реальной работе никаких вводных данных не
предоставляется, тем не менее, мы слегка пренебрегли данным правилом и
предоставили теорию и предпочтительный метод для применения.
В приложенном файле (heart_data.csv) располагаются реальные данные
по сердечной заболеваемости, собранные различными медицинскими
учреждениями. Каждый человек представлен 13-ю характеристиками и
полем goal, которое показывает наличие болезни сердца, поле принимает
значение 0 или 1 (0 – нет болезни, 1 - есть). Символ ‘?’ в каком-либо поле
означает, что для конкретного человека отсутствуют данные в этом поле
(либо не производились замеры, либо не записывались в базу).
Требуется имеющиеся данные разбить на обучающую и тестовую
выборки в процентном соотношении 70 к 30. После чего по обучающей
выборке необходимо построить решающее дерево. Для построения дерева
можно пользоваться любыми существующими средствами. Кроме того, для
построения дерева необходимо будет решить задачу выделения
информативных решающих правил относительно имеющихся числовых
признаков.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python), либо реализовывать
алгоритм построения дерева самостоятельно (все необходимые алгоритмы
представлены в теории по ссылке).
В качестве результата работы необходимо сделать не менее 10
случайных разбиений исходных данных на обучающую и тестовую выборки,
для каждой построить дерево и протестировать, после чего построить
таблицу, в которой указать процент правильно классифицированных данных.
Полученную таблицу необходимо включить в отчёт по лабораторной работе.
В отчёте следует отразить следующие изменяемые параметры: глубина
дерева и количество деревьев для каждого тестируемого случая.
Лабораторная работа №3.
Целью данной лабораторной работы является разработка программы,
реализующей применение метода линейной регрессии к заданному набору
данных.Набор данных содержит в себе информацию о вариантах португальского
вина "Винью Верде"
Задание: Данные необходимо рассматривать как три набора. Данные для
красного вина, данные для белого, общие данные вне зависимости от цвета.
Необходимо построить модель для каждого из наборов, обучить её и сравнить
полученные при помощи модели результаты с известными. Для обучения
использовать 70% выборки, для тестирования 30%. Разбивать необходимо
случайным образом, а, следовательно, для корректности тестирования
качества модели, эксперимент необходимо провести не менее 10 раз и
вычислить среднее значение качества регрессии.
Вариант: Использована модель LASSO
Лабораторная работа №4
Целью данной лабораторной работы является разработка нейронной
сети для решения задачи классификации или регрессии в зависимости от
набора данных в рамках варианта. Лабораторная работа предполагает
разработку на языке программирования Python с использованием
библиотеки Keras.
При разработке нейронной сети следует соблюсти наличие необходимых
составляющих исходя из следующих вариантов:
1) Нейросеть должна состоять из трёх полносвязных слоёв,
обязательное использование Dropout, в качестве оптимизатора
использовать Adam;
2) Нейросеть должна состоять из четырех полносвязных слоёв,
обязательное использование GaussianDropout, в качестве
оптимизатора использовать SGD;
3) Нейросеть должна состоять из пяти полносвязных слоёв,
обязательное использование ActivityRegularization, в качестве
оптимизатора использовать RMSprop.
Выбор количества нейронов на всех внутренних слоях, функций
активации и других параметров должен быть обусловлен оптимальностью
работы модели.
Вариант: Определение эмоционального окраса рецензии фильма
(IMDB movie review sentiment classification dataset)
Дополнительная информация
Вид работы: Лабораторная работа 1-4
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Оценка: Работа зачтена на максимальный бал
Проверена: 5.11.2020
Отзыв в виде комментария:
100,00 / 100,00. Морозова К.И.
Для корректной работы программ, нужно установить среду разработки PYCharm или воспользоваться google colab.
Похожие материалы
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
1) Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
2) Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрессии. При помощи полученно
700 руб.
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Контрольная работа состоит из нескольких заданий. От варианта студента зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Всем студентам предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (описание метода можно найти по ссылке). От варианта зависят весовая функция и значение k.
2) Построить классифик
1300 руб.
Методы машинного обучения. Билет №6
IT-STUDHELP
: 24 ноября 2021
Билет №6
1) Что такое правило Хэбба?
2) Что такое сингулярное разложение? Как оно используется для решения задачи наименьших квадратов?
350 руб.
Методы машинного обучения. Вариант №1
IT-STUDHELP
: 24 ноября 2021
Контрольная работа по методам классификации
Выбор варианта: N = 1
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=4.
Обучающая последовательность и тестовый объект:
4) (X,Y)={(7,9,1), (2,5,1), (5,6,1), (8,6,1), (7,6,1), (7,9,2), (14,7,2), (14,2,2), (6,7,2), (10,3,2), (11,9,2), (9,1,2)}: тестовый объект x’=(12,12).
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=3.
Весовая функция:
3) — метод парзеновского окна фиксированной ши
1000 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Выбор варианта:
N = 8
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=11
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=4
Вариант выборки для метода построения решающего дерева определяется по формуле:
N_вд=((N*N+2)mod11)+1=1
Обучающая последовательность и тестовый объект для метода ближайших соседей:
11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2), (11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}
1000 руб.
Методы машинного обучения. Билет №1
IT-STUDHELP
: 15 ноября 2021
Билет №1
1) Как определяется понятие отступа в метрических алгоритмах классификации?
2) Что такое ядерное сглаживание в регрессии?
350 руб.
Методы машинного обучения. Билет №12
IT-STUDHELP
: 15 ноября 2021
Билет №12
1) Что такое «выбросы»? Как осуществляется фильтрация выбросов в непараметрической регрессии?
2) Что такое «проблема мультиколлинеарности» в задачах многомерной линейной регрессии? Какие есть три подхода к её устранению?
350 руб.
Методы машинного обучения. Вариант №8
IT-STUDHELP
: 15 ноября 2021
Задание на лабораторную работу
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрес
500 руб.
Другие работы
ММА/ИДО Иностранный язык в профессиональной сфере (ЛТМ) Тест 20 из 20 баллов 2024 год
mosintacd
: 28 июня 2024
ММА/ИДО Иностранный язык в профессиональной сфере (ЛТМ) Тест 20 из 20 баллов 2024 год
Московская международная академия Институт дистанционного образования Тест оценка ОТЛИЧНО
2024 год
Ответы на 20 вопросов
Результат – 100 баллов
С вопросами вы можете ознакомиться до покупки
ВОПРОСЫ:
1. We have … to an agreement
2. Our senses are … a great role in non-verbal communication
3. Saving time at business communication leads to … results in work
4. Conducting negotiations with foreigners we shoul
150 руб.
Задание №2. Методы управления образовательными учреждениями
studypro
: 13 октября 2016
Практическое задание 2
Задание 1. Опишите по одному примеру использования каждого из методов управления в Вашей профессиональной деятельности.
Задание 2. Приняв на работу нового сотрудника, Вы надеялись на более эффективную работу, но в результате разочарованы, так как он не соответствует одному из важнейших качеств менеджера - самодисциплине. Он не обязателен, не собран, не умеет отказывать и т.д.. Но, тем не менее, он отличный профессионал в своей деятельности. Какими методами управления Вы во
200 руб.
Особенности бюджетного финансирования
Aronitue9
: 24 августа 2012
Содержание:
Введение
Теоретические основы бюджетного финансирования
Понятие и сущность бюджетного финансирования
Характеристика основных форм бюджетного финансирования
Анализ бюджетного финансирования образования
Понятие и источники бюджетного финансирования образования
Проблемы бюджетного финансирования образования
Основные направления совершенствования бюджетного финансирования образования
Заключение
Список использованный литературы
Цель курсовой работы – исследовать особенности бюджетного фин
20 руб.
Программирование (часть 1-я). Зачёт. Билет №2
sibsutisru
: 3 сентября 2021
ЗАЧЕТ по дисциплине “Программирование (часть 1)”
Билет 2
Определить значение переменной y после работы следующего фрагмента программы:
a = 3; b = 2 * a – 10; x = 0; y = 2 * b + a;
if ( b > y ) or ( 2 * b < y + a ) ) then begin x = b – y; y = x + 4 end;
if ( a + b < 0 ) and ( y + x > 2 ) ) then begin x = x + y; y = x – 2 end;
200 руб.