Методы машинного обучения. Лабораторная работа
Состав работы
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
- Программа для просмотра изображений
- Microsoft Word
Описание
Данная работа наиболее творческая и призвана показать, насколько студент подготовлен к реальному применению полученных знаний на практике. Как известно, в реальной работе никаких вводных данных не предоставляется, тем не менее, мы слегка пренебрегли данным правилом и предоставили теорию и предпочтительный метод для применения.
На сайте kaggle по ссылке https://www.kaggle.com/imnikhilanand/heart-attack-prediction/home располагаются реальные данные по сердечной заболеваемости, собранные различными медицинскими учреждениями. Каждый человек представлен 14ю характеристиками и полем goal, которое показывает наличие болезни сердца, поле принимает значение от 0 до 4 (0 – нет болезни).
Требуется имеющиеся данные разбить на обучающую и тестовую выборки в процентном соотношении 70 к 30. После чего по обучающей выборке необходимо построить решающее дерево. Для построения дерева можно пользоваться любыми существующими средствами. Кроме того, для построения дерева необходимо будет решить задачу выделения информативных решающих правил относительно имеющихся числовых признаков.
Разрешается использовать уже реализованные решающие деревья из известных библиотек (например, scikit-learn для Python), либо реализовывать алгоритм построения дерева самостоятельно (все необходимые алгоритмы представлены в теории по ссылке).
В качестве результата работы необходимо сделать 10 случайных разбиений исходных данных на обучающую и тестовую выборки, для каждой построить дерево и протестировать, после чего построить таблицу, в которой указать процент правильно классифицированных данных. Полученную таблицу необходимо включить в отчёт по лабораторной работе.
На сайте kaggle по ссылке https://www.kaggle.com/imnikhilanand/heart-attack-prediction/home располагаются реальные данные по сердечной заболеваемости, собранные различными медицинскими учреждениями. Каждый человек представлен 14ю характеристиками и полем goal, которое показывает наличие болезни сердца, поле принимает значение от 0 до 4 (0 – нет болезни).
Требуется имеющиеся данные разбить на обучающую и тестовую выборки в процентном соотношении 70 к 30. После чего по обучающей выборке необходимо построить решающее дерево. Для построения дерева можно пользоваться любыми существующими средствами. Кроме того, для построения дерева необходимо будет решить задачу выделения информативных решающих правил относительно имеющихся числовых признаков.
Разрешается использовать уже реализованные решающие деревья из известных библиотек (например, scikit-learn для Python), либо реализовывать алгоритм построения дерева самостоятельно (все необходимые алгоритмы представлены в теории по ссылке).
В качестве результата работы необходимо сделать 10 случайных разбиений исходных данных на обучающую и тестовую выборки, для каждой построить дерево и протестировать, после чего построить таблицу, в которой указать процент правильно классифицированных данных. Полученную таблицу необходимо включить в отчёт по лабораторной работе.
Дополнительная информация
Год сдачи - 2020
Язык - python3
Оценка - зачет.
Язык - python3
Оценка - зачет.
Похожие материалы
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Общее задание является единым для всех вариантов, вариант влияет только на тип входных данных и способ ввода. Способов ввода будет 2:
1) Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
2) Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее подходящая модель линейной регрессии. При помощи полученно
700 руб.
«Методы машинного обучения»
Илья272
: 5 ноября 2023
Контрольная работа состоит из нескольких заданий. От варианта студента зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Всем студентам предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (описание метода можно найти по ссылке). От варианта зависят весовая функция и значение k.
2) Построить классифик
1300 руб.
Лабораторная работа "Методы машинного обучения". Вариант №8
Daniil2001
: 2 ноября 2024
Работа зачтена. В архиве - отчет в формате word и текст программы на языке R
50 руб.
Методы машинного обучения. Лабораторная работа 1,2,3,4. Python.
LowCost
: 8 января 2021
Лабораторная работа №1. "Метод k ближайших соседей"
Суть лабораторной работы заключается в написании классификатора на
основе метода k ближайших соседей. Данные из файла необходимо разбить
на две выборки, обучающую и тестовую, согласно общепринятым правилам
разбиения. На основе этих данных необходимо обучить разработанный
классификатор и протестировать его на обеих выборках. В качестве отчёта
требуется представить работающую программу и таблицу с результатами
тестирования для каждого из 10 разби
299 руб.
Методы машинного обучения. Лабораторная работа. Вариант 04.
Михаил18
: 26 сентября 2019
Вариант 4
Способ ввода входных данных:
Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
Цены акций нефтяных компаний. 3 столбца – день наблюдения (диапазон 1-1000), цена за баррель нефти (1-200$, число дробное), стоимость акции (0.1-1000$). Зависимой переменной является стоимость акции, независимой – цена за баррель. Контрольное значение для прогноза 100.
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт,
800 руб.
Лабораторная работа по дисциплине: Методы машинного обучения. Вариант №04
IT-STUDHELP
: 6 июля 2023
Лабораторная работа
Задание:
4. Цены акций нефтяных компаний. 3 столбца – день наблюдения (диапазон 1-1000), цена за баррель нефти (1-200$, число дробное), стоимость акции (0.1-1000$). Зависимой переменной является стоимость акции, независимой – цена за баррель. Контрольное значение для прогноза 100.
------------------------------------------------------------------------------
1) Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
2) Данные задаются п
500 руб.
Лабораторная работа по дисциплине: Методы машинного обучения. Вариант №17
IT-STUDHELP
: 6 июля 2023
Лабораторная работа
Задание:
7. Y=1/X+〖log〗_5 X. Диапазон Х: 0.1-10. Контрольное значение для прогноза X=6.75.
------------------------------------------------------------------------------
1) Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
2) Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее
500 руб.
Лабораторная работа по дисциплине: Методы машинного обучения. Вариант №18
IT-STUDHELP
: 6 июля 2023
Лабораторная работа
Задание:
8. Y=X^2/(〖log〗_10 X). Диапазон Х: 2-10. Контрольное значение для прогноза Х=7.5.
------------------------------------------------------------------------------
1) Создать таблицу с данными и сохранить её в текстовом файле, данные считывать из этого файла
2) Данные задаются при помощи функции
При формировании данных необходимо создать не менее 30 пар значений. Необходимо написать скрипт, который будет считывать/формировать данные, по этим данным стоится наиболее
500 руб.
Другие работы
Лабораторная работа №4. Вариант №6
nell
: 10 октября 2017
Задание: Графы. Нахождение кратчайшего расстояния между двумя вершинами с помощью алгоритма Дейкстры
Написать программу, которая по алгоритму Дейкстры находит кратчайшее расстояние от указанной вершины до всех остальных вершин связного взвешенного неориентированного графа, имеющего 6 вершин (нумерация вершин начинается с 0). Граф задан матрицей весов дуг, соединяющих всевозможные пары вершин (0 означает, что соответствующей дуги нет). Данные считать из файла.
оконный интерфейс
300 руб.
Содержание планово-картографических и других материалов учета земель
evelin
: 4 января 2014
Содержание материалов и документов городского кадастра
Кадастровые данные подразделяются на общие, характеризующие территориально-планировочную структуру города (название, границы, коды городов, районов, секций, кадастровых участков, улиц, отрезков улиц, площадей и перекрестков) и специфические по объектам и явлениям (городские земли, водные поверхности; грунты; зеленые насаждения, здания и сооружения; инженерные коммуникации; улицы и дороги; медицина; экология; сфера обслуживания; население).
15 руб.
Разработка перспективного ТП изготовления детали штанга
smit1991
: 22 апреля 2013
. Служебное назначение дета-ли……………………………………….…...…...4
2. Анализ рабочего чертежа……………………………………………..………. 4
3. Разработка технологического черте-жа………………………………...…...…4
4. Анализ технологичности дета-ли………………………………………...…….5
5. Определение типа производст-ва………………………………………...….....7
6. Выбор вида и технико-экономическое обоснование способа получения заготов-ки……………………………………………………………………………..7
7. Выбор методов обработки отдельных поверхно-стей………………………...7
8. Разработка технологического процес-са…
350 руб.
Экзамен по дисциплине: Основы построения телекоммуникационных систем и сетей. Билет №14
mitriy
: 27 мая 2014
1. Типы и параметры орбит спутников Земли.
2. Транкинговые системы радиосвязи. Признаки, преимущества, отличие от сотовых систем.
3. Особенности технологии SDH.
100 руб.