Лабораторная работа №1 по дисциплине: Интеллектуальные технологии информационной безопасности. «Метод k ближайших соседей». Вариант 05
Состав работы
|
|
Работа представляет собой файл, который можно открыть в программе:
- Microsoft Word
Описание
Лабораторная работа No1
«Метод k ближайших соседей»
Вариант: 05
Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке один раз протестировать метод с найденными оптимальными значениями изменяемых параметров (количеством соседей k/ параметрами q и i/ шириной окна h).
В качестве отчёта требуется представить:
- Вариант работы.
- Работающая программа.
- Таблица с результатами тестирования на этапе подбора
параметров метода, в которой будет видна зависимость точности
предсказания от изменяемого параметра.
- Результат работы на тестовой выборке при найденных
оптимальных параметрах.
Разбиение выборки необходимо выполнять программно, случайным образом, при этом, не нарушая информативности обучающей выборки.
Разбивать рекомендуется по следующему правилу: делим выборку на 3 равных части, 2 части используем в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая выборка должна быть сгенерирована таким образом, чтобы минимизировать разницу между количеством представленных в ней объектов разных классов, т.е.
abs(|{(xi, yi) ∈ X |yi = −1}| − |{(xi, yi) ∈ X
|yi = 1}|) → min.
Входные данные:
К заданию на лабораторную работу прилагаются файлы, в которых представлены наборы данных из ~10^4 объектов. Каждый объект описывается двумя признаками (fj(x) ∈ R) и соответствующим ему классом (y ∈ {0,1}).
Пример чтения данных:
import pandas as pd
df = pd.read_csv('data.csv', sep=',')
Варианты:
Выполнение лабораторной работы разбито на несколько пунктов, в каждом из которых есть несколько вариантов, выбор варианта опирается на Nc – последние 2 цифры в пароле.
Первый пункт отвечает за выбор типа классификатора. Вариант выбирается по формуле NВ = (Nc mod 3) + 1:
1. Метод k взвешенных ближайших соседей
2. Метод парзеновского окна с фиксированным h
3. Метод парзеновского окна с относительным размером окна
Для варианта 1 необходимо использовать весовую функцию wi по формуле Nw = (Ncmod 2) + 1. Параметр q подбирается методом скользящего контроля.
1. wi = qi, q ∈ (0,1)
2. wi = (k+1−i/k)q, q ∈ {2,3,4}
В случае 2-го и 3-го вариантов, необходимо использовать функцию ядра K(z) из списка по следующей формуле Nя = ((Nс ∗ 6 + 13) mod 8 mod 3) + 1:
1. Q –квартическое K(x) = (1 − r^2)^2 [r ≤ 1]
2. T – треугольное K(x) = (1 − r)[r ≤ 1]
3. П – прямоугольное K(x) = [r ≤ 1]
Кроме того, к лабораторной работе прилагаются 5 файлов с данными для классификации, файл выбирается по следующей формуле
Nф = ((Nc + 2)mod 5) + 1
«Метод k ближайших соседей»
Вариант: 05
Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке один раз протестировать метод с найденными оптимальными значениями изменяемых параметров (количеством соседей k/ параметрами q и i/ шириной окна h).
В качестве отчёта требуется представить:
- Вариант работы.
- Работающая программа.
- Таблица с результатами тестирования на этапе подбора
параметров метода, в которой будет видна зависимость точности
предсказания от изменяемого параметра.
- Результат работы на тестовой выборке при найденных
оптимальных параметрах.
Разбиение выборки необходимо выполнять программно, случайным образом, при этом, не нарушая информативности обучающей выборки.
Разбивать рекомендуется по следующему правилу: делим выборку на 3 равных части, 2 части используем в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая выборка должна быть сгенерирована таким образом, чтобы минимизировать разницу между количеством представленных в ней объектов разных классов, т.е.
abs(|{(xi, yi) ∈ X |yi = −1}| − |{(xi, yi) ∈ X
|yi = 1}|) → min.
Входные данные:
К заданию на лабораторную работу прилагаются файлы, в которых представлены наборы данных из ~10^4 объектов. Каждый объект описывается двумя признаками (fj(x) ∈ R) и соответствующим ему классом (y ∈ {0,1}).
Пример чтения данных:
import pandas as pd
df = pd.read_csv('data.csv', sep=',')
Варианты:
Выполнение лабораторной работы разбито на несколько пунктов, в каждом из которых есть несколько вариантов, выбор варианта опирается на Nc – последние 2 цифры в пароле.
Первый пункт отвечает за выбор типа классификатора. Вариант выбирается по формуле NВ = (Nc mod 3) + 1:
1. Метод k взвешенных ближайших соседей
2. Метод парзеновского окна с фиксированным h
3. Метод парзеновского окна с относительным размером окна
Для варианта 1 необходимо использовать весовую функцию wi по формуле Nw = (Ncmod 2) + 1. Параметр q подбирается методом скользящего контроля.
1. wi = qi, q ∈ (0,1)
2. wi = (k+1−i/k)q, q ∈ {2,3,4}
В случае 2-го и 3-го вариантов, необходимо использовать функцию ядра K(z) из списка по следующей формуле Nя = ((Nс ∗ 6 + 13) mod 8 mod 3) + 1:
1. Q –квартическое K(x) = (1 − r^2)^2 [r ≤ 1]
2. T – треугольное K(x) = (1 − r)[r ≤ 1]
3. П – прямоугольное K(x) = [r ≤ 1]
Кроме того, к лабораторной работе прилагаются 5 файлов с данными для классификации, файл выбирается по следующей формуле
Nф = ((Nc + 2)mod 5) + 1
Дополнительная информация
Уважаемый студент дистанционного обучения,
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 1
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,
Ракитский Антон Андреевич
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 1
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,
Ракитский Антон Андреевич
Похожие материалы
Построить классификатор на основе метода ближайших k соседей - ИНТЕЛЛЕКТУАЛЬНЫЕ ТЕХНОЛОГИИ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ
adyg
: 26 февраля 2024
Аннотация на работу
Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От варианта зависят весовая функ
1500 руб.
Лабораторная работа №1 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 03
Учеба "Под ключ"
: 9 марта 2026
Лабораторная работа №1
«Метод k ближайших соседей»
Цель работы
Цель ‒ реализовать и исследовать классификатор на основе метода k ближайших соседей в взвешенной модификации (NV=1) в соответствии с формулами выбора по Nc. Согласно заданию, веса задаются как w_i=((k+1-i)/k)^q при q ∈ {2,3,4} (Nw=2), а файл данных выбирается по формуле Nf=((Nc+2) mod 5 + 1, что для Nc=03 даёт data1.csv. Данные случайно разбиваются на три равные части; две части используются для обучения, одна ‒ для теста, при
800 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
SibGUTI2
: 25 июля 2024
Контрольная работа по методам классификации
Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От вариант
400 руб.
Лабораторная работа №1,2,3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
SibGUTI2
: 25 июля 2024
Лабораторная работа No1
«Метод k ближайших соседей»
Вариант: 05
Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке од
700 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
IT-STUDHELP
: 7 октября 2023
Лабораторная работа 1. «Метод k ближайших соседей»
Вариант 10
Выбор варианта:
NC = 10
Тип классификатора:
NВ = (NC mod 3) + 1 = 2
3. Метод парзеновского окна с фиксированным h.
Вариант функции ядра для метода празеновского окна определяется по формуле:
NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 2
2. T — треугольное K(x) = (1 − r)[r ≤ 1]
Вариант файла с данными для классификации определяется по формуле:
NФ = ((NC + 2) mod 5) + 1 = 3
Файл: data3.csv.
1 Результаты тестирования
Надёжность предсказа
900 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
IT-STUDHELP
: 7 октября 2023
Вариант №19
Лабораторные работы 1
Варианты (вариант № 19): функции №3, выборки № 2, ядра № 3.
2. Метод парзеновского окна с фиксированным h. Используется прямоугольное ядро.
=============================================
Лабораторная работа 2. «Решающие деревья»
1 Таблицы, показывающие % точности предсказания типа атак в зависимости от изменения параметров дерева решений и леса
Таблица 1. Результаты N запусков Решающего дерева
Максимальная глубина дерева
(max_depth) Максимальное количеств
900 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №5
IT-STUDHELP
: 19 июня 2023
Лабораторная работа 1. «Метод k ближайших соседей»
Вариант 05
Выбор варианта:
NC = 5
Тип классификатора:
NВ = (NC mod 3) + 1 = 3
3. Метод парзеновского окна с относительным размером окна.
Вариант функции ядра для метода празеновского окна определяется по формуле:
NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 1
1. Q — квадратическое K(x) = (1 - r2)2[r ≤ 1]
Вариант файла с данными для классификации определяется по формуле:
NФ = ((NC + 2) mod 5) + 1 = 3
Файл: data3.csv.
1 Результаты тестирования
Над
1000 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
IT-STUDHELP
: 7 октября 2023
Вариант №19
Контрольная работа по методам классификации
Выбор варианта: N = 19
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=11.
Обучающая последовательность и тестовый объект:
11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2),(11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}: тестовый объект x’=(13,10).
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=3.
Весовая функция:
3) — метод парзеновск
1150 руб.
Другие работы
Стенд для правки и контроля прямолинейности валов турбобура-Чертеж-Оборудование для добычи и подготовки нефти и газа-Курсовая работа-Дипломная работа
https://vk.com/aleksey.nakonechnyy27
: 6 июня 2016
Стенд для правки и контроля прямолинейности валов турбобура-(Формат Компас-CDW, Autocad-DWG, Adobe-PDF, Picture-Jpeg)-Чертеж-Оборудование для добычи и подготовки нефти и газа-Курсовая работа-Дипломная работа
297 руб.
Натяжная станция транспортера - 01.016 Деталирование
HelpStud
: 13 октября 2025
У ленточных передач лента транспортера под действием силы тяжести груза и собственного веса вытягивается. Для натяжения ленты применяют различные натяжные устройства. На чертеже показана натяжная станция ведомой ветви ленты транспортера. Натяжная станция транспортера состоит из трех сварных роликов 5, в ступицы 2 которых для уменьшения потерь на трение запрессованы бронзовые втулки3. Ролики свободно вращаются на осях. Для поддерживающих роликов — это оси 9. Ось натяжного ролика состоит из двух п
450 руб.
Повышение эффективности и рентабельности добычи угля подземным способом Шахты "Обуховская" в с обогатительной фабрикой, в состав ОАО «Шахтоуправление «Обуховская»
lenya.nakonechnyy.92@mail.ru
: 22 апреля 2020
Повышение эффективности и рентабельности добычи угля подземным способом Шахты "Обуховская" в с обогатительной фабрикой, в состав ОАО «Шахтоуправление «Обуховская»-Добыча полезных ископаемых-Геология-Геологоразведка-Оборудование-Машины и механизмы-Агрегаты-Установки-Комплексы-Узлы-Детали-Курсовая работа-Дипломная работа
В данном дипломном проекте рассматриваются следующие вопросы:
- в горно-геологическом разделе - общие сведения о шахте, рассчитывается срок с
2983 руб.
Задача 532 по физике
anderwerty
: 24 июня 2014
Найти скорость V мезона, если его полная энергия в 10 раз больше энергии покоя.
10 руб.