Лабораторная работа №1 по дисциплине: Интеллектуальные технологии информационной безопасности. «Метод k ближайших соседей». Вариант 05
Состав работы
|
|
Работа представляет собой файл, который можно открыть в программе:
- Microsoft Word
Описание
Лабораторная работа No1
«Метод k ближайших соседей»
Вариант: 05
Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке один раз протестировать метод с найденными оптимальными значениями изменяемых параметров (количеством соседей k/ параметрами q и i/ шириной окна h).
В качестве отчёта требуется представить:
- Вариант работы.
- Работающая программа.
- Таблица с результатами тестирования на этапе подбора
параметров метода, в которой будет видна зависимость точности
предсказания от изменяемого параметра.
- Результат работы на тестовой выборке при найденных
оптимальных параметрах.
Разбиение выборки необходимо выполнять программно, случайным образом, при этом, не нарушая информативности обучающей выборки.
Разбивать рекомендуется по следующему правилу: делим выборку на 3 равных части, 2 части используем в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая выборка должна быть сгенерирована таким образом, чтобы минимизировать разницу между количеством представленных в ней объектов разных классов, т.е.
abs(|{(xi, yi) ∈ X |yi = −1}| − |{(xi, yi) ∈ X
|yi = 1}|) → min.
Входные данные:
К заданию на лабораторную работу прилагаются файлы, в которых представлены наборы данных из ~10^4 объектов. Каждый объект описывается двумя признаками (fj(x) ∈ R) и соответствующим ему классом (y ∈ {0,1}).
Пример чтения данных:
import pandas as pd
df = pd.read_csv('data.csv', sep=',')
Варианты:
Выполнение лабораторной работы разбито на несколько пунктов, в каждом из которых есть несколько вариантов, выбор варианта опирается на Nc – последние 2 цифры в пароле.
Первый пункт отвечает за выбор типа классификатора. Вариант выбирается по формуле NВ = (Nc mod 3) + 1:
1. Метод k взвешенных ближайших соседей
2. Метод парзеновского окна с фиксированным h
3. Метод парзеновского окна с относительным размером окна
Для варианта 1 необходимо использовать весовую функцию wi по формуле Nw = (Ncmod 2) + 1. Параметр q подбирается методом скользящего контроля.
1. wi = qi, q ∈ (0,1)
2. wi = (k+1−i/k)q, q ∈ {2,3,4}
В случае 2-го и 3-го вариантов, необходимо использовать функцию ядра K(z) из списка по следующей формуле Nя = ((Nс ∗ 6 + 13) mod 8 mod 3) + 1:
1. Q –квартическое K(x) = (1 − r^2)^2 [r ≤ 1]
2. T – треугольное K(x) = (1 − r)[r ≤ 1]
3. П – прямоугольное K(x) = [r ≤ 1]
Кроме того, к лабораторной работе прилагаются 5 файлов с данными для классификации, файл выбирается по следующей формуле
Nф = ((Nc + 2)mod 5) + 1
«Метод k ближайших соседей»
Вариант: 05
Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке один раз протестировать метод с найденными оптимальными значениями изменяемых параметров (количеством соседей k/ параметрами q и i/ шириной окна h).
В качестве отчёта требуется представить:
- Вариант работы.
- Работающая программа.
- Таблица с результатами тестирования на этапе подбора
параметров метода, в которой будет видна зависимость точности
предсказания от изменяемого параметра.
- Результат работы на тестовой выборке при найденных
оптимальных параметрах.
Разбиение выборки необходимо выполнять программно, случайным образом, при этом, не нарушая информативности обучающей выборки.
Разбивать рекомендуется по следующему правилу: делим выборку на 3 равных части, 2 части используем в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая выборка должна быть сгенерирована таким образом, чтобы минимизировать разницу между количеством представленных в ней объектов разных классов, т.е.
abs(|{(xi, yi) ∈ X |yi = −1}| − |{(xi, yi) ∈ X
|yi = 1}|) → min.
Входные данные:
К заданию на лабораторную работу прилагаются файлы, в которых представлены наборы данных из ~10^4 объектов. Каждый объект описывается двумя признаками (fj(x) ∈ R) и соответствующим ему классом (y ∈ {0,1}).
Пример чтения данных:
import pandas as pd
df = pd.read_csv('data.csv', sep=',')
Варианты:
Выполнение лабораторной работы разбито на несколько пунктов, в каждом из которых есть несколько вариантов, выбор варианта опирается на Nc – последние 2 цифры в пароле.
Первый пункт отвечает за выбор типа классификатора. Вариант выбирается по формуле NВ = (Nc mod 3) + 1:
1. Метод k взвешенных ближайших соседей
2. Метод парзеновского окна с фиксированным h
3. Метод парзеновского окна с относительным размером окна
Для варианта 1 необходимо использовать весовую функцию wi по формуле Nw = (Ncmod 2) + 1. Параметр q подбирается методом скользящего контроля.
1. wi = qi, q ∈ (0,1)
2. wi = (k+1−i/k)q, q ∈ {2,3,4}
В случае 2-го и 3-го вариантов, необходимо использовать функцию ядра K(z) из списка по следующей формуле Nя = ((Nс ∗ 6 + 13) mod 8 mod 3) + 1:
1. Q –квартическое K(x) = (1 − r^2)^2 [r ≤ 1]
2. T – треугольное K(x) = (1 − r)[r ≤ 1]
3. П – прямоугольное K(x) = [r ≤ 1]
Кроме того, к лабораторной работе прилагаются 5 файлов с данными для классификации, файл выбирается по следующей формуле
Nф = ((Nc + 2)mod 5) + 1
Дополнительная информация
Уважаемый студент дистанционного обучения,
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 1
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,
Ракитский Антон Андреевич
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 1
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,
Ракитский Антон Андреевич
Похожие материалы
Построить классификатор на основе метода ближайших k соседей - ИНТЕЛЛЕКТУАЛЬНЫЕ ТЕХНОЛОГИИ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ
adyg
: 26 февраля 2024
Аннотация на работу
Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От варианта зависят весовая функ
1500 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
SibGUTI2
: 25 июля 2024
Контрольная работа по методам классификации
Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От вариант
400 руб.
Лабораторная работа №1,2,3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
SibGUTI2
: 25 июля 2024
Лабораторная работа No1
«Метод k ближайших соседей»
Вариант: 05
Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке од
700 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
IT-STUDHELP
: 7 октября 2023
Лабораторная работа 1. «Метод k ближайших соседей»
Вариант 10
Выбор варианта:
NC = 10
Тип классификатора:
NВ = (NC mod 3) + 1 = 2
3. Метод парзеновского окна с фиксированным h.
Вариант функции ядра для метода празеновского окна определяется по формуле:
NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 2
2. T — треугольное K(x) = (1 − r)[r ≤ 1]
Вариант файла с данными для классификации определяется по формуле:
NФ = ((NC + 2) mod 5) + 1 = 3
Файл: data3.csv.
1 Результаты тестирования
Надёжность предсказа
900 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
IT-STUDHELP
: 7 октября 2023
Вариант №19
Лабораторные работы 1
Варианты (вариант № 19): функции №3, выборки № 2, ядра № 3.
2. Метод парзеновского окна с фиксированным h. Используется прямоугольное ядро.
=============================================
Лабораторная работа 2. «Решающие деревья»
1 Таблицы, показывающие % точности предсказания типа атак в зависимости от изменения параметров дерева решений и леса
Таблица 1. Результаты N запусков Решающего дерева
Максимальная глубина дерева
(max_depth) Максимальное количеств
900 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №5
IT-STUDHELP
: 19 июня 2023
Лабораторная работа 1. «Метод k ближайших соседей»
Вариант 05
Выбор варианта:
NC = 5
Тип классификатора:
NВ = (NC mod 3) + 1 = 3
3. Метод парзеновского окна с относительным размером окна.
Вариант функции ядра для метода празеновского окна определяется по формуле:
NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 1
1. Q — квадратическое K(x) = (1 - r2)2[r ≤ 1]
Вариант файла с данными для классификации определяется по формуле:
NФ = ((NC + 2) mod 5) + 1 = 3
Файл: data3.csv.
1 Результаты тестирования
Над
1000 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
IT-STUDHELP
: 7 октября 2023
Вариант No10
Контрольная работа
Выбор варианта:
N = 10
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=2
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=2
Вариант выборки для метода построения решающего дерева определяется по формуле:
N_вд=((N*N+2)mod11)+1=4
Обучающая последовательность и тестовый объект для метода ближайших соседей:
2) (X,Y)={(2,7,1), (6,6,1), (8,6,1), (7,5,1), (5,9,1), (9,9,2), (11,2,2), (6,4,2), (10,9,2), (8,6,3)
1150 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
IT-STUDHELP
: 7 октября 2023
Вариант №19
Контрольная работа по методам классификации
Выбор варианта: N = 19
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=11.
Обучающая последовательность и тестовый объект:
11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2),(11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}: тестовый объект x’=(13,10).
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=3.
Весовая функция:
3) — метод парзеновск
1150 руб.
Другие работы
Материалы и компоненты электронной техники. Зачет. Билет №62. 2020 год
SibGUTI2
: 10 июня 2020
Билет №62
39. В чем причина появления контактной разности потенциалов при контакте двух различных металлических проводников?
53. Как ведет себя диамагнетик в неоднородном магнитном поле? Почему?
200 руб.
Возникновение и общественная природа сознания
alfFRED
: 18 декабря 2012
Психика как отражение действительности в мозгу человека характеризуется разными уровнями.
Высший уровень психики, свойственный человеку, образует сознание. Сознание есть высшая, интегрирующая форма психики, результат общественно-исторических условий формирования человека в трудовой деятельности, при постоянном общении (с помощью языка) с другими людьми. В этом смысле сознание есть “общественный продукт”, сознание есть не что иное, как осознанное бытие.
Нет сомнения, что существует огромная разни
10 руб.
Гидравлика Задача 2.274
Z24
: 9 декабря 2025
В цилиндрический бак диаметром D=2 м до уровня Н=1,5 м налиты вода и бензин (рис. 2.16). Уровень воды в пьезометре ниже уровня бензина на h=300 мм. Определить вес находящегося в баке бензина, если ρб=700 кг/м³.
150 руб.
Корпус - Вариант 30. Задание 66
.Инженер.
: 3 сентября 2025
С.К. Боголюбов. Индивидуальные задания по курсу черчения. Задание 66. Вариант 30. Корпус.
По приведенные изображениям детали построить вид слева и выполнить необходимые разрезы.
В состав работы входит:
По заданию выполненный чертеж детали;
3D модель детали.
100 руб.