Лабораторная работа №1 по дисциплине: Интеллектуальные технологии информационной безопасности. «Метод k ближайших соседей». Вариант 05

Состав работы

material.view.file_icon 8296527D-959A-4FFD-A0A7-F2B6EFB96ABD.docx
Работа представляет собой файл, который можно открыть в программе:
  • Microsoft Word

Описание

Лабораторная работа No1
«Метод k ближайших соседей»

Вариант: 05

Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке один раз протестировать метод с найденными оптимальными значениями изменяемых параметров (количеством соседей k/ параметрами q и i/ шириной окна h).

В качестве отчёта требуется представить:
- Вариант работы.
- Работающая программа.
- Таблица с результатами тестирования на этапе подбора
параметров метода, в которой будет видна зависимость точности
предсказания от изменяемого параметра.
- Результат работы на тестовой выборке при найденных
оптимальных параметрах.
Разбиение выборки необходимо выполнять программно, случайным образом, при этом, не нарушая информативности обучающей выборки.
Разбивать рекомендуется по следующему правилу: делим выборку на 3 равных части, 2 части используем в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая выборка должна быть сгенерирована таким образом, чтобы минимизировать разницу между количеством представленных в ней объектов разных классов, т.е.
abs(|{(xi, yi) ∈ X |yi = −1}| − |{(xi, yi) ∈ X
|yi = 1}|) → min.

Входные данные:
К заданию на лабораторную работу прилагаются файлы, в которых представлены наборы данных из ~10^4 объектов. Каждый объект описывается двумя признаками (fj(x) ∈ R) и соответствующим ему классом (y ∈ {0,1}).

Пример чтения данных:
import pandas as pd
df = pd.read_csv('data.csv', sep=',')

Варианты:
Выполнение лабораторной работы разбито на несколько пунктов, в каждом из которых есть несколько вариантов, выбор варианта опирается на Nc – последние 2 цифры в пароле.
Первый пункт отвечает за выбор типа классификатора. Вариант выбирается по формуле NВ = (Nc mod 3) + 1:
1. Метод k взвешенных ближайших соседей
2. Метод парзеновского окна с фиксированным h
3. Метод парзеновского окна с относительным размером окна
Для варианта 1 необходимо использовать весовую функцию wi по формуле Nw = (Ncmod 2) + 1. Параметр q подбирается методом скользящего контроля.
1. wi = qi, q ∈ (0,1)
2. wi = (k+1−i/k)q, q ∈ {2,3,4}
В случае 2-го и 3-го вариантов, необходимо использовать функцию ядра K(z) из списка по следующей формуле Nя = ((Nс ∗ 6 + 13) mod 8 mod 3) + 1:
1. Q –квартическое K(x) = (1 − r^2)^2 [r ≤ 1]
2. T – треугольное K(x) = (1 − r)[r ≤ 1]
3. П – прямоугольное K(x) = [r ≤ 1]
Кроме того, к лабораторной работе прилагаются 5 файлов с данными для классификации, файл выбирается по следующей формуле
Nф = ((Nc + 2)mod 5) + 1

Дополнительная информация

Уважаемый студент дистанционного обучения,
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 1
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,

Ракитский Антон Андреевич
Построить классификатор на основе метода ближайших k соседей - ИНТЕЛЛЕКТУАЛЬНЫЕ ТЕХНОЛОГИИ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ
Аннотация на работу Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий. Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо: 1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От варианта зависят весовая функ
User adyg : 26 февраля 2024
1500 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
Контрольная работа по методам классификации Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий. Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо: 1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От вариант
User SibGUTI2 : 25 июля 2024
400 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
Лабораторная работа №1,2,3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
Лабораторная работа No1 «Метод k ближайших соседей» Вариант: 05 Задание на лабораторную работу 1: Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке од
User SibGUTI2 : 25 июля 2024
700 руб.
Лабораторная работа №1,2,3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
Лабораторная работа 1. «Метод k ближайших соседей» Вариант 10 Выбор варианта: NC = 10 Тип классификатора: NВ = (NC mod 3) + 1 = 2 3. Метод парзеновского окна с фиксированным h. Вариант функции ядра для метода празеновского окна определяется по формуле: NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 2 2. T — треугольное K(x) = (1 − r)[r ≤ 1] Вариант файла с данными для классификации определяется по формуле: NФ = ((NC + 2) mod 5) + 1 = 3 Файл: data3.csv. 1 Результаты тестирования Надёжность предсказа
User IT-STUDHELP : 7 октября 2023
900 руб.
promo
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
Вариант №19 Лабораторные работы 1 Варианты (вариант № 19): функции №3, выборки № 2, ядра № 3. 2. Метод парзеновского окна с фиксированным h. Используется прямоугольное ядро. ============================================= Лабораторная работа 2. «Решающие деревья» 1 Таблицы, показывающие % точности предсказания типа атак в зависимости от изменения параметров дерева решений и леса Таблица 1. Результаты N запусков Решающего дерева Максимальная глубина дерева (max_depth) Максимальное количеств
User IT-STUDHELP : 7 октября 2023
900 руб.
promo
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №5
Лабораторная работа 1. «Метод k ближайших соседей» Вариант 05 Выбор варианта: NC = 5 Тип классификатора: NВ = (NC mod 3) + 1 = 3 3. Метод парзеновского окна с относительным размером окна. Вариант функции ядра для метода празеновского окна определяется по формуле: NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 1 1. Q — квадратическое K(x) = (1 - r2)2[r ≤ 1] Вариант файла с данными для классификации определяется по формуле: NФ = ((NC + 2) mod 5) + 1 = 3 Файл: data3.csv. 1 Результаты тестирования Над
User IT-STUDHELP : 19 июня 2023
1000 руб.
promo
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
Вариант №19 Контрольная работа по методам классификации Выбор варианта: N = 19 Вариант выборки для метода ближайших соседей определяется по формуле: N_в=((N+13)mod11)+1=11. Обучающая последовательность и тестовый объект: 11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2),(11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}: тестовый объект x’=(13,10). Вариант весовой функции определяется по формуле: N_вф=((N+7)mod4)+1=3. Весовая функция: 3) — метод парзеновск
User IT-STUDHELP : 7 октября 2023
1150 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19 promo
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
Вариант No10 Контрольная работа Выбор варианта: N = 10 Вариант выборки для метода ближайших соседей определяется по формуле: N_в=((N+13)mod11)+1=2 Вариант весовой функции определяется по формуле: N_вф=((N+7)mod4)+1=2 Вариант выборки для метода построения решающего дерева определяется по формуле: N_вд=((N*N+2)mod11)+1=4 Обучающая последовательность и тестовый объект для метода ближайших соседей: 2) (X,Y)={(2,7,1), (6,6,1), (8,6,1), (7,5,1), (5,9,1), (9,9,2), (11,2,2), (6,4,2), (10,9,2), (8,6,3)
User IT-STUDHELP : 7 октября 2023
1150 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10 promo
Космические и наземные системы радиосвязи (часть 1-я). Билет №74
Билет №74 1. При каких видах манипуляции можно передавать цифровые сигналы со скоростью передачи информации 139 Мбит/с по стволу цифровой радиорелейной линии с полосой пропускания высокочастотного тракта 40 МГц? - 16-QAM - QPSK - 8-PSK 12. Сколько «окон» содержит глаз-диаграмма 4-х уровневого сигнала? - четыре окна - три окна - два окна 15. В какой точке тракта приема ЦСРС установлен регенератор радиоствола? - на выходе приемника - на выходе демодулятора - на выходе фильтра 16. Какие иска
User Учеба "Под ключ" : 16 ноября 2021
350 руб.
promo
Розміщення галузей машинобудівного комплексу України
Галузева структура й асортимент продукції машинобудування зумовлюють особливості розміщення його виробництва. Особливо великий вплив на розміщення окремих галузей і підгалузей машинобудування мають технологічні процеси, форми організації виробництва. Проте машинобудування насамперед належить до галузей "вільного розміщення", оскільки на нього менше, ніж на інші галузі, впливають природні умови й ресурси. У зв'язку з цим на розміщення підприємств машинобудування визначальний вплив мають економічн
User SerFACE : 11 февраля 2013
20 руб.
Теплотехника РГАУ-МСХА 2018 Задача 7 Вариант 18
Паропровод диаметром d2/d1 (рис. 8.3) покрыт слоем совелитовой изоляции толщиной δ2, мм. Коэффициенты теплопроводности материала трубы λ1, изоляции λ2=0,1 Вт/(м·К). Температуры пара tж1 и окружающего воздуха tж2, °С. Требуется определить линейный коэффициент теплопередачи kl, Вт/(м2·K), линейную плотность теплового потока ql, Вт/м и температуру наружной поверхности паропровода t3, °С Ответить на вопросы: Сформулируйте закон теплопроводности Фурье и дайте его математическое выражение. Какой
User Z24 : 27 января 2026
200 руб.
Теплотехника РГАУ-МСХА 2018 Задача 7 Вариант 18
Теплотехника СФУ 2017 Задача 5 Вариант 20
Определить удельный лучистый тепловой поток q (Вт/м²) между двумя параллельно расположенными плоскими стенками, имеющими температуры t1 и t2 и степени черноты ε1 и ε2, если между ними нет экрана. Определить q при наличии экрана со степенью черноты εэ (с обеих сторон). Ответить на вопросы. Во сколько раз уменьшится тепловой поток, если принять в вашем варианте задачи εэ = ε1 по сравнению с потоком без экрана? Для случая ε1 = ε2 определите, какой экран из таблицы 5 даст наихудший эффект, а ка
User Z24 : 31 декабря 2026
180 руб.
Теплотехника СФУ 2017 Задача 5 Вариант 20
up Наверх