Лабораторная работа №1 по дисциплине: Интеллектуальные технологии информационной безопасности. «Метод k ближайших соседей». Вариант 05
Состав работы
|
|
Работа представляет собой файл, который можно открыть в программе:
- Microsoft Word
Описание
Лабораторная работа No1
«Метод k ближайших соседей»
Вариант: 05
Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке один раз протестировать метод с найденными оптимальными значениями изменяемых параметров (количеством соседей k/ параметрами q и i/ шириной окна h).
В качестве отчёта требуется представить:
- Вариант работы.
- Работающая программа.
- Таблица с результатами тестирования на этапе подбора
параметров метода, в которой будет видна зависимость точности
предсказания от изменяемого параметра.
- Результат работы на тестовой выборке при найденных
оптимальных параметрах.
Разбиение выборки необходимо выполнять программно, случайным образом, при этом, не нарушая информативности обучающей выборки.
Разбивать рекомендуется по следующему правилу: делим выборку на 3 равных части, 2 части используем в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая выборка должна быть сгенерирована таким образом, чтобы минимизировать разницу между количеством представленных в ней объектов разных классов, т.е.
abs(|{(xi, yi) ∈ X |yi = −1}| − |{(xi, yi) ∈ X
|yi = 1}|) → min.
Входные данные:
К заданию на лабораторную работу прилагаются файлы, в которых представлены наборы данных из ~10^4 объектов. Каждый объект описывается двумя признаками (fj(x) ∈ R) и соответствующим ему классом (y ∈ {0,1}).
Пример чтения данных:
import pandas as pd
df = pd.read_csv('data.csv', sep=',')
Варианты:
Выполнение лабораторной работы разбито на несколько пунктов, в каждом из которых есть несколько вариантов, выбор варианта опирается на Nc – последние 2 цифры в пароле.
Первый пункт отвечает за выбор типа классификатора. Вариант выбирается по формуле NВ = (Nc mod 3) + 1:
1. Метод k взвешенных ближайших соседей
2. Метод парзеновского окна с фиксированным h
3. Метод парзеновского окна с относительным размером окна
Для варианта 1 необходимо использовать весовую функцию wi по формуле Nw = (Ncmod 2) + 1. Параметр q подбирается методом скользящего контроля.
1. wi = qi, q ∈ (0,1)
2. wi = (k+1−i/k)q, q ∈ {2,3,4}
В случае 2-го и 3-го вариантов, необходимо использовать функцию ядра K(z) из списка по следующей формуле Nя = ((Nс ∗ 6 + 13) mod 8 mod 3) + 1:
1. Q –квартическое K(x) = (1 − r^2)^2 [r ≤ 1]
2. T – треугольное K(x) = (1 − r)[r ≤ 1]
3. П – прямоугольное K(x) = [r ≤ 1]
Кроме того, к лабораторной работе прилагаются 5 файлов с данными для классификации, файл выбирается по следующей формуле
Nф = ((Nc + 2)mod 5) + 1
«Метод k ближайших соседей»
Вариант: 05
Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке один раз протестировать метод с найденными оптимальными значениями изменяемых параметров (количеством соседей k/ параметрами q и i/ шириной окна h).
В качестве отчёта требуется представить:
- Вариант работы.
- Работающая программа.
- Таблица с результатами тестирования на этапе подбора
параметров метода, в которой будет видна зависимость точности
предсказания от изменяемого параметра.
- Результат работы на тестовой выборке при найденных
оптимальных параметрах.
Разбиение выборки необходимо выполнять программно, случайным образом, при этом, не нарушая информативности обучающей выборки.
Разбивать рекомендуется по следующему правилу: делим выборку на 3 равных части, 2 части используем в качестве обучающей, одну в качестве тестовой. Кроме того, обучающая выборка должна быть сгенерирована таким образом, чтобы минимизировать разницу между количеством представленных в ней объектов разных классов, т.е.
abs(|{(xi, yi) ∈ X |yi = −1}| − |{(xi, yi) ∈ X
|yi = 1}|) → min.
Входные данные:
К заданию на лабораторную работу прилагаются файлы, в которых представлены наборы данных из ~10^4 объектов. Каждый объект описывается двумя признаками (fj(x) ∈ R) и соответствующим ему классом (y ∈ {0,1}).
Пример чтения данных:
import pandas as pd
df = pd.read_csv('data.csv', sep=',')
Варианты:
Выполнение лабораторной работы разбито на несколько пунктов, в каждом из которых есть несколько вариантов, выбор варианта опирается на Nc – последние 2 цифры в пароле.
Первый пункт отвечает за выбор типа классификатора. Вариант выбирается по формуле NВ = (Nc mod 3) + 1:
1. Метод k взвешенных ближайших соседей
2. Метод парзеновского окна с фиксированным h
3. Метод парзеновского окна с относительным размером окна
Для варианта 1 необходимо использовать весовую функцию wi по формуле Nw = (Ncmod 2) + 1. Параметр q подбирается методом скользящего контроля.
1. wi = qi, q ∈ (0,1)
2. wi = (k+1−i/k)q, q ∈ {2,3,4}
В случае 2-го и 3-го вариантов, необходимо использовать функцию ядра K(z) из списка по следующей формуле Nя = ((Nс ∗ 6 + 13) mod 8 mod 3) + 1:
1. Q –квартическое K(x) = (1 − r^2)^2 [r ≤ 1]
2. T – треугольное K(x) = (1 − r)[r ≤ 1]
3. П – прямоугольное K(x) = [r ≤ 1]
Кроме того, к лабораторной работе прилагаются 5 файлов с данными для классификации, файл выбирается по следующей формуле
Nф = ((Nc + 2)mod 5) + 1
Дополнительная информация
Уважаемый студент дистанционного обучения,
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 1
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,
Ракитский Антон Андреевич
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 1
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,
Ракитский Антон Андреевич
Похожие материалы
Построить классификатор на основе метода ближайших k соседей - ИНТЕЛЛЕКТУАЛЬНЫЕ ТЕХНОЛОГИИ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ
adyg
: 26 февраля 2024
Аннотация на работу
Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От варианта зависят весовая функ
1500 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
SibGUTI2
: 25 июля 2024
Контрольная работа по методам классификации
Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий.
Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо:
1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От вариант
400 руб.
Лабораторная работа №1,2,3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
SibGUTI2
: 25 июля 2024
Лабораторная работа No1
«Метод k ближайших соседей»
Вариант: 05
Задание на лабораторную работу 1:
Суть лабораторной работы заключается в написании классификатора на основе метода k ближайших соседей. Данные из файла необходимо разбить на две выборки, обучающую и тестовую, согласно общепринятым правилам разбиения. На основе этих данных необходимо обучить разработанный классификатор. На обучающей выборке следует подобрать необходимые параметры метода для лучшей точности, а на тестовой выборке од
700 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
IT-STUDHELP
: 7 октября 2023
Лабораторная работа 1. «Метод k ближайших соседей»
Вариант 10
Выбор варианта:
NC = 10
Тип классификатора:
NВ = (NC mod 3) + 1 = 2
3. Метод парзеновского окна с фиксированным h.
Вариант функции ядра для метода празеновского окна определяется по формуле:
NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 2
2. T — треугольное K(x) = (1 − r)[r ≤ 1]
Вариант файла с данными для классификации определяется по формуле:
NФ = ((NC + 2) mod 5) + 1 = 3
Файл: data3.csv.
1 Результаты тестирования
Надёжность предсказа
900 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
IT-STUDHELP
: 7 октября 2023
Вариант №19
Лабораторные работы 1
Варианты (вариант № 19): функции №3, выборки № 2, ядра № 3.
2. Метод парзеновского окна с фиксированным h. Используется прямоугольное ядро.
=============================================
Лабораторная работа 2. «Решающие деревья»
1 Таблицы, показывающие % точности предсказания типа атак в зависимости от изменения параметров дерева решений и леса
Таблица 1. Результаты N запусков Решающего дерева
Максимальная глубина дерева
(max_depth) Максимальное количеств
900 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №5
IT-STUDHELP
: 19 июня 2023
Лабораторная работа 1. «Метод k ближайших соседей»
Вариант 05
Выбор варианта:
NC = 5
Тип классификатора:
NВ = (NC mod 3) + 1 = 3
3. Метод парзеновского окна с относительным размером окна.
Вариант функции ядра для метода празеновского окна определяется по формуле:
NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 1
1. Q — квадратическое K(x) = (1 - r2)2[r ≤ 1]
Вариант файла с данными для классификации определяется по формуле:
NФ = ((NC + 2) mod 5) + 1 = 3
Файл: data3.csv.
1 Результаты тестирования
Над
1000 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
IT-STUDHELP
: 7 октября 2023
Вариант №19
Контрольная работа по методам классификации
Выбор варианта: N = 19
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=11.
Обучающая последовательность и тестовый объект:
11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2),(11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}: тестовый объект x’=(13,10).
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=3.
Весовая функция:
3) — метод парзеновск
1150 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
IT-STUDHELP
: 7 октября 2023
Вариант No10
Контрольная работа
Выбор варианта:
N = 10
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=2
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=2
Вариант выборки для метода построения решающего дерева определяется по формуле:
N_вд=((N*N+2)mod11)+1=4
Обучающая последовательность и тестовый объект для метода ближайших соседей:
2) (X,Y)={(2,7,1), (6,6,1), (8,6,1), (7,5,1), (5,9,1), (9,9,2), (11,2,2), (6,4,2), (10,9,2), (8,6,3)
1150 руб.
Другие работы
Космические и наземные системы радиосвязи (часть 1-я). Билет №74
Учеба "Под ключ"
: 16 ноября 2021
Билет №74
1. При каких видах манипуляции можно передавать цифровые сигналы со скоростью передачи информации 139 Мбит/с по стволу цифровой радиорелейной линии с полосой пропускания высокочастотного тракта 40 МГц?
- 16-QAM
- QPSK
- 8-PSK
12. Сколько «окон» содержит глаз-диаграмма 4-х уровневого сигнала?
- четыре окна
- три окна
- два окна
15. В какой точке тракта приема ЦСРС установлен регенератор радиоствола?
- на выходе приемника
- на выходе демодулятора
- на выходе фильтра
16. Какие иска
350 руб.
Розміщення галузей машинобудівного комплексу України
SerFACE
: 11 февраля 2013
Галузева структура й асортимент продукції машинобудування зумовлюють особливості розміщення його виробництва. Особливо великий вплив на розміщення окремих галузей і підгалузей машинобудування мають технологічні процеси, форми організації виробництва. Проте машинобудування насамперед належить до галузей "вільного розміщення", оскільки на нього менше, ніж на інші галузі, впливають природні умови й ресурси. У зв'язку з цим на розміщення підприємств машинобудування визначальний вплив мають економічн
20 руб.
Теплотехника РГАУ-МСХА 2018 Задача 7 Вариант 18
Z24
: 27 января 2026
Паропровод диаметром d2/d1 (рис. 8.3) покрыт слоем совелитовой изоляции толщиной δ2, мм. Коэффициенты теплопроводности материала трубы λ1, изоляции λ2=0,1 Вт/(м·К). Температуры пара tж1 и окружающего воздуха tж2, °С. Требуется определить линейный коэффициент теплопередачи kl, Вт/(м2·K), линейную плотность теплового потока ql, Вт/м и температуру наружной поверхности паропровода t3, °С
Ответить на вопросы:
Сформулируйте закон теплопроводности Фурье и дайте его математическое выражение.
Какой
200 руб.
Теплотехника СФУ 2017 Задача 5 Вариант 20
Z24
: 31 декабря 2026
Определить удельный лучистый тепловой поток q (Вт/м²) между двумя параллельно расположенными плоскими стенками, имеющими температуры t1 и t2 и степени черноты ε1 и ε2, если между ними нет экрана. Определить q при наличии экрана со степенью черноты εэ (с обеих сторон).
Ответить на вопросы.
Во сколько раз уменьшится тепловой поток, если принять в вашем варианте задачи εэ = ε1 по сравнению с потоком без экрана?
Для случая ε1 = ε2 определите, какой экран из таблицы 5 даст наихудший эффект, а ка
180 руб.