Лабораторная работа №2 по дисциплине: Интеллектуальные технологии информационной безопасности. “Решающие деревья”. Вариант для всех

Состав работы

material.view.file_icon D18344A5-AF79-48B1-A71B-68B3E1D8B86C.docx
Работа представляет собой файл, который можно открыть в программе:
  • Microsoft Word

Описание

Лабораторная работа No2

“Решающие деревья”

К заданию прилагается файл с данными, содержащим результаты исследований методов обнаружения вторжений. Файл содержит в себе несколько колонок, все они перечислены:

columns = ['duration', 'protocol_type', 'service', 'flag', 'src
_bytes', 'dst_bytes', 'land', 'wrong_fragment','urgent', 'hot',
'num_failed_logins', 'logged_in', 'num_compromised', 'root_she ll', 'su_attempted',
'num_root', 'num_file_creations', 'num_shells', 'num
_access_files', 'num_outbound_cmds',
'is_host_login', 'is_guest_login', 'count', 'srv_cou
nt', 'serror_rate', 'srv_serror_rate',
'rerror_rate', 'srv_rerror_rate', 'same_srv_rate', '
diff_srv_rate', 'srv_diff_host_rate',
'dst_host_count', 'dst_host_srv_count', 'dst_host_sa
me_srv_rate', 'dst_host_diff_srv_rate',
'dst_host_same_src_port_rate', 'dst_host_srv_diff_ho
st_rate', 'dst_host_serror_rate',
'dst_host_srv_serror_rate', 'dst_host_rerror_rate',
'dst_host_srv_rerror_rate', 'attack', 'level']

Задание:
Классифицировать атаки по типу атак, проверить правильность
классификации.
Считать файл можно следующим образом:
import pandas as pd
df = pd.read_csv('KDDTrain+.txt')
test_df = pd.read_csv('KDDTest+.txt')
columns = (['duration'
,'protocol_type'
,'service'
,'flag'
,'src_bytes'
,'dst_bytes'
,'land'
,'wrong_fragment'
,'urgent'
,'hot'
,'num_failed_logins'
,'logged_in'
,'num_compromised'
,'root_shell'
,'su_attempted'
,'num_root'
,'num_file_creations'
,'num_shells'
,'num_access_files'
,'num_outbound_cmds'
,'is_host_login'
,'is_guest_login'
,'count'
,'srv_count'
,'serror_rate'
,'srv_serror_rate'
,'rerror_rate'
,'srv_rerror_rate'
,'same_srv_rate'
,'diff_srv_rate'
,'srv_diff_host_rate'
,'dst_host_count'
,'dst_host_srv_count'
,'dst_host_same_srv_rate'
,'dst_host_diff_srv_rate'
,'dst_host_same_src_port_rate'
,'dst_host_srv_diff_host_rate'
,'dst_host_serror_rate'
,'dst_host_srv_serror_rate'
,'dst_host_rerror_rate'
,'dst_host_srv_rerror_rate'
,'attack'
,'level'])
df.columns = columns
test_df.columns = columns
В файле информация о типах атак находится в столбце «attack», всего их 5
видов:
attack_labels = ['Normal','DoS','Probe','U2R','R2L']
Требуется имеющиеся данные разбить на обучающую и тестовую выборки в
процентном соотношении 70 к 30.
После чего по обучающей выборке необходимо построить решающее дерево,
а также случайный лес.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python).
В качестве отчёта требуется представить:
Работающая программа, определяющая с помощью изучаемых методов
типы атак и процент правильности их определения;
2 таблицы, указанные в приложении, показывающие % точности
предсказания типа атак в зависимости от изменения параметров дерева
решений и леса;
Параметры дерева, на которых достигается наилучшая точность
предсказания;
Параметры леса, на которых достигается наилучшая точность предсказания;

Дополнительная информация

Уважаемый студент дистанционного обучения,
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 2
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,

Ракитский Антон Андреевич
Лабораторная работа №2 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 03
Лабораторная работа №2 «Решающие деревья» Цель работы Построить и сравнить два классификатора для распознавания типа сетевой атаки по данным KDD: (1) решающее дерево и (2) случайный лес. Использовать разбиение 70/30, кодировать категориальные признаки one-hot, провести перебор гиперпараметров, зафиксировать процент правильности (accuracy) для разных настроек и выбрать лучшие параметры по точности. 1. Загрузка и подготовка данных Фрагмент кода: Результаты (из лога). 2. Решающее дерев
User Учеба "Под ключ" : 9 марта 2026
800 руб.
promo
Онлайн Тест по дисциплине: Интеллектуальные технологии информационной безопасности.
Вопрос No1 К основным задачам машинного обучения относятся: Поиск скрытых закономерностей, генерация новых знаний Классификация, кластеризация, регрессия, уменьшение размерности и прогнозирование Обработка специализированных наборов данных, генерация новых наборов данных, сжатие данных Повышение точности прогноза по сравнению с некоторой существующей прогнозирующей или решающей моделью, виртуализация данных, оптимизация Вопрос No2 MSE это Measure Square Evaluating, оценка квадратичной
User IT-STUDHELP : 29 сентября 2023
700 руб.
promo
Интеллектуальные технологии информационной безопасности. Контрольная работа. Вариант 22
Контрольная работа по методам классификации Выбор варианта: N = 22 Вариант выборки для метода ближайших соседей определяется по формуле: N_в=((N+13)mod11)+1=3 Классификатор на основе метода ближайших k соседей и определение класса тестового значения Решение: (X,Y)={ (1,7,1), (3,2,1), (6,8,1), (4,7,1), (9,8,1), (4,5,1), (1,2,1), (14,10,2), (8,12,2), (14,12,2), (11,10,2), (13,8,2), (13,6,2)}: тестовый объект x’=(6,7) 1 Построить классификатор на основе алгоритма CART построения дерева прин
User banderas0876 : 14 ноября 2023
250 руб.
Интеллектуальные технологии информационной безопасности. Контрольная работа. Вариант 22
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 03
Контрольная работа по методам классификации 1. Постановка задачи Необходимо реализовать два метода классификации: 1. Метод ближайших k соседей (kNN) с весовой функцией Парзеновского окна. 2. Метод построения дерева решений (CART) с использованием критерия Джини. Каждый студент работает с индивидуальными данными, определяемыми по последним двум цифрам пароля (в данном случае ‒ N = 03). Требуется: - рассчитать свои варианты по формулам; - построить классификатор для тестовой точки по каж
User Учеба "Под ключ" : 9 марта 2026
1500 руб.
promo
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
Контрольная работа по методам классификации Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий. Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо: 1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От вариант
User SibGUTI2 : 25 июля 2024
400 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
Вариант №19 Контрольная работа по методам классификации Выбор варианта: N = 19 Вариант выборки для метода ближайших соседей определяется по формуле: N_в=((N+13)mod11)+1=11. Обучающая последовательность и тестовый объект: 11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2),(11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}: тестовый объект x’=(13,10). Вариант весовой функции определяется по формуле: N_вф=((N+7)mod4)+1=3. Весовая функция: 3) — метод парзеновск
User IT-STUDHELP : 7 октября 2023
600 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19 promo
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
Вариант №10 Выбор варианта: N = 10 Вариант выборки для метода ближайших соседей определяется по формуле: N_в=((N+13)mod11)+1=2 Вариант весовой функции определяется по формуле: N_вф=((N+7)mod4)+1=2 Вариант выборки для метода построения решающего дерева определяется по формуле: N_вд=((N*N+2)mod11)+1=4 Обучающая последовательность и тестовый объект для метода ближайших соседей: 2) (X,Y)={(2,7,1), (6,6,1), (8,6,1), (7,5,1), (5,9,1), (9,9,2), (11,2,2), (6,4,2), (10,9,2), (8,6,3), (1,10,3), (9,7,3),
User IT-STUDHELP : 7 октября 2023
600 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10 promo
Операционные системы Лабораторная работа 1 Вариант 6
Лабораторная работа №1 Вариант 6 Обработка прерываний клавиатуры Задание для выполнения лаб. работы №1 Написать программу, которая должна “озвучивать” клавиатуру, т.е. после запуска этой программы нажатие любой клавиши на клавиатуре будет сопровождаться звуковым сигналом. Клавиатура при этом должна оставаться работоспособной, т.е. продолжать выполнять свои основные функции в нормальном темпе. Программа должна быть резидентной, т.е. оставаться в памяти после своего завершения. В качестве про
User SOKOLOV : 26 декабря 2025
300 руб.
Операционные системы Лабораторная работа 1 Вариант 6
Лабораторная работа №1 «Исследование собственных и дополнительных затуханий в оптических кабелях связи» по дисциплине: «Направляющие линии электросвязи». Вариант №14
1. Цель работы Цель работы является проведение компьютерного эксперимента по исследованию собственных и дополнительных затуханий в оптических кабелях связи: - собственных затуханий; - затуханий в местах соединений оптических волокон; - затуханий на микроизгибах и макроизгибах; 2. Программа лабораторной работы 2.1 Расчет и построение таблицы зависимости затухания из-за поглощения энергии в материале от длинны волны. 2.2 Моделирование и построение графика зависимости затухание из-за Релеевского р
User Jurgen : 13 июня 2012
150 руб.
Теплотехника КемТИПП 2014 Задача Б-4 Вариант 49
Изолированный горизонтальный трубопровод проложен на открытом воздухе, температура которого tж. Температура наружной поверхности изоляции равна tст, наружный диаметр изоляции равен d. Определить коэффициент теплоотдачи и тепловые потери с 1 м длины трубопровода. Во сколько раз возрастут тепловые потери, если трубопровод будет обдуваться поперечным потоком воздуха со скоростью ω?
User Z24 : 12 февраля 2026
200 руб.
Теплотехника КемТИПП 2014 Задача Б-4 Вариант 49
Контрольная работа по дисциплие: Основы радиосвязи и телевидения, Вариант № 20
Задача No1. Начертить осциллограмму полного ТВ сигнала, соответствующего развертке заданной строки изображения, показанного на рисунке 4.1. На осциллограмме указать длительность строки, длительность прямого хода развертки, гасящего импульса строк, синхронизирующего импульса строк, а так же численные значения уровне белого, серого, черного, гашения и синхронизирующих импульсов. Осциллограмма должна быть построена под изображением. n = 20∙5 = 100 . Задача No2. Определить значения яркостного и цве
User bioclown : 30 ноября 2012
79 руб.
up Наверх