Лабораторная работа №2 по дисциплине: Интеллектуальные технологии информационной безопасности. “Решающие деревья”. Вариант для всех

Состав работы

material.view.file_icon D18344A5-AF79-48B1-A71B-68B3E1D8B86C.docx
Работа представляет собой файл, который можно открыть в программе:
  • Microsoft Word

Описание

Лабораторная работа No2

“Решающие деревья”

К заданию прилагается файл с данными, содержащим результаты исследований методов обнаружения вторжений. Файл содержит в себе несколько колонок, все они перечислены:

columns = ['duration', 'protocol_type', 'service', 'flag', 'src
_bytes', 'dst_bytes', 'land', 'wrong_fragment','urgent', 'hot',
'num_failed_logins', 'logged_in', 'num_compromised', 'root_she ll', 'su_attempted',
'num_root', 'num_file_creations', 'num_shells', 'num
_access_files', 'num_outbound_cmds',
'is_host_login', 'is_guest_login', 'count', 'srv_cou
nt', 'serror_rate', 'srv_serror_rate',
'rerror_rate', 'srv_rerror_rate', 'same_srv_rate', '
diff_srv_rate', 'srv_diff_host_rate',
'dst_host_count', 'dst_host_srv_count', 'dst_host_sa
me_srv_rate', 'dst_host_diff_srv_rate',
'dst_host_same_src_port_rate', 'dst_host_srv_diff_ho
st_rate', 'dst_host_serror_rate',
'dst_host_srv_serror_rate', 'dst_host_rerror_rate',
'dst_host_srv_rerror_rate', 'attack', 'level']

Задание:
Классифицировать атаки по типу атак, проверить правильность
классификации.
Считать файл можно следующим образом:
import pandas as pd
df = pd.read_csv('KDDTrain+.txt')
test_df = pd.read_csv('KDDTest+.txt')
columns = (['duration'
,'protocol_type'
,'service'
,'flag'
,'src_bytes'
,'dst_bytes'
,'land'
,'wrong_fragment'
,'urgent'
,'hot'
,'num_failed_logins'
,'logged_in'
,'num_compromised'
,'root_shell'
,'su_attempted'
,'num_root'
,'num_file_creations'
,'num_shells'
,'num_access_files'
,'num_outbound_cmds'
,'is_host_login'
,'is_guest_login'
,'count'
,'srv_count'
,'serror_rate'
,'srv_serror_rate'
,'rerror_rate'
,'srv_rerror_rate'
,'same_srv_rate'
,'diff_srv_rate'
,'srv_diff_host_rate'
,'dst_host_count'
,'dst_host_srv_count'
,'dst_host_same_srv_rate'
,'dst_host_diff_srv_rate'
,'dst_host_same_src_port_rate'
,'dst_host_srv_diff_host_rate'
,'dst_host_serror_rate'
,'dst_host_srv_serror_rate'
,'dst_host_rerror_rate'
,'dst_host_srv_rerror_rate'
,'attack'
,'level'])
df.columns = columns
test_df.columns = columns
В файле информация о типах атак находится в столбце «attack», всего их 5
видов:
attack_labels = ['Normal','DoS','Probe','U2R','R2L']
Требуется имеющиеся данные разбить на обучающую и тестовую выборки в
процентном соотношении 70 к 30.
После чего по обучающей выборке необходимо построить решающее дерево,
а также случайный лес.
Разрешается использовать уже реализованные решающие деревья из
известных библиотек (например, scikit-learn для Python).
В качестве отчёта требуется представить:
Работающая программа, определяющая с помощью изучаемых методов
типы атак и процент правильности их определения;
2 таблицы, указанные в приложении, показывающие % точности
предсказания типа атак в зависимости от изменения параметров дерева
решений и леса;
Параметры дерева, на которых достигается наилучшая точность
предсказания;
Параметры леса, на которых достигается наилучшая точность предсказания;

Дополнительная информация

Уважаемый студент дистанционного обучения,
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 2
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,

Ракитский Антон Андреевич
Лабораторная работа №2 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 03
Лабораторная работа №2 «Решающие деревья» Цель работы Построить и сравнить два классификатора для распознавания типа сетевой атаки по данным KDD: (1) решающее дерево и (2) случайный лес. Использовать разбиение 70/30, кодировать категориальные признаки one-hot, провести перебор гиперпараметров, зафиксировать процент правильности (accuracy) для разных настроек и выбрать лучшие параметры по точности. 1. Загрузка и подготовка данных Фрагмент кода: Результаты (из лога). 2. Решающее дерев
User Учеба "Под ключ" : 9 марта 2026
800 руб.
promo
Онлайн Тест по дисциплине: Интеллектуальные технологии информационной безопасности.
Вопрос No1 К основным задачам машинного обучения относятся: Поиск скрытых закономерностей, генерация новых знаний Классификация, кластеризация, регрессия, уменьшение размерности и прогнозирование Обработка специализированных наборов данных, генерация новых наборов данных, сжатие данных Повышение точности прогноза по сравнению с некоторой существующей прогнозирующей или решающей моделью, виртуализация данных, оптимизация Вопрос No2 MSE это Measure Square Evaluating, оценка квадратичной
User IT-STUDHELP : 29 сентября 2023
700 руб.
promo
Интеллектуальные технологии информационной безопасности. Контрольная работа. Вариант 22
Контрольная работа по методам классификации Выбор варианта: N = 22 Вариант выборки для метода ближайших соседей определяется по формуле: N_в=((N+13)mod11)+1=3 Классификатор на основе метода ближайших k соседей и определение класса тестового значения Решение: (X,Y)={ (1,7,1), (3,2,1), (6,8,1), (4,7,1), (9,8,1), (4,5,1), (1,2,1), (14,10,2), (8,12,2), (14,12,2), (11,10,2), (13,8,2), (13,6,2)}: тестовый объект x’=(6,7) 1 Построить классификатор на основе алгоритма CART построения дерева прин
User banderas0876 : 14 ноября 2023
250 руб.
Интеллектуальные технологии информационной безопасности. Контрольная работа. Вариант 22
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 03
Контрольная работа по методам классификации 1. Постановка задачи Необходимо реализовать два метода классификации: 1. Метод ближайших k соседей (kNN) с весовой функцией Парзеновского окна. 2. Метод построения дерева решений (CART) с использованием критерия Джини. Каждый студент работает с индивидуальными данными, определяемыми по последним двум цифрам пароля (в данном случае ‒ N = 03). Требуется: - рассчитать свои варианты по формулам; - построить классификатор для тестовой точки по каж
User Учеба "Под ключ" : 9 марта 2026
1500 руб.
promo
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
Контрольная работа по методам классификации Контрольная работа состоит из нескольких заданий. От варианта студента (2 последние цифры пароля) зависят входные данные, для которых будут решаться задания, а также некоторые особенности выполнения заданий. Предоставляются наборы данных, в зависимости от варианта, для этих данных необходимо: 1) Построить классификатор на основе метода ближайших k соседей и определить класс тестового значения (методические указания и пример приведены ниже); От вариант
User SibGUTI2 : 25 июля 2024
400 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 05
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
Вариант №19 Контрольная работа по методам классификации Выбор варианта: N = 19 Вариант выборки для метода ближайших соседей определяется по формуле: N_в=((N+13)mod11)+1=11. Обучающая последовательность и тестовый объект: 11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2),(11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}: тестовый объект x’=(13,10). Вариант весовой функции определяется по формуле: N_вф=((N+7)mod4)+1=3. Весовая функция: 3) — метод парзеновск
User IT-STUDHELP : 7 октября 2023
600 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19 promo
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
Вариант №10 Выбор варианта: N = 10 Вариант выборки для метода ближайших соседей определяется по формуле: N_в=((N+13)mod11)+1=2 Вариант весовой функции определяется по формуле: N_вф=((N+7)mod4)+1=2 Вариант выборки для метода построения решающего дерева определяется по формуле: N_вд=((N*N+2)mod11)+1=4 Обучающая последовательность и тестовый объект для метода ближайших соседей: 2) (X,Y)={(2,7,1), (6,6,1), (8,6,1), (7,5,1), (5,9,1), (9,9,2), (11,2,2), (6,4,2), (10,9,2), (8,6,3), (1,10,3), (9,7,3),
User IT-STUDHELP : 7 октября 2023
600 руб.
Контрольная работа по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10 promo
ЭКЗАМЕНАЦИОННАЯ РАБОТА. Электротехника, 6 вариант.
1.Устройство сдвига уровней и эмиттерный повторитель. 2.Изобразите принципиальную схему базового элемента 2И-НЕ семейства ТТЛ. Составьте таблицу истинности.... 3.Изобразите принципиальную схему усилительного каскада на МДП ПТ с индуцированным каналом p-типа....
User Simplex : 16 марта 2016
20 руб.
Экзамен по дисциплине: Человеко-машинное взаимодействие. Билет №02.
Задание 1 Программа stego-c.exe предназначена для добавления скрытой информации в программы на языках Си и Си++ путём изменения порядка описания локальных переменных (вам не нужно вдаваться в подробности этого метода). Программа может решать три задачи: определение ёмкости (сколько скрытой информации можно поместить), запись скрытой информации и чтение скрытой информации. Может использоваться один файл или группа файлов в папке. Необходимо описать последовательность действий для решения задачи
User ДО Сибгути : 6 декабря 2017
300 руб.
Ценообразование на транспорте
1. Теоретическая часть 1.1. Характеристика ценообразования на различных типах рынка 1.2. Ценообразование на авиаперевозки 1.3. Основные положения государственного регулирования тарифов на железнодорожном транспорте РФ 2. Практическая часть Задача 1 УСЛОВИЕ ЗАДАЧИ Определить розничную цену товара, если затраты на его производство включают: - сырье и материалы – 3657 тыс. руб. - возвратные отходы – 25,98 тыс. руб. - топливо и энергия на технологические цели – 984 тыс. руб. - заработная плата произ
User СибирскийГУТИ : 6 марта 2014
70 руб.
Курсовая работа На тему: «Проект ЦС СТС на базе SI 2000 V.5». Вариант №9
Задание 9 к курсовому проекту: 1. Назначение АТС: центральная станция типа SI-2000 V.5 2. Емкость станции: 2.1. Количество абонентов, включенных в центральную АТС: 3740 2.2. Количество местных таксофонов: 85 2.3. Количество междугородных таксофонов: 8 2.4. Количество кабин переговорных пунктов: 5 2.5. Количество оконечных устройств передачи данных: 7 2.6. Количество пользователей ISDN: доступ 30B+D: 3 доступ 2B+D: 11 2.7. УПАТС, включенные в ЦС: типа Harris 20-20 LX емкостью 965
User elina56 : 25 апреля 2018
100 руб.
up Наверх