Лабораторная работа №3 по дисциплине: Интеллектуальные технологии информационной безопасности. “Регрессия”. Для всех вариантов
Состав работы
|
|
Работа представляет собой файл, который можно открыть в программе:
- Microsoft Word
Описание
Лабораторная работа No3
“Регрессия”
Целью данной лабораторной работы является разработка программы, реализующей применение метода логистической регрессии к заданному набору данных.
В набор данных входят 2 файла, в «True» находится информация о правдивых новостных заметках, в «Fake.csv» находится информация о поддельных новостях. Каждый файл состоит из следующих полей:
1. (title) – заголовок статьи;
2. (text) – содержимое статьи;
3. (subject) – тип новости;
4. (date) – дата опубликования статьи.
Реализация регрессии в Scikit-Learn
На практике предлагается использовать проверенную и широко используемую библиотеку Scikit-Learn для реализации регрессии.
Следующая команда импортирует набор данных CSV, используя библиотеку pandas:
dataset = pd.read_csv('Weather.csv')
Чтобы увидеть статистические данные набора данных, можно использовать метод describe():
dataset.describe()
Затем разделяем 80% данных на обучающий набор, а 20% данных - на набор тестов, используя приведенный ниже код.
Переменная test_size - это то место, где мы на самом деле указываем пропорцию тестового набора.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
Наконец, после разделения данных на обучающие и тестовые наборы, настало время обучить наш алгоритм. Для этого нужно импортировать класс LinearRegression, создать его экземпляр и вызвать fit() метод вместе с нашими данными обучения.
regressor = LinearRegression()
regressor.fit(X_train, y_train)
Теперь, когда мы обучили наш алгоритм, пришло время сделать некоторые прогнозы. Для этого будем использовать наши тестовые данные и посмотрим,
насколько точно алгоритм предсказывает процентную оценку. Чтобы сделать прогноз на тестовых данных, выполните следующий скрипт:
y_pred = regressor.predict(X_test)
Задание: используя модель логистической регрессии реализовать прогнозирование реалистичности статьи.
1. Необходимо построить модель для каждого из наборов, обучить её и сравнить полученные при помощи модели результаты с известными. Для обучения использовать 70% выборки, для тестирования 30%. Разбивать необходимо случайным образом, а, следовательно, для корректности тестирования качества модели, эксперимент необходимо провести не менее 10 раз и вычислить среднее значение качества регрессии.
2. Работу регрессии необходимо проверить на конкретном примере. При подаче на вход определённого объекта данных (заголовка статьи, текста, типа и даты) программа должна выводить тип статьи «Fake» или «Frue»,
выведенное значение необходимо проверить с тем, что находится в исходных данных.
Особенности работы с данными:
После загрузки данных в память необходимо пометить поддельные новости «0», а подлинные новости «1» для дальнейшей работы.
Для преобразования текста в частотные векторы слова использовать метод TfidfVectorizer().
В качестве отчёта требуется представить:
Работающую программу, в которой отражено использование метода логистической регрессии для предсказания типа статей.
Результаты 10 запусков отразить в таблице, где указать номер запуска и процент правильности предсказания типа статьи. Перед каждым запуском данные можно обработать с помощью метода shuffle().
Среднее значение предсказания типа статьи исходя из 10 запусков
“Регрессия”
Целью данной лабораторной работы является разработка программы, реализующей применение метода логистической регрессии к заданному набору данных.
В набор данных входят 2 файла, в «True» находится информация о правдивых новостных заметках, в «Fake.csv» находится информация о поддельных новостях. Каждый файл состоит из следующих полей:
1. (title) – заголовок статьи;
2. (text) – содержимое статьи;
3. (subject) – тип новости;
4. (date) – дата опубликования статьи.
Реализация регрессии в Scikit-Learn
На практике предлагается использовать проверенную и широко используемую библиотеку Scikit-Learn для реализации регрессии.
Следующая команда импортирует набор данных CSV, используя библиотеку pandas:
dataset = pd.read_csv('Weather.csv')
Чтобы увидеть статистические данные набора данных, можно использовать метод describe():
dataset.describe()
Затем разделяем 80% данных на обучающий набор, а 20% данных - на набор тестов, используя приведенный ниже код.
Переменная test_size - это то место, где мы на самом деле указываем пропорцию тестового набора.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
Наконец, после разделения данных на обучающие и тестовые наборы, настало время обучить наш алгоритм. Для этого нужно импортировать класс LinearRegression, создать его экземпляр и вызвать fit() метод вместе с нашими данными обучения.
regressor = LinearRegression()
regressor.fit(X_train, y_train)
Теперь, когда мы обучили наш алгоритм, пришло время сделать некоторые прогнозы. Для этого будем использовать наши тестовые данные и посмотрим,
насколько точно алгоритм предсказывает процентную оценку. Чтобы сделать прогноз на тестовых данных, выполните следующий скрипт:
y_pred = regressor.predict(X_test)
Задание: используя модель логистической регрессии реализовать прогнозирование реалистичности статьи.
1. Необходимо построить модель для каждого из наборов, обучить её и сравнить полученные при помощи модели результаты с известными. Для обучения использовать 70% выборки, для тестирования 30%. Разбивать необходимо случайным образом, а, следовательно, для корректности тестирования качества модели, эксперимент необходимо провести не менее 10 раз и вычислить среднее значение качества регрессии.
2. Работу регрессии необходимо проверить на конкретном примере. При подаче на вход определённого объекта данных (заголовка статьи, текста, типа и даты) программа должна выводить тип статьи «Fake» или «Frue»,
выведенное значение необходимо проверить с тем, что находится в исходных данных.
Особенности работы с данными:
После загрузки данных в память необходимо пометить поддельные новости «0», а подлинные новости «1» для дальнейшей работы.
Для преобразования текста в частотные векторы слова использовать метод TfidfVectorizer().
В качестве отчёта требуется представить:
Работающую программу, в которой отражено использование метода логистической регрессии для предсказания типа статей.
Результаты 10 запусков отразить в таблице, где указать номер запуска и процент правильности предсказания типа статьи. Перед каждым запуском данные можно обработать с помощью метода shuffle().
Среднее значение предсказания типа статьи исходя из 10 запусков
Дополнительная информация
Уважаемый студент дистанционного обучения,
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 3
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,
Ракитский Антон Андреевич
Оценена Ваша работа по предмету: Интеллектуальные технологии информационной безопасности
Вид работы: Лабораторная работа 3
Оценка: Зачет
Дата оценки: 27.06.2024
Рецензия: Уважаемый ...............................................,
Ракитский Антон Андреевич
Похожие материалы
Лабораторная работа №3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант 03
Учеба "Под ключ"
: 9 марта 2026
Лабораторная работа №3
«Регрессия»
Цель работы
Построить модель логистической регрессии для бинарной классификации новостей (поддельная/правдивая), провести не менее 10 случайных экспериментов с разбиением 70/30, оценить долю правильных ответов (accuracy), свести результаты в таблицу и проверить работу модели на одном конкретном примере.
1. Загрузка данных и разметка классов
Фрагмент кода:
Результат (из лога):
2. Построение конвейера признаков и модели
Фрагмент кода:
3. Серия из
800 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
IT-STUDHELP
: 7 октября 2023
Лабораторная работа 1. «Метод k ближайших соседей»
Вариант 10
Выбор варианта:
NC = 10
Тип классификатора:
NВ = (NC mod 3) + 1 = 2
3. Метод парзеновского окна с фиксированным h.
Вариант функции ядра для метода празеновского окна определяется по формуле:
NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 2
2. T — треугольное K(x) = (1 − r)[r ≤ 1]
Вариант файла с данными для классификации определяется по формуле:
NФ = ((NC + 2) mod 5) + 1 = 3
Файл: data3.csv.
1 Результаты тестирования
Надёжность предсказа
900 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
IT-STUDHELP
: 7 октября 2023
Вариант №19
Лабораторные работы 1
Варианты (вариант № 19): функции №3, выборки № 2, ядра № 3.
2. Метод парзеновского окна с фиксированным h. Используется прямоугольное ядро.
=============================================
Лабораторная работа 2. «Решающие деревья»
1 Таблицы, показывающие % точности предсказания типа атак в зависимости от изменения параметров дерева решений и леса
Таблица 1. Результаты N запусков Решающего дерева
Максимальная глубина дерева
(max_depth) Максимальное количеств
900 руб.
Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №5
IT-STUDHELP
: 19 июня 2023
Лабораторная работа 1. «Метод k ближайших соседей»
Вариант 05
Выбор варианта:
NC = 5
Тип классификатора:
NВ = (NC mod 3) + 1 = 3
3. Метод парзеновского окна с относительным размером окна.
Вариант функции ядра для метода празеновского окна определяется по формуле:
NЯ = ((NC · 6 + 13) mod 8 mod 3) + 1 = 1
1. Q — квадратическое K(x) = (1 - r2)2[r ≤ 1]
Вариант файла с данными для классификации определяется по формуле:
NФ = ((NC + 2) mod 5) + 1 = 3
Файл: data3.csv.
1 Результаты тестирования
Над
1000 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №19
IT-STUDHELP
: 7 октября 2023
Вариант №19
Контрольная работа по методам классификации
Выбор варианта: N = 19
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=11.
Обучающая последовательность и тестовый объект:
11) (X,Y)={ (7,2,1), (8,1,1), (8,7,1), (8,2,1), (9,9,1), (6,8,1), (13,8,2), (6,1,2),(11,8,2), (4,12,3), (7,14,3), (1,8,3), (9,6,3)}: тестовый объект x’=(13,10).
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=3.
Весовая функция:
3) — метод парзеновск
1150 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №10
IT-STUDHELP
: 7 октября 2023
Вариант No10
Контрольная работа
Выбор варианта:
N = 10
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=2
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=2
Вариант выборки для метода построения решающего дерева определяется по формуле:
N_вд=((N*N+2)mod11)+1=4
Обучающая последовательность и тестовый объект для метода ближайших соседей:
2) (X,Y)={(2,7,1), (6,6,1), (8,6,1), (7,5,1), (5,9,1), (9,9,2), (11,2,2), (6,4,2), (10,9,2), (8,6,3)
1150 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Интеллектуальные технологии информационной безопасности. Вариант №5
IT-STUDHELP
: 19 июня 2023
Контрольная работа
Вариант No5
Выбор варианта:
N = 5
Вариант выборки для метода ближайших соседей определяется по формуле:
N_в=((N+13)mod11)+1=8
Вариант весовой функции определяется по формуле:
N_вф=((N+7)mod4)+1=1
Вариант выборки для метода построения решающего дерева определяется по формуле:
N_вд=((N*N+2)mod11)+1=6
Обучающая последовательность и тестовый объект для метода ближайших соседей:
8) (X,Y)={ (5,9,1), (2,9,1), (3,7,1), (8,8,2), (14,4,2), (10,1,2), (12,4,2), (7,7,2), (12,7,2), (9,13,3
1450 руб.
Онлайн Тест по дисциплине: Интеллектуальные технологии информационной безопасности.
IT-STUDHELP
: 29 сентября 2023
Вопрос No1
К основным задачам машинного обучения относятся:
Поиск скрытых закономерностей, генерация новых знаний
Классификация, кластеризация, регрессия, уменьшение размерности и прогнозирование
Обработка специализированных наборов данных, генерация новых наборов данных, сжатие данных
Повышение точности прогноза по сравнению с некоторой существующей прогнозирующей или решающей моделью, виртуализация данных, оптимизация
Вопрос No2
MSE это
Measure Square Evaluating, оценка квадратичной
700 руб.
Другие работы
Сальниковое уплотнение для насоса ЦНС (центробежный насос)
Александр368
: 21 июня 2015
1 сальниковое уплотнение
2 спецификация
3 в pdf для распечатывания чертежа
150 руб.
Гидрозамок МЧ00.33 Боголюбов
fox777
: 3 мая 2017
Гидрозамок представляет собой гидравлический управляемый обратный клапан, применяемый для запирания рабочих полостей гидроцилиндров. В архиве находиться полная 3D сборка с каждой деталью отдельно.
Задание "Гидрозамок" Альбом "Чтение и деталирование сборочных чертежей" С.К. Боголюбов. Шифр сборочной единицы МЧ00.33.00.00.СБ.
Состав: 3D Сборка, Сборочный чертеж (СБ), Деталировка
Софт: КОМПАС-3D 14
290 руб.
Защита информации в беспроводных сетях (ДВ 1.1). Контрольная работа «Шифрование в сетях 802.11». Вариант №04 2021
Fijulika
: 13 марта 2021
Защита информации в беспроводных сетях (ДВ 1.1) Контрольная работа «Шифрование в сетях 802.11» Вариант 04 2021
Вариант определяется последними двумя цифрами Вашего пароля 04.
Задание 1
1. Исходные данные для всех вариантов:
a. Метод аутентификации PSK.
b. Название сети SSID: sibsutis
c. MAC-адрес точки доступа(шестн.): 000726404eff
d. MAC-адрес клиента (шестн.): 9439e5b014e5
2. Пароль к Wi-Fi сети: kursovik04, где 04 –ваш вариант.
3. Сгенерировать самостоятельно (придумать) последовательно
300 руб.
Предпринимательство и бизнес в России
Elfa254
: 23 февраля 2014
Предпринимательство – одна из важнейших составляющих современной экономики. В странах рыночной экономики предпринимательство получило широкое распространение и составляет подавляющую часть среди всех форм организаций. За последние десять лет в России появились миллионы предпринимателей и собственников. В связи с приватизацией за государством осталась лишь часть организаций и предприятий, остальные перешли в частное владение. Основную часть российского предпринимательства составляет малый и средн
5 руб.