Выделение ключевых слов в текстовых документах

Цена:
15 руб.

Состав работы

material.view.file_icon
material.view.file_icon bestref-142949.doc
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
  • Microsoft Word

Описание

Для решения задач классификации текстов, документы в непосредственном виде не подходят для интерпретации классификатором. Поэтому необходимо применение процедуры индексации, которая переводит текст в удобное представление. В частности стандартные методы классификации, такие как нейронные сети и деревья решений, требуют представление документа в виде вектора из n взвешенных признаков. Построение такого вектора называется выделением признаков, а само представление векторной моделью документа.

Различия в подходах заключаются:

1) в понимании, что такое термин;

2) в способах определения веса термина.

Обычно признакам соответствуют все или некоторые отдельно взятые слова документа. В ряде экспериментов было обнаружено, что чуть даже более сложное представление менее эффективно. В частности, некоторые авторы пробовали использовать группы слов (стилистические, синтаксические) в качестве признаков. Д.Д. Льюис [5] довольно убедительно утверждает, что, скорее всего, причиной неутешительных результатов является то, что методы индексирования на основе фраз обладают худшими статистическими характеристиками по отношению к методам на основе одиночных слов, хотя их семантические качества гораздо выше.

Одним из самых распространенных методов перехода к математической модели документа, является «метод ключевых слов». Ключевое слово – слово в тексте, способное в совокупности с другими ключевыми словами представлять текст. Суть метода в следующем. Для каждого класса текстов создается список характерных для него слов, тогда каждый текст можно представить в виде вектора частот появлении в нём слов из данного списка [9]. Возникает проблема поиска и выделения из текста слов, которые будут для него ключевыми. Огромный объем информации, который подлежит обработке, делают особенно актуальной задачу автоматического выделения ключевых слов. Причем от чистоты этого выделения напрямую зависит точность классификации.

Целью работы является рассмотреть методы отделения ключевых слов в текстовых документах.
Операционные системы. Экзамен. Билет №12.
1) Многослойная структура ОС. Функции и характеристики слоев. 2) Проблема производителя и потребителя. Случай с несколькими буферами. Использование семафоров для синхронизации. 3) Железная дорога, соединяющая города A и B, имеет участок с одним путем. Пусть движение поездов из A в B и из B в A – процессы. Используя семафоры, запрограммировать движение поездов таким образом, чтобы в любой момент времени по единственному пути поезда двигались только в одном направлении. Рассмотреть проблему беск
User Cole82 : 17 января 2016
21 руб.
Контрольный тест по дисциплине «Социология» для студентов дистанционного обучения
Контрольный тест по дисциплине «Социология» для студентов дистанционного обучения Работа выполнена успешно.
User nastuschka1225 : 24 января 2018
150 руб.
Клапан обратный. Вариант №1. solidworks
Клапан обратный 3d модель Клапан обратный solidworks Клапан обратный сборка Клапан обратный скачать солид воркс Клапан обратный вариант 1 Корпус 1 изготовлен из стали. Фланец корпуса имеет четыре проходных отверстия для крепления болтами на рабочее место. На верхнем цилиндре корпуса нарезана наружная резьба М72х4 для навертывания накидной гайки 4: внутренний цилиндр имеет резьбу М50 для ввертывания втулки 3. Золотник 2 изготовлен из латуни. Он имеет четыре направляющих, скользящих в проходном о
User lepris : 20 декабря 2021
450 руб.
Клапан обратный. Вариант №1. solidworks
Выпускная квалификационная работа. Исследование вопросов оценки вероятности банкротства организации связи
Выпускная квалификационная работа. Исследование вопросов оценки вероятности банкротства организации связи Цель данной выпускной квалификационной работы – оценка вероятности банкротства компании ПАО «МегаФон», и разработка рекомендаций по улучшению её финансового состояния. Задачами исследования явились: изучение нормативно-правовых аспектов банкротства организации; изучение теоретических аспектов анализа финансового состояния организации; исследование и определение общей оценки финансового с
User const30 : 15 ноября 2017
1340 руб.
up Наверх