СИНЕРГИЯ Большие данные в экономике Тест 95 баллов 2023 год

Состав работы

material.view.file_icon 2FDB66A6-E523-469E-8785-4693FD729167.pdf
Работа представляет собой файл, который можно открыть в программе:
  • Adobe Acrobat Reader

Описание

СИНЕРГИЯ Большие данные в экономике
МТИ МосТех МосАП МФПУ Синергия Тест оценка ОТЛИЧНО 2023 год

Задания

1. Алгоритм — это:

*указание на выполнение действий

*процесс выполнения вычислений, приводящих к решению задачи

*система правил, описывающая последовательность действий, которые необходимо выполнить для решения задачи

2. Бизнес процесс – это:

*Взаимосвязанные виды деятельности, преобразующие входы в выходы

*Cовокупность взаимосвязанных и взаимодействующих видов деятельности, преобразующая входы в выходы, представляющие ценность для клиента

*Cовокупность разнородных и существенных видов деятельности, преобразующая входы в выходы, которые могут быть полезны для клиента

*Множество видов деятельности, объединенных производством одного продукта, услуги

3. Большинство методов Data mining были разработаны в рамках ...

*теории искусственного интеллекта

*классического анализа данных

*теории баз данных

4. В каких из приведенных ниже случаев речь идет структурированных данных:

*Данные о продажах фирмы, представленные в виде отчётов в MS Excel

*Таблица с ежедневными показаниями температуры помещения за год в файле формата CSV

*Текст книги, представленный в формате PDF

*Фильмы, представленных в формате mpeg на одном жестком диске

5. Горизонтальная масштабируемость при обработке Big Data – это:

*Расширение механизма обработки данных при росте объема данных

*Увеличение скорости обработки при росте объема данных

*Спад скорости обработки при росте объема данных

*Изменение масштабов представления результатов обработки данных

6. Деревья решений относятся к группе (группам) ...

*статистических методов

*кибернетических методов

*логических методов

*методов кросс-табуляции

7. Заказчик бизнес-процесса – это должностное лицо:

*Имеет в своем распоряжении средства для заказа выхода бизнес - процесса

*Имеет в своем распоряжении материальные и информационные ресурсы бизнес - процесса, управляет его ходом, несет ответственность за результат и эффективность

*Имеет в своем распоряжении ресурсы и полномочия для принятия решений о проведении работ по описанию, регламентации или аудиту бизнес - процесса

*имеет в своем распоряжении необходимый инструментарий для проектирования бизнес - процессом и его управления

8. К основным характеристикам Big Data относятся:

*Virtualization, Volume, Variability, Vehicle

*Variety, Velocity, Volume, Value

*Verification, Volume, Velocity, Visualization

*Video, Value, Variety, Volume

9. Как в R обозначаются пропущенные значения?

10. Как можно получить помощь в R:

*В R-Studio можно поставить курсор на название функции и нажать F1

*перед названием функции можно напечатать знак вопроса;

*можно воспользоваться функцией help()

11. Как назвается в R тип данных «булевы»?

12. Как назвается в R тип данных «строки»?

13. Как назвается в R тип данных «целые числа»?

14. Как назвается в R тип данных «числа с плавающей точкой»?

15. Какая функция dplyr служит для вертикального объединения таблиц?

*bind()

*bind_rows()

*left_join()

*union()

*bind_cols()

*join()

16. Какие циклы доступны в базовом синтаксисе языка R?

*For

*Which

*Repeat

*While

*Next

*goto

17. Каким образом можно объявить переменную «а» на языке R:

* а =

*а<-

* а >-

*a !=

18. Локальность данных Big Data – это:

*Расширение механизма обработки данных при росте объема данных

*Обработка и хранение происходит на одной машине

*Время коммуникации не может быть выше времени обработки

*Данные не стоит обрабатывать на сервере их хранения

19. Медианой для выборки 1,__,3,7,10,15,16,18 является:

*7,714286

*7

*8,5

*рассчитать медиану невозможно из-за пропущенных значений

20. На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?

*Понимание бизнеса (Business understanding)

*Понимание данных (Data Understanding)

*Моделирование (Modeling)

*Оценка (Evaluation)

21. Назовите сложности иерархических методов кластеризации:

*Ограничение объема набора данных

*Выбор меры близости

*Негибкость полученных классификаций

*Наличие предположений относительно числа кластеров

22. Неверно, что дендрограмма – является результатом работы ...

*дивизимного кластерного анализа

*агломеративного кластерного анализа

*быстрого кластерного анализа

23. Неверно, что к достоинствам алгоритма кластеризации k-средних относится:

*простота использования

*быстрота использования

*понятность и прозрачность алгоритма

*нечувствительность к выбросам

24. Неверно, что Классификация относится к:

*контролируемому обучению

*управляемому обучению

*обучению без учителя

25. Объём накопленных человечеством цифровых данных на 2022 годизмеряется:

*Петабайтами

*Зеттабайтами

*Экзабайтами

*Йоттабайтами

26. Отказоустойчивость Big Data – это, когда:

*Активируются до 1000 компьютеров

*Сбой в одном звене системы не ведет к сбоям в других звеньях

*Недостоверные данные удаляются из системы

*Данные обрабатываются на других серверах

27. Первый этап жизненного цикла данных в соответствии с методологией CRISP-DM:

*Моделирование (Modeling)

*Внедрение (Deployment)

*Подготовка данных (Data Preparation)

*Понимание бизнеса (Business understanding)

28. Процессы маркетинга относят к группе:

*Процессы управления

*Поддерживающие процессы

*Операционные процессы

29. Процессы подбора персонала относят к группе:

*Процессы управления

*Поддерживающие процессы

*Операционные процессы

30. Решение задачи прогнозирования ...

*возможно без обучающей выборки данных

*требует некоторой обучающей выборки данных

*является решением задачи "обучения без учителя"

31. Сколько в 1 зеттабайте тарабайт?

*1,073742∙10^9

*2,147484∙10^9

*1,888947∙10^7

*1024

32. Технология Web mining применяет технологию Data Mining для анализа:

*неструктурированной информации

*структурированной информации

*неоднородной информации

*однородной информации

* распределенной и значительной по объему информации

*информации, содержащейся на Web-узлах

33. Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками:

A. Метод дальнего соседа

B. Метод средней связи

C. Метод медианной связи

D. Степень близости оценивается по степени близости между наиболее отдаленными объектами кластеров

E. Степень близости оценивается как средняя величина степеней близости между объектами кластеров

F. Расстояние между любым кластером S и новым кластером, который получился в результате объединения кластеров P и Q, определяется как расстояние от центра кластера S до середины отрезка, соединяющего центры кластеров P и Q

34. Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками:

A. SQL

B. MapReduce

C. SAP HANA

D. Язык структурированных запросов, позволяющий работать с базами данных. С его помощью можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных (СУБД)

E. Модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты и более). В программном интерфейсе не данные передаются на обработку программе, а программа – данным. Таким образом, запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами

F. Высокопроизводительная платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что эта платформа упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем

35. Установите соответствие между способами обучения нейронной сети и их характеристиками:

A. Обучение без учителя

B. Обучение с учителем

C. Обучение с подкреплением

D. Модель использует неразмеченные данные, из которых алгоритм самостоятельно пытается извлечь признаки и зависимости

E. Нейронная сеть обучается на размеченном наборе данных и предсказывает ответы, которые используются для оценки точности алгоритма на обучающих данных

F. Система обучается в процессе взаимодействия с окружающей средой, а не на исторических данных

36. Что такое Business Intelligence (Bl):

*Синоним понятия «бизнес-анализ»

*Tехнологии и программное обеспечение для преобразования больших объемов необработанной информации в данные, необходимые для выработки управленческих решений

*Cистема конкурентной разведки — сбор, обработка и анализ информации из различных источников с целью обоснования управленческих решений, позволяющих повысить конкурентоспособность бизнеса

37. Основные меры расстояния между объектами при использовании иерархического метода КА:

*евклидово расстояние

*квадрат евклидова расстояния

*манхэттенское расстояние

*расстояние Чебышева

38. При использовании какого метода необходимо задавать количество кластеров?

*метод k-средних

*метод ближнего соседа

*вся группа иерархических методов

*все ответы неверны

39. Неверно, что метод, рекомендуемый при небольших объемах выборки?

*из нескольких предложенных вариантов

*метод k–средних

*метод ближнего соседа

*вся группа иерархических методов

*все ответы неверны

40. Какие типы данных используются в R:

*numeric

*integer

*quantitative

*attributive

*logical

*complex

*character
Итоговый контроль
ИТОГОВЫЙ КОНТРОЛЬ При изучении дисциплины предусмотрено прохождение Итогового контроля. Подготовьте письменные ответы на ДВА вопроса из нижеприведенного списка в теоретическом блоке и ОДНО Эссе или ОДИН Реферат на темы, предложенные в соответствующих блоках. Объем ответа по каждому вопросу из теоретического блока составляет 250-300 слов. Ответы необходимо оформить в одном файле docx и отправить на проверку в Виртуальной образовательной среде. Имя файла формируется следующим образомФамилия И.О. с
User veroooon : 14 ноября 2022
500 руб.
Принципы управления торговым предприятием на примере сети магазинов Магнит
Централизация и децентрализация в управлении предприятием. Основные понятия централизации. Организационные структуры управления подразделением. Описание структуры развития и управления. Плюсы и минусы централизованных структур управления.
User evelin : 29 июля 2015
400 руб.
Выборы Президента США
СОДЕРЖАНИЕ Введение 3 1. Порядок выборов Президента и вице-президента в США 4 2. Особенности выборов конгрессменов и сенаторов США 9 Заключение 16 Список использованных источников 17 Соединенные Штаты Америки - государство в Северной Америке. Конституция США принята в 1787 г. Это одна из старейших ныне действующих буржуазных конституций и одна из наиболее "жестких": за 200 лет в нее было внесено всего 26 поправок, 10 из которых, так называемый Билль о
User kostak : 13 октября 2009
Деньги, кредит, банки (контрольная работа), вариант 1
Задача 1. Определить уровень инфляции за год при следующих исходных данных. № варианта 1 Месячный уровень инфляции, % 2,0 Задача 2. Банк выдал кредит в размере 1 млн .руб. Определить: а) индекс инфляции за срок кредита (In), б) ставку процентов по кредиту с учетом инфляции (1Г); в) погашаемую сумму (S), г) сумму процентов по кредиту (I). № варианта 1 Срок кредита, мес. 7 Ожидаемый уровень инфляции в месяц, % 2,5 Требуемая реальная доходность операции, % годовых 5,0 Задача 3. Вклад в сумме 5
User СибирскийГУТИ : 27 сентября 2013
60 руб.
up Наверх