Страницу Назад
Поискать другие аналоги этой работы

218

СИНЕРГИЯ Системы обработки больших данных (Big Data) Тест 90 баллов 2023 год

ID: 241308
Дата закачки: 15 Ноября 2023
Продавец: Synergy2098 (Напишите, если есть вопросы)
    Посмотреть другие работы этого продавца

Тип работы: Тесты
Сдано в учебном заведении: МТИ МосТех МосАП МФПУ Синергия

Описание:
СИНЕРГИЯ Системы обработки больших данных (Big Data)
МТИ МосТех МосАП МФПУ Синергия Тест оценка ОТЛИЧНО 2023 год

Задания

1. Data Mining — это процесс обнаружения в сырых данных…

*ранее сформулированных гипотез

* неочевидных закономерностей

*практических закономерностей

*объективных закономерностей

*большого количества закономерностей

2. R2 –это

*коэффициент множественной корреляции

* коэффициент множественной детерминации

*частным коэффициентом корреляции

3. Алгоритм k-средних предназначен для решения задачи:

*Классификации

* Кластеризации

*Прогнозирования

*Снижения размерности

4. Большие данные – это:

*Данные объемом более 10Тб

*Данные объемом более 100Тб

*Данные объемом более 150Тб

*Нет ограничений на минимальный объем

5. Большинство методов Data mining были разработаны в рамках …

*классического анализа данных

*теории баз данных

*теории искусственного интеллекта

6. В какой гистограмме прямоугольники, изображающие числовые данные, располагаются друг над другом:

*В гистограмме с группировкой

*В нормированной гистограмме

* В гистограмме с накоплением

7. В каком типе гистограмм прямоугольники, которые отображают данные, располагаются друг над другом:

*В гистограммах с группировкой

* В гистограммах с накоплением

*В объёмных гистограммах

8. В каком типе гистограмм прямоугольники, являющиеся графическими изображениями числовых данных из разных наборов, располагаются друг с другом:

*В объёмных гистограммах

* В гистограммах с группировкой

*В гистограммах с накоплением

9. В процессе работы Data Mining программы пользователь может получить:

*рый процент недостоверных результатов

*только верные результаты, ложные выводы исключены

* только статистически достоверные результаты

10. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (5;3), а второе (3;1). Можно сказать, что эти пары

* согласованы

*несогласованы

*коррелированны

*некоррелированны

11. Выбор в электронной таблице данных, соответствующих определенным условиям:

*Сортировка

*Анализ

* Фильтрация

12. Графическое представление числовых данных, позволяющее быстро оценить соотношение нескольких величин:

* Диаграмма

*Статистика

*Инфографика

13. Деревья решений относятся к группам …

*статистических методов

*кибернетических методов

*логических методов

*методов кросс-табуляции

14. Для какой шкалы применимы только такие операции как равно и не равно?

* номинальная шкала

*порядковая шкала

*интервальная шкала

15. Доверительный интервал это-

*интервал от минимального до максимального значения признака

*среднеквадратическое отклонение

* интервал, содержаний оцениваемый параметр генеральной совокупности

*стандартная ошибка среднего

16. Значение коэффициента корреляции расположены в диапазоне

* от -1 до +1

*от 0 до +1

*от 0 до -1

*от -2 до +2

17. Значимость множественной корреляции оценивается по

*критерий Пирсона

* критерий Фишера

*критерий Лапласа

*критерий Романовского

18. Известно, что коэффициент корреляции случайных величин и равен нулю. Это означает, что

* линейная связь между случайными величинами и отсутствует

*случайные величины и линейно зависимы

*случайные величины и зависимы

*случайные величины и независимы

* если случайный вектор является гауссовским, то случайные величины и независимы

19. Интервальная шкала – это шкала…

*содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла

*разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла

*содержащая только категории, которые не могут упорядочиваться

20. К какому типу диаграмм относятся плоские и объёмные круговые диаграммы:

* К круговым диаграммам

*К циклопическим диаграммам

*К спектральным диаграммам

21. К технологиям, используемым для сбора и обработки Больших Данных, можно отнести:

*программное обеспечение

*оборудование

*социальные сети

*сервисные услуги

* СУБДД

22. Как называется гистограмма, в которой вертикальная ось имеет шкалу в процентах:

*Гистограмма с накоплением

*Гистограмма с группировкой

* Нормированная гистограмма с накоплением

23. Как называется тип диаграмм, в котором геометрические фигуры располагаются горизонтально:

*Пропорциональная диаграмма

* Линейчатая диаграмма

*Гистограмма

24. Как называется тип представления данных, который позволяет оценивать соотношение нескольких величин:

* Диаграмма

*График

*Таблица

25. Какая функция в R возвращает количество знаков в строке x?

*format(x)

*paste(…)

*tolower(x)

* nchar(x)

26. Какая функция в R используется для конвертации векторов в текстовые переменные и объединяет их в одно текстовое выражение?

*format(x)

* paste(…)

*tolower(x)

*nchar(x)

27. Какая функция в R приводит строку к нижнему регистру?

*format(x)

*paste(…)

* tolower(x)

*nchar(x)

28. Какая функция в R форматирует объект так, чтобы он красиво выглядел на экране?

* format(x)

*paste(…)

*tolower(x)

*nchar(x)

29. Какие диаграммы аналогичны гистограммам:

* Линейчатые

*Лепестковые

*Круговые

30. Какие диаграммы можно использовать для построения графиков функций:

* Точечные

*Лепестковые

*Поверхностные

31. Какие диаграммы с гладкими кривыми можно использовать для построения графиков функций:

*Линейчатые диаграммы

*Нормированные гистограммы с накоплением

* Точечные диаграммы

32. Какие диаграммы теряют наглядность при большом количестве элементов данных и позволяют отобразить только один ряд данных:

* Круговые диаграммы

*Линейчатые диаграммы

*Гистограммы с накоплением

33. Какие коэффициенты находят путем возведения в квадрат частных коэффициентов корреляции:

*множественные коэффициенты детерминации;

*коэффициенты множественной корреляции;

* частные коэффициенты детерминации.

34. Какие типы данных используются в R:

*logical

*numeric

*integer

*attributive

*complex

* character

35. Какой вид диаграмм можно использовать при большом количестве данных, необходимости отображения динамики изменения данных во времени:

*Циклическая гистограмма

*Круговая диаграмма

* График

36. Какой вид связи изображен на рис 1..

*обратно пропорциональная связь

*вязь отсутствует

*прямо пропорциональная связь

*связь нелинейная

37. Какой пакет позволяет загружать данные из листа Excel файла?

*readxl

* excelreadr

*googlesheets

*vroom

*sheets_read

38. Какой пакет позволяет загружать данные из листа Excel файла?

*readxl

* excelreadr

*googlesheets

*vroom

*sheets_read

39. Классификация относится к стратегии:

* обучения с учителем

*обучения без учителя

*обучения с подкреплением

40. Кластер можно охарактеризовать как …

*группу объектов, имеющих общие свойства

*один объект, изолированный от других

*группу объектов, имеющую внутреннюю однородность

41. Корреляционное отношение изменяется в пределах

*от -1 до +1

* от 0 до +1

*от 0 до -1

*от -2 до +2

42. Коэффициент вариации определяется по формуле:

*1

*2

* 3

*4

43. Кто создал первую модель искусственных нейронных сетей?

*Фрэнк Розенблатт

* Уоррен Мак-Каллок и Уолтер Питтс

*Ян Лекун

*Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс

44. Метод наименьших квадратов может применяться в случае

*только парной регрессии

*только множественной регрессии

* нелинейной и линейной множественной регрессии

*коллинеарной регрессии

45. На какой вкладке размещены инструменты сортировки в Microsoft Excel:

*Вставка

*Вид

* Данные

46. Найдите соответствие между функцией в R и еe описанием:

A. str(оbject)

B. summаry(оbject)

C. hеad(x)

D. tаil(x)

E. Внутренняя структура объекта

F. Общая информация об объекте

G. Посмотреть начальные строки объекта

H. Посмотреть последние строки объекта

47. Найдите соответствие между функцией в R и еe описанием:

A. с(…)

B. sеq(to, to, by=)

C. list(…)

D. сbind(…)

E. Объединяет аргументы в вектор

F. Генерирует последовательность чисел с шагом

G. Создает список объектов

H. Объединяет объекты по столбцам

48. Не верно утверждение о том, что:

*Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных

*Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации

*Удешевление систем хранения на единицу информации привело к росту рынка больших данных

*Большое разнообразие источников данных

49. Не верно утверждение о том, что:

* Большие данные это данные объёма свыше 1 Тб.

*Проблема больших данных это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна.

*Большие данные - это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров.

*Большие данные как правило не структурированы.

50. Не верно, что Variety в контексте характеристик Big Data означает:

* Высокая скорость генерирования данных

* Разные типы данных в колонках таблиц реляционных СУБД

* Разнообразие отраслей, являющихся источниками данных

*Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные

51. Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами:

* быть очевидными

*быть неочевидными

* быть практически полезными

*быть объективными

52. Не верно, что технология Web Mining применяет Data Mining для анализа:

*Неоднородной информации

*Неструктурированной информации

*Структурированной информации

*Распределенной и значительной по объему информации

53. Некоррелированность случайных величин означает

*отсутствие любой связи между ними

* отсутствие линейной связи между ними

*их независимость

54. Объём накопленных человечеством цифровых данных на 2023 год измеряется:

*Петабайтами

*Зеттабайтами

*Экзабайтами

*Йоттабайтами

55. Один из объектов любой диаграммы:

*Границы диаграммы

* Область диаграммы

*Очертания диаграммы

56. Один из объектов любой диаграммы:

*Сущность диаграммы

*Вид диаграммы

* Название диаграммы

57. Один из объектов любой диаграммы:

*Ось периодичности

* Ось категорий

*Ось постоянства

58. Один из объектов любой диаграммы:

*Ось движений

* Ось значений

*Ось понятий

59. Определите правильную последовательность термина «Big Data»:

1цифровой информации

2быстро поступающей

3неоднородной

4огромные объемы

5которые

6традиционными

7невозможно

8обработать

9инструментами

60. Отметьте значимые события, повлиявшие на формирование тренда больших данных:

* разработка Hadoop;

* изобретение принципа MapReduce;

*разработка языка Pyhton;

*победа Deepblue в матче с Г.Каспаровым.

61. Переменная измерена в номинальной шкале, а переменная - в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно

* преобразовать переменную в номинальную переменную и применить критерий хи-квадрат

*преобразовать переменную в количественную переменную и применить критерий для проверки *независимости количественных переменных

*применить критерий Колмогорова-Смирнова

62. При проверки гипотезы о виде распределения используется

* критерий Пирсона

*критерий Фишера

*критерий Лапласа

*критерий Романовского

63. Признаки и измерены в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно

* преобразовать обе переменные в номинальные переменные и применить критерий хи-квадрат

* преобразовать обе переменные в порядковые переменные и применить ранговый критерий Спирмена

*применить критерий Колмогорова-Смирнова

64. Признаки и измерены в номинальной шкале. Какой критерий можно применить для проверки гипотезы о независимости этих признаков?

*ранговый критерий Спирмена

*ранговый критерий Кендэла

* критерий хи-квадрат Фишера-Пирсона

*критерий, основанный на выборочном коэффициенте корреляции

65. Регрессионный и дискриминантный анализ относятся…

*к статистическим методам Data mining

*к кибернетическим методам Data mining

*не являются методами Data mining

66. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?

* 168

*4

*42

*126

67. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?

* 168

*4

*42

*126

68. Сколько Петабайт в Зеттабайте

69. Сто (100) студентов прошли тестирование по математическому анализу и по физике. Пусть переменная Х- рейтинг студентов по математическому анализу, а переменная Y- рейтинг по физике. Коэффициент корреляции Спирмена для переменных и оказался равным 0.6. Эта информация

* позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная положительная связь

*позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная отрицательная связь

*позволяет сделать вывод о том, что на уровне значимости 0.05 нет оснований для отклонения гипотезы о независимости показателей и

*не позволяет сделать вывод о зависимости или независимости показателей и

70. Табличные процессоры позволяют строить:

*Теоретические гистограммы

* Гистограммы

*Практические гистограммы

71. Табличные процессоры позволяют строить:

* Графики

*Планы

*Перспективные диаграммы

72. Табличные процессоры позволяют строить:

*Линейные диаграммы

*Линейчатые диаграммы

*Частичные диаграммы

73. Такие данные как температура воздуха относятся к …

*атрибутивным данным

*непрерывным данным

*дискретным данным

*альтернативным данным

74. Укажите фактор(ы), способствовавший появлению тренда больших данных:

*маркетинговые кампании крупных корпораций;

*снижение издержек на хранение данных;

*появление новых технологий обработки потоковых данных;

*выпуск баз данных с обработкой данных в памяти.

75. Услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры, и обеспечению безопасности хранения данных относятся к …

76. Установите соответствие между функциями и их определениями:

A. mutate_at

B. transmute

C. mutate

D. изменяет определенные переменные по имени

E. добавляет новые переменные во фрейм данных и удаляет существующие переменные

F. добавляет новые переменные во фрейм данных, сохраняя существующие переменные

77. Целесообразно использовать диаграммы типа график:

* Когда количество данных в наборе достаточно большое

*Когда нужно показать изменения данных с течением времени

*Когда нужно отобразить части одного целого

78. Что целесообразно создавать при необходимости сравнения значений нескольких наборов данных:

*Поверхностную диаграмму

*Графики

* Гистограммы

79. Установите соответствие целей инфраструктуры Hadoop и их определений:

A. Надежность

B. Отказоустойчивость

C. Масштабируемость

D. Портируемость

E. достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя

F. обнаружение сбоев и их автоматическое и применение автоматического восстановления

G. данные и их обработка распределяются в кластерах

H. возможность установки на всех видах устройств и операционных систем

80. Найдите соответствие между понятием и его описанием

A. Data lake

B. Data science

C. Data mining

D. Machine learning

E. Хранилище больших данных в необработанном виде.

F. Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме.

G. Интеллектуальный анализ данных с целью выявления закономерностей.

H. Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта.

81. Определите правильную последовательность модели распределенных вычислений MapReduce:

1 Reduce

2 предварительные

3 данные

4 выбирает

5 их

6 агрегирует

7 Map

Размер файла: 259,7 Кбайт
Фаил: PDF фаил (.pdf)

   Скачать

   Добавить в корзину


    Скачано: 8         Сейчас качают: 2         Коментариев: 0


Есть вопросы? Посмотри часто задаваемые вопросы и ответы на них.
Опять не то? Мы можем помочь сделать!

Некоторые похожие работы:

К сожалению, точных предложений нет. Рекомендуем воспользоваться поиском по базе.

Не можешь найти то что нужно? Мы можем помочь сделать! 

От 350 руб. за реферат, низкие цены. Просто заполни форму и всё.

Спеши, предложение ограничено !



Что бы написать комментарий, вам надо войти в аккаунт, либо зарегистрироваться.

Страницу Назад

  Cодержание / Системы обработки больших данных / СИНЕРГИЯ Системы обработки больших данных (Big Data) Тест 90 баллов 2023 год
Вход в аккаунт:
Войти

Забыли ваш пароль?

Вы еще не зарегистрированы?

Создать новый Аккаунт


Способы оплаты:
UnionPay СБР Ю-Money qiwi Payeer Крипто-валюты Крипто-валюты


И еще более 50 способов оплаты...
Гарантии возврата денег

Как скачать и покупать?

Как скачивать и покупать в картинках


Сайт помощи студентам, без посредников!