31 câu hỏi
YARN là viết tắt của:
Yahoo's another resource name
Yet another resource negotiator
Yahoo's archived Resource names
Yet another resource need
Điều nào sau đây không phải là mục tiêu của HDFS?
Phát hiện lỗi và khôi phục
Xử lý tập dữ liệu khổng lồ
Ngăn chặn việc xóa dữ liệu
Cung cấp băng thông mạng cao để di chuyển dữ liệu
Trong HDFS, các tệp không thể:
Đọc
Xóa
Thực thi
Lưu trữ
So với RDBMS, Hadoop:
Có tính toàn vẹn dữ liệu cao hơn
Có giao dịch ACID không
Thích hợp để đọc và truy vấn nhanh
Hoạt động tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc
Vấn đề chính gặp phải khi đọc và ghi dữ liệu song song từ nhiều đĩa là gì?
Xử lý khối lượng lớn dữ liệu nhanh hơn
Kết hợp dữ liệu từ nhiều đĩa
Phần mềm cần thiết để thực hiện nhiệm vụ này là cực kỳ tốn kém
Phần cứng cần thiết để thực hiện tác vụ này là cực kỳ tốn kém
Tính năng định vị dữ liệu trong Hadoop có nghĩa là:
Lưu trữ cùng một dữ liệu trên nhiều nút
Chuyển vị trí dữ liệu từ nút này sang nút khác
Đồng định vị dữ liệu với các nút tính toán
Phân phối dữ liệu trên nhiều nút
Các tệp HDFS được thiết kế cho:
Nhiều người viết và sửa đổi ở các hiệu số tùy ý
Chỉ nối vào cuối tệp
Chỉ ghi thành tệp một lần
Truy cập dữ liệu có độ trễ thấp
Hệ thống Apache Hadoop được viết bằng ngôn ngữ nào?
C++
Python
Java
Go
Cái nào không phải là một trong đặc trưng 3Vs của dữ liệu lớn?
Vận tốc - Velocity
Tính xác thực - Veracity
Khối lượng - Volume
Đa dạng - Variety
Điều nào sau đây đúng đối với Hadoop?
Đây là một khung phân tán
Thuật toán chính được sử dụng trong đó là Map Reduce
Nó chạy có thể thực thi trên hạ tầng Cloud Computing
Tất cả đều đúng
Loại nào sau đây lưu trữ dữ liệu?
Name node
Data node
Master node
Không có
Node nào sau đây quản lý các nút khác?
Name node
Data node
Slave node
Tất cả
Hadoop xử lý khối lượng lớn dữ liệu như thế nào?
Hadoop sử dụng song song rất nhiều máy. Điều này tối ưu hóa việc xử lý dữ liệu
Hadoop được thiết kế đặc biệt để xử lý lượng lớn dữ liệu bằng cách tận dụng phần cứng MPP
Hadoop gửi mã đến dữ liệu thay vì gửi dữ liệu đến mã
Hadoop sử dụng các kỹ thuật bộ nhớ đệm phức tạp trên NameNode để tăng tốc độ xử lý dữ liệu
MapReduce do công ty nào phát triển?
Apache
IBM
Amazon
Dịch vụ đám mây nào hỗ trợ tốt cho Big Data?
Amazon AWS
Google Cloud
Tất cả
Microsoft Azure
Nhược điểm khi triển khai Big Data trên nền tảng Cloud Computing là?
Nhiều rủi ro cho hệ thống
Không có ý đúng
Tốc độ xử lý không đảm bảo
Phân tích theo thời gian thực kém
Mô hình Điện toán đám mây IaaS?
Cơ sở hạ tầng dưới dạng dịch vụ
Nền tảng dưới dạng dịch vụ
Phần mềm dưới dạng dịch vụ
Internet dưới dạng dịch vụ
Mô hình Điện toán đám mây PaaS?
Cơ sở hạ tầng dưới dạng dịch vụ
Nền tảng dưới dạng dịch vụ
Phần mềm dưới dạng dịch vụ
Internet dưới dạng dịch vụ
Mô hình Điện toán đám mây SaaS?
Cơ sở hạ tầng dưới dạng dịch vụ
Nền tảng dưới dạng dịch vụ
Phần mềm dưới dạng dịch vụ
Internet dưới dạng dịch vụ
Lợi ích của Cloud Computing với Big Data là?
Triển khai hạ tầng nhanh chóng
Phân tích theo thời gian thực
Tối ưu chi phí duy trì hoạt động
Tất cả
Lợi ích vượt trội của Cloud Computing với Big Data là?
Hạn chế đầu tư máy móc
Phân tích theo thời gian thực
Tối ưu chi phí duy trì hoạt động
Tất cả
Dịch vụ lưu trữ dữ liệu của Amazon – AWS là?
Amazon S3
Amazon RDS
Amazon Lambda
EC2
Dịch vụ lưu trữ của Microsoft Azure là?
Virtual Machines
Azure Function
Azure Disk Storage
Azure Cosmos DB
Dịch vụ lưu trữ của Google Cloud Platform là?
Google Driver
Google Functions
Google Cloud Storage
Google Cloud Datastore
Đám mây AWS cung cấp dịch vụ NoSQL Database:
Amazon RDS
Amazon EC2
Amazon DynamoDB
Amazon Container Service
Đám mây Microsoft Azure cung cấp dịch vụ NoSQL Database:
Table Storage
SQL DB
Azure Functions
Cloud Service
Dịch vụ tích hợp dữ liệu trên đám mây trên Google Cloud Platform:
Google Cloud Dataprep
Google Cloud Data Fusion
Google Data Catalog
Google BigQuery
Dịch vụ thông minh giúp khái phá, làm sạch dữ liệu trên Google Cloud Platform:
Google Functions
Google BigQuery
Google Cloud Dataprep
Google Data Catalog
Trên Google Cloud Platform dịch vụ nào quản lý CSDL NoSQL:
Google Cloud Dataprep
Google Data Catalog
Google BigQuery
Cloud Bigtable
Trên Google Cloud Platform dịch vụ nào quản lý danh mục dữ liệu:
Google Data Catalog
Google Cloud Dataprep
Google Data Catalog
Google BigQuery
Trên Google Cloud Platform dịch vụ phân tích dữ liệu được cung cấp:
Google Data Catalog
Google BigQuery
Google Cloud Dataprep
Google Functions
