30 câu hỏi
Lệnh để kiểm tra xem Hadoop có hoạt động hay không là:
Jsp
Jps
Hadoop fs –test
Không có
Các khối dữ liệu ánh xạ thông tin với các tệp tương ứng của chúng được lưu trữ trong:
DataNode
Trình theo dõi công việc
Trình theo dõi tác vụ
NameNode
Tệp trong Namenode lưu trữ thông tin ánh xạ vị trí khối dữ liệu với tên tệp là:
dfsimage
nameimage
fsimage
image
NameNode biết rằng DataNode đang hoạt động bằng cách sử dụng một cơ chế được gọi là:
heartbeats
datapulse
h-signal
Active-pulse
Bản chất của phần cứng cho NameNode phải là:
Cao cấp hơn loại hàng hóa
Loại hàng hóa
Không thành vấn đề
Chỉ cần có nhiều Ram hơn mỗi DataNode
Trong Hadoop, Snappy và LZO là những ví dụ về:
Cơ chế vận chuyển tệp giữa các DataNode
Cơ chế nén dữ liệu
Cơ chế sao chép dữ liệu
Cơ chế đồng bộ hóa dữ liệu
Hệ thống apache nào dưới đây giải quyết việc nhập dữ liệu phát trực tuyến vào hadoop:
Ozie
Kafka
Flume
Hive
Sự phân chia đầu vào được sử dụng trong MapReduce cho biết:
Kích thước trung bình của các khối dữ liệu được sử dụng làm đầu vào cho chương trình
Chi tiết vị trí nơi bắt đầu của toàn bộ bản ghi đầu tiên trong một khối và toàn bộ bản ghi cuối cùng trong khối kết thúc
Tách dữ liệu đầu vào cho chương trình MapReduce thành kích thước đã được định cấu hình trong mapred-site.xml
Không có
Đầu ra của một nhiệm vụ ánh xạ là:
Cặp khóa-giá trị của tất cả các bản ghi của tập dữ liệu
Cặp khóa-giá trị của tất cả các bản ghi từ phần tách đầu vào được trình ánh xạ xử lý
Chỉ các phím được sắp xếp từ phần tách đầu vào
Số hàng được xử lý bởi tác vụ ánh xạ
Vai trò của nút Nhật ký là:
Báo cáo vị trí của các khối trong một DataNode
Báo cáo thông tin nhật ký chỉnh sửa của các khối trong DataNode
Báo cáo lịch trình khi công việc sẽ chạy
Báo cáo hoạt động của các thành phần khác nhau do người quản lý tài nguyên xử lý
Người giữ vườn thú (zookeeper):
Phát hiện lỗi của NameNode và chọn NameNode mới
Phát hiện lỗi của các DataNode và chọn một DataNode mới
Ngăn phần cứng quá nóng bằng cách tắt chúng
Duy trì danh sách tất cả các thành phần địa chỉ IP của cụm Hadoop
Nếu địa chỉ IP hoặc tên máy chủ của DataNode thay đổi:
NameNode cập nhật ánh xạ giữa tên tệp và tên khối
NameNode không cần cập nhật ánh xạ giữa tên tệp và tên khối
Dữ liệu trong DataNode đó sẽ bị mất vĩnh viễn
Có NameNode phải được khởi động lại
Khi một ứng dụng khách liên hệ với NameNode để truy cập tệp, NameNode phản hồi với:
Kích thước của tệp được yêu cầu
ID khối của tệp được yêu cầu
ID khối và tên máy chủ của bất kỳ DataNode nào chứa khối đó
Block ID và tên máy chủ của tất cả các DataNode chứa khối đó
HDFS là viết tắt của:
Hệ thống tệp phân tán cao (Highly distributed file system)
Hệ thống tệp được hướng dẫn Hadoop (Hadoop directed file system)
Vỏ tệp phân tán cao (Highly distributed file shell)
Hệ thống tệp phân tán Hadoop (Hadoop distributed file system)
Công cụ Hadoop được sử dụng để phân tán dữ liệu một cách đồng nhất trên các DataNode được đặt tên là:
Bộ lập lịch
Cân bằng
Máy rải
PV
Khi một jobTracker lên lịch, một công việc sẽ được tìm kiếm đầu tiên:
Một nút có vị trí trống trong cùng giá đỡ với DataNode
Bất kỳ nút nào trên cùng giá đỡ với DataNode
Bất kỳ nút nào trên rack liền kề với rack của datanode
Chỉ bất kỳ nút nào trong cụm
Tín hiệu nhịp tim được gửi từ:
JobTracker thành TaskTracker
TaskTracker to Job tracker
Trình theo dõi công việc đến NameNode
Trình theo dõi tác vụ đến NameNode
Job tracker runs on:
Namenode
Datanode
Secondary namenode
Secondary datanode
Tùy chọn nào sau đây không phải là tùy chọn lập lịch có sẵn trong YARN:
Bộ lập lịch cân bằng
Lập lịch trình công bằng
Bộ lập lịch dung lượng
Máy quét FIFO
Định dạng đầu vào mặc định là gì?
Định dạng đầu vào mặc định là xml. Nhà phát triển có thể chỉ định các định dạng đầu vào khác nếu thích hợp nếu xml không phải là đầu vào chính xác
Không có định dạng nhập mặc định. Định dạng đầu vào luôn phải được chỉ định
Định dạng đầu vào mặc định là định dạng tệp tuần tự. Dữ liệu cần được xử lý trước trước khi sử dụng định dạng đầu vào mặc định
Định dạng đầu vào mặc định là TextInputFormat với phần bù byte làm khóa và toàn bộ dòng dưới dạng giá trị
Cái nào không phải là một trong những tính năng dữ liệu lớn?
Vận tốc Velocity
Tính xác thực Veracity
Âm lượng Volume
Đa dạng Variety
Công nghệ nào được sử dụng để lưu trữ dữ liệu trong Hadoop?
HBase
Avro
Sqoop
Zookeeper
Công nghệ nào được sử dụng để tuần tự hóa dữ liệu trong Hadoop?
HBase
Avro
Sqoop
Zookeeper
Công nghệ nào được sử dụng để nhập và xuất dữ liệu trong Hadoop?
HBase
Avro
Sqoop
Người giữ vườn thú
Công nghệ nào sau đây là cơ sở dữ liệu lưu trữ tài liệu?
HBase
Hive
Cassandra
CouchDB
Điều nào sau đây không đúng đối với Hadoop?
Đây là một khung phân tán
Thuật toán chính được sử dụng trong đó là Map Reduce
Nó chạy với đồ cứng hàng hóa
Tất cả đều đúng
Cái nào sau đây lưu trữ dữ liệu?
Name node
Data node
Master node
None of these
Nút nào sau đây quản lý các nút khác?
Name node
Data node
Slave node
None of these
AVRO là gì?
Avro là một thư viện tuần tự hóa java
Avro là một thư viện nén java
Avro là một thư viện java tạo các tệp bảng chia nhỏ
Không câu trả lời nào đúng
Bạn có thể chạy Bản đồ - Giảm công việc trực tiếp trên dữ liệu Avro không?
Có, Avro được thiết kế đặc biệt để xử lý dữ liệu qua Map-Reduce
Có, nhưng cần có mã hóa mở rộng bổ sung
Không, Avro được thiết kế đặc biệt chỉ để lưu trữ dữ liệu
Avro chỉ định siêu dữ liệu cho phép truy cập dữ liệu dễ dàng hơn. Dữ liệu này không thể được sử dụng như một phần của quá trình thực thi thu nhỏ bản đồ, thay vì chỉ đặc tả đầu vào
