25 câu hỏi
Đối với các tệp HDFS được truy cập thường xuyên, các khối được lưu vào bộ nhớ đệm:
Bộ nhớ của DataNode
Trong bộ nhớ của NameNode
Cả A & B
Trong bộ nhớ của ứng dụng khách đã yêu cầu quyền truy cập vào các tệp này
Các ứng dụng người dùng có thể hướng dẫn NameNode để lưu vào bộ đệm các tệp bằng cách:
Thêm tên tệp bộ đệm vào nhóm bộ đệm
Thêm cấu hình bộ đệm vào nhóm bộ đệm
Thêm chỉ thị bộ nhớ cache vào nhóm bộ nhớ cache
Chuyển tên tệp làm tham số cho nhóm bộ nhớ cache
Trong Hadoop 2.x, liên kết HDFS phát hành có nghĩa là:
Cho phép các NameNode giao tiếp với nhau.
Cho phép một cụm mở rộng quy mô bằng cách thêm nhiều DataNode dưới một NameNode.
Cho phép một cụm mở rộng quy mô bằng cách thêm nhiều NameNode hơn.
Thêm nhiều bộ nhớ vật lý hơn cho cả NameNode và DataNode.
Theo liên kết HDFS:
Mỗi NameNode quản lý siêu dữ liệu của toàn bộ hệ thống tệp.
Mỗi NameNode quản lý siêu dữ liệu của một phần hệ thống tệp.
Lỗi một NameNode làm mất một số tính khả dụng của siêu dữ liệu từ toàn bộ hệ thống tệp.
Mỗi DataNode đăng ký với mỗi NameNode.
Mục tiêu chính của HDFS Tính sẵn sàng cao là:
Tạo bản sao của NameNode chính nhanh hơn.
Để giảm thời gian chu kỳ cần thiết để khôi phục lại NameNode chính mới sau khi nút chính hiện có bị lỗi.
Ngăn chặn việc mất dữ liệu do lỗi của NameNode chính.
Ngăn chặn NameNode chính trở thành điểm lỗi duy nhất.
Là một phần của tính khả dụng cao HDFS, một cặp NameNode chính được cấu hình. Điều gì là đúng với họ?
Khi một yêu cầu của khách hàng đến, một trong số họ được chọn ngẫu nhiên sẽ phục vụ yêu cầu đó.
Một trong số chúng đang hoạt động trong khi cái còn lại vẫn tắt.
Các DataNode chỉ gửi báo cáo khối đến một trong các NameNode.
Nút chờ nhận các điểm kiểm tra định kỳ của không gian tên của NameNode đang hoạt động.
Zookeeper đảm bảo rằng:
Tất cả các NameNode đang tích cực phục vụ các yêu cầu của khách hàng.
Chỉ có một NameNode đang tích cực phục vụ các yêu cầu của khách hàng.
Chuyển đổi dự phòng được kích hoạt khi bất kỳ DataNode nào bị lỗi.
Quản trị viên Hadoop không thể bắt đầu chuyển đổi dự phòng.
Theo Tính khả dụng cao của Hadoop, nghĩa là Hàng rào:
Ngăn NameNode hoạt động trước đó bắt đầu chạy lại.
Ngăn chặn việc bắt đầu chuyển đổi dự phòng trong trường hợp mạng bị lỗi với NameNode hoạt động.
Ngăn chặn sự cố sập nguồn đối với NameNode đã hoạt động trước đó.
Ngăn không cho NameNode đã hoạt động trước đó ghi vào nhật ký chỉnh sửa.
Cơ chế nào sau đây không phải là cơ chế hàng rào cho NameNode đã hoạt động trước đó?
Tắt cổng mạng của nó thông qua lệnh quản lý từ xa.
Thu hồi quyền truy cập của nó vào thư mục lưu trữ được chia sẻ.
Định dạng ổ đĩa của nó.
STONITH.
Thuộc tính được sử dụng để đặt hệ thống tệp mặc định cho Hadoop trong core-site.xml là:
filesystem.default
fs.default
fs.defaultFS
hdfs.default
Yếu tố sao chép mặc định cho hệ thống tệp HDFS trong Hadoop là:
1
2
3
4
Khi chạy trên chế độ phân phối giả lập, hệ số sao chép được đặt thành:
2
1
0
3
Đối với thư mục HDFS, hệ số sao chép (RF) là:
Giống như RF của các tệp trong thư mục đó.
Không.
3.
Không áp dụng.
Điều sau không được phép trên các tệp HDFS:
Xóa
Đổi tên
Di chuyển
Đang thực hiện
HDFS có thể được truy cập qua HTTP bằng cách sử dụng:
Lược đồ URI viewfs
Lược đồ URI webhdfs
Lược đồ URI wasb
HDFS ftp
Điều gì là đúng về HDFS?
Hệ thống tệp HDFS có thể được gắn trên Hệ thống tệp của máy khách cục bộ bằng NFS.
Hệ thống tệp HDFS không bao giờ có thể được gắn vào Hệ thống tệp của máy khách cục bộ.
Bạn có thể chỉnh sửa bản ghi hiện có trong tệp HDFS đã được gắn kết bằng NFS.
Bạn không thể thêm vào tệp HDFS được gắn bằng NFS.
Máy khách đọc dữ liệu từ hệ thống tệp HDFS trong Hadoop
Lấy dữ liệu từ NameNode
Lấy vị trí khối từ DataNode
Chỉ lấy các vị trí khối tạo thành NameNode
Lấy cả dữ liệu và vị trí khối từ NameNode
Kịch bản nào yêu cầu băng thông cao nhất để truyền dữ liệu giữa các nút trong Hadoop?
Các nút khác nhau trên cùng một giá đỡ
Các nút trên các giá đỡ khác nhau trong cùng một trung tâm dữ liệu
Các nút trong các trung tâm dữ liệu khác nhau
Dữ liệu trên cùng một nút
Vị trí khối hiện tại của HDFS nơi dữ liệu đang được ghi vào,
Hiển thị cho khách hàng yêu cầu nó
Vị trí khối không bao giờ hiển thị đối với các yêu cầu của khách hàng
Người đọc có thể nhìn thấy hoặc không
Chỉ hiển thị sau khi dữ liệu được lưu trong bộ đệm được cam kết
Tùy chọn nào trong số này không phải là tùy chọn lập lịch có sẵn với YARN?
Bộ lập lịch tối ưu
Bộ lập lịch FIFO
Bộ lập lịch dung lượng
Bộ lập lịch công bằng
Chế độ nào sau đây không phải là chế độ hoạt động của Hadoop?
Chế độ phân phối giả
Chế độ phân phối toàn cầu
Chế độ độc lập
Chế độ phân phối hoàn toàn
Sự khác biệt giữa chế độ độc lập và giả phân phối là
Chế độ độc lập không thể sử dụng MapReduce
Chế độ độc lập có một quy trình Java duy nhất chạy trong đó
Chế độ phân tán giả không sử dụng HDFS
Chế độ phân tán giả cần hai hoặc nhiều máy vật lý
Công việc khung Hadoop được viết bằng
C++
Python
Java
Go
Lệnh HDFS để tạo bản sao của tệp từ hệ thống cục bộ là
CopyFromLocal
copyfromlocal
CopyLocal
copyFromLocal
Lệnh HDFS được sử dụng để
Sao chép tệp từ hệ thống tệp cục bộ sang HDFS
Sao chép tệp hoặc thư mục từ hệ thống tệp cục bộ sang HDFS
Sao chép các tệp từ HDFS sang hệ thống tệp cục bộ
Sao chép tệp hoặc thư mục từ HDFS sang hệ thống tệp cục bộ
