30 câu hỏi
Dấu phẩy được sử dụng để sao chép một dạng thư mục từ node này sang node khác trong HDFS là:
rcp
dcp
drcp
distcp
Dữ liệu từ một cụm hadoop từ xa có thể:
không được đọc bởi một cụm hadoop khác
được đọc bằng http
được đọc bằng hhtp
được đọc suing hftp
Đáp án nào không phải là một "output operation" khi thao tác với DStream:
saveAsTextFile
foreachRDD
saveasHadoopFile
reduceByKetAndWindow
Đáp án nào không phải là một "Transformation" khi thao tác với DStream:
reduceByWindow
window
foreachWindow
countByWindow
Đâu không phải là tính năng mà NoSQL nào cũng đáp ứng:
tính sẵn sàng cao
khả năng mở rộng linh hoạt
phù hợp với dữ liệu lớn
Đâu là lệnh lưu trữ dữ liệu ra ngoài chương trình Spark:
input.saveAsTextFile('file:///usr/momoinu/mon_loz/hihi.txt')
input.saveAsTextFile('/usr/momoinu/mon_loz/hihi.txt')
input.saveAs ('file:///usr/momoinu/mon_loz/hihi.txt')
input.saveAsTextFile: 'file:///usr/momoinu/mon_loz/hihi.txt'
Đâu là một dạng của NoSQL:
MySQL
JSON
Key-value store
OLAP
Đầu ra của một map task là:
Cặp khóa-giá trị của tất cả các bản ghi của tập dữ liệu
Cặp khóa-giá trị của tất cả các bản ghi từ phần tách đầu vào được trình ánh xạ xử lý
Chỉ các phím được sắp xếp từ phần tách đầu vào
Số hàng được xử lý bởi tác vụ ánh xạ
Để hủy lưu trữ một tệp đã được lưu trữ trong hadoop, hãy sử dụng lệnh:
Unrar
Unhar
Cp
Cphar
Điều gì là đúng về HDFS?
Hệ thống tệp HDFS có thể được gắn trên Hệ thống tệp của máy khách cục bộ bằng NFS
Hệ thống tệp HDFS không bao giờ có thể được gắn vào Hệ thống tệp của máy khách cục bộ
Bạn có thể chỉnh sửa bản ghi hiện có trong tệp HDFS đã được gắn kết bằng NFS
Bạn không thể thêm vào tệp HDFS được gắn bằng NFS
Điều nào sau đây đúng với ổ đĩa trong một khoảng thời gian?
Thời gian tìm kiếm dữ liệu đang cải thiện nhanh hơn tốc độ truyền dữ liệu
Thời gian tìm kiếm dữ liệu đang cải thiện chậm hơn tốc độ truyền dữ liệu
Thời gian tìm kiếm dữ liệu và tốc độ truyền dữ liệu đều đang tăng tương ứng
Chỉ tăng dung lượng lưu trữ mà không tăng tốc độ truyền dữ liệu
Điều nào sau đây không đúng đối với Hadoop?
Đây là một khung phân tán
Thuật toán chính được sử dụng trong đó là Map Reduce
Nó chạy với đồ cứng hàng hóa
Tất cả đều đúng
Điều nào sau đây không phải là mục tiêu của HDFS?
Phát hiện lỗi và khôi phục
Xử lý tập dữ liệu khổng lồ
Ngăn chặn việc xóa dữ liệu
Cung cấp băng thông mạng cao để di chuyển dữ liệu
Điều sau không được phép trên các tệp HDFS:
Xóa
Đổi tên
Di chuyển
Đang thực hiện
Định dạng đầu vào mặc định là gì?
Định dạng đầu vào mặc định là xml. Nhà phát triển có thể chỉ định các định dạng đầu vào khác nếu thích hợp nếu xml không phải là đầu vào chính xác
Không có định dạng nhập mặc định. Định dạng đầu vào luôn phải được chỉ định
Định dạng đầu vào mặc định là định dạng tệp tuần tự. Dữ liệu cần được xử lý trước trước khi sử dụng định dạng đầu vào mặc định
Định dạng đầu vào mặc định là TextInputFormat với phần bù byte làm khóa và toàn bộ định dưới dạng giá trị
Đối với các tệp HDFS được truy cập thường xuyên, các khối được lưu vào bộ nhớ đệm:
bộ nhớ của DataNode
trong bộ nhớ của NameNode
Cả A&B
Trong bộ nhớ của ứng dụng khách đã yêu cầu quyền truy cập vào các tệp này
Đối với thư mục HDFS, hệ số sao chép (RF) là:
giống như RF của các tệp trong thư mục đó
0
3
Không áp dụng
Giao diện org.apache.hadoop.io.Wording khai báo hai phương thức nào? (Chọn 2 câu trả lời.)
public void readFields(DataInput)
public void read(DataInput)
public void writeFields(DataOutput)
public void write(DataOutput)
A - 1 & 4
B - 2 & 3
C - 3 & 4
D - 2 & 4
Giao tiếp giữa các quá trình giữa các nút khác nhau trong Hadoop sử dụng:
REST API
RPC
RMI
IP Exchange
Hadoop được viết bằng:
C++
Python
Java
Go
hadoop fs -expunge:
Cung cấp danh sách các DataNode
Được sử dụng để xóa một tệp
Được sử dụng để trao đổi một tệp giữa hai DataNode
Dọn sạch thùng rác
Hadoop giải quyết bài toán chịu lỗi thông qua kỹ thuật gì? Chọn đáp án SAI:
Kỹ thuật dư thừa
Các tệp tin được phân mảnh, các mảnh được nhân bản ra các node khác trên cụm
Các tệp tin được phân mảnh, các mảnh được lưu trữ tin cậy trên ổ cứng theo cơ chế RAID
các công việc cần tính toán được phân mảnh thành các tác vụ độc lập
Hadoop giải quyết bài toán khả mở bằng cách nào? Chọn đáp án sai:
Thiết kế phân tán ngay từ đầu, mặc định triển khai trên cụm máy chủ
Các node tham gia vào cụm Hadoop được gán vai trò hoặc là node tính toán hoặc là node lưu trữ dữ liệu
Các node tham gia vào cụm đóng cả 2 vai trò tính toán và lưu trữ
Các node thêm vào cụm có thể có cấu hình, độ tin cậy cao
Hadoop khác với máy tính tình nguyện ở chỗ:
Tình nguyện viên đóng góp thời gian CPU chứ không phải băng thông mạng
Tình nguyện viên đóng góp băng thông mạng chứ không phải thời gian CPU
Hadoop không thể tìm kiếm các số nguyên tố lớn
Chỉ Hadoop mới có thể sử dụng mapreduce
Hadoop sử dụng những cơ chế nào để làm cho namenode có khả năng chống lại sự cố:
Sao lưu siêu dữ liệu hệ thống tệp vào đĩa cục bộ và gắn kết NFS từ xa
Lưu trữ siêu dữ liệu hệ thống tệp trên đám mây
Sử dụng máy có ít nhất 12 CPU
Sử dụng phần cứng đắt tiền và đáng tin cậy
Hadoop xử lý khối lượng lớn dữ liệu như thế nào?
Hadoop sử dụng song song rất nhiều máy. Điều này tối ưu hóa việc xử lý dữ liệu
Hadoop được thiết kế đặc biệt để xử lý lượng lớn dữ liệu bằng cách tận dụng phần cứng MPP
Hadoop gửi mã đến dữ liệu thay vì gửi dữ liệu đến mã
Hadoop sử dụng các kỹ thuật bộ nhớ đệm phức tạp trên NameNode để tăng tốc độ xử lý dữ liệu
HBASE là gì?
Hbase là bộ Java API riêng biệt cho cụm Hadoop
Hbase là một phần của dự án Apache Hadoop cung cấp giao diện để quét một lượng lớn dữ liệu bằng cơ sở hạ tầng Hadoop
Hbase là một "cơ sở dữ liệu" giống như giao diện với dữ liệu cụm Hadoop
HBase là một phần của dự án Apache Hadoop cung cấp giao diện giống SQL để xử lý dữ liệu
HDFS có thể được truy cập qua HTTP bằng cách sử dụng:
lược đồ URI viewfs
lược đồ URI webhdfs
Lược đồ URI C - wasb
HDFS ftp
HDFS giải quyết bài toán single-point-of-failure cho Namenode bằng cách nào:
sử dụng thêm secondary namenode theo cơ chế active-active. Cả Namenode và Secondary Namenode cùng online trong hệ thống
Sử dụng Secondary namenode theo cơ chế active-passive. Secondary namenode chỉ hoạt động khi có vấn đề với namenode
Sử dụng Secondary namenode theo cơ chế active-passive. Secondary namenode chỉ hoạt động khi có vấn đề với namenode
HDFS là viết tắt của:
Hệ thống tệp phân tán cao (Highly distributed file system)
Hệ thống tệp được hướng dẫn Hadoop (Hadoop directed file system)
Vỏ tệp phân tán cao (Highly distributed file shell)
Hệ thống tệp phân tán Hadoop (Hadoop distributed file system)
