30 câu hỏi
Theo Tính khả dụng cao của Hadoop, nghĩa là Hàng rào
Ngăn NameNode hoạt động trước đó bắt đầu chạy lại
Ngăn chặn việc bắt đầu chuyển đổi dự phòng trong trường hợp mạng bị lỗi với NameNode hoạt động
Ngăn chặn sự cố sập nguồn đối với NameNode đã hoạt động trước đó
Ngăn không cho NameNode đã hoạt động trước đó ghi vào nhật ký chỉnh sửa
AVRO là gì?
Avro là một thư viện tuần tự hóa java
Avro là một thư viện nén java
Avro là một thư viện java tạo các tệp bảng chia nhỏ
Không câu trả lời nào đúng
Bản chất của phần cứng cho NameNode phải là
Cao cấp hơn loại hàng hóa
Loại hàng hóa
Không thành vấn đề
Chỉ cần có nhiều Ram hơn mỗi DataNode
Bản chất DStream:
là một chuỗi liên tục RDD
Là một chuỗi liên tục DataFrame
Là một chuỗi liên tục DataSet
ko có đáp án đúng
Bạn có thể dự trữ lượng sử dụng đĩa trong một DataNode bằng cách định cấu hình dfs.datanode.du.reserved trong tệp nào sau đây
Hdfs-site.xml
Hdfs-defaukt.xml
Core-site.xml
Mapred-site.xml
Bộ nhớ đệm phân tán là gì?
Bộ đệm phân tán là thành phần đặc biệt trên NameNode sẽ lưu vào bộ đệm dữ liệu được sử dụng thường xuyên để phản hồi máy khách nhanh hơn. Nó được sử dụng trong bước giảm
Bộ nhớ đệm phân tán là thành phần đặc biệt trên DataNode sẽ lưu vào bộ đệm dữ liệu được sử dụng thường xuyên để phản hồi máy khách nhanh hơn. Nó được sử dụng trong bước bản đồ
Bộ đệm phân tán là một thành phần lưu trữ các đối tượng java
Bộ nhớ đệm phân tán là một thành phần cho phép các nhà phát triển triển khai các chum để xử lý Map-Reduce
Các đặc trưng của HDFS. Chọn đáp án SAI
Tối ưu cho các tệp tin có kích thước lớn
Hỗ trợ thao tác đọc ghi tương tranh tại chunk (phân mảnh) trên tệp tin
Hỗ trợ nén dữ liệu để tiết kiệm chi phí
hỗ trợ cơ chế phân quyền và kiểm soát người dùng của UNIX
Các khối dữ liệu ánh xạ thông tin với các tệp tương ứng của chúng được lưu trữ trong
DataNode
Job Tracker
Task Tracker
NameNode
Các mục tiêu chính của Apache Hadoop
lưu trữ dữ liệu khả mở
xử lý dữ liệu lớn mạnh mẽ
trực quan hóa dữ liệu hiệu quả
lưu trữ dữ liệu khả mở và xử lý dữ liệu lớn mạnh mẽ
lưu trữ dữ liệu khả mở, xử lý dữ liệu lớn mạnh mẽ và trực quan hóa dữ liệu hiệu quả
Các tệp HDFS được thiết kế cho
Nhiều người viết và sửa đổi ở các hiệu số tùy ý
Chỉ nối vào cuối tệp
Chỉ ghi thành tệp một lần
Truy cập dữ liệu có độ trễ thấp
Các ứng dụng người dùng có thể hướng dẫn NameNode để lưu vào bộ đệm các tệp bằng cách
thêm tên tệp bộ đệm vào nhóm bộ đệm
thêm cấu hình bộ đệm vào nhóm bộ đệm
thêm chỉ thị bộ nhớ cache vào nhóm bộ nhớ cache
chuyển tên tệp làm tham số cho nhóm bộ nhớ cache
Cái nào không phải là một trong những tính năng dữ liệu lớn?
Vận tốc Velocity
Tính xác thực Veracity
khối lượng Volume
đa dạng Variety
Cái nào sau đây lưu trữ dữ liệu?
Name node
Data node
Master node
None of these
Cái nào trong số này cung cấp hệ thống xử lý Luồng được sử dụng trong hệ sinh thái Hadoop?
Solr
Tez
Spark
Hive
Câu lệnh MapReduce trong Spark dưới đây, chia mỗi dòng thành từ dựa vào delimiter nào
input.flatMap( lambda x: x.split("\t") ).map(lambda x: (x, 1)).reduceByKey(add)
Tab
Dấu cách
Dấu hai chấm
Dấu phẩy
Chạy Start-dfs.sh kết quả là
Bắt đầu NameNode và DataNode
Chỉ NameNode bắt đầu
Chỉ bắt đầu datanode
Khởi động NameNode và trình quản lý tài nguyên
Chế độ cài đặt phân phối hoàn toàn (không ảo hóa) cần tối thiểu (The fully distributed mode of installation(without virtualization) needs a minimum of)
2 Máy vật lý
3 Máy vật lý
4 Máy vật lý
1 Máy vật lý
Chế độ nào sau đây không phải là chế độ hoạt động của Hadoop?
Pseudo distributed mode
Globally distributed mode
Stand alone mode
Fully-Distributed mode
Chọn phát biểu đúng khi nói về MongoDB
MongoDB có các trình điều khiển driver cho nhiều ngôn ngữ lập trình khác nhau
các văn bản có thể chứa nhiều cặp key-value hoặc key-array, hoặc các văn bản lồng (nested documents)
tất cả các phương án trên
MongoDB hay các NoSQL có khả năng khả mở tốt hơn các CSDL quan hệ truyền thống
Công cụ Hadoop được sử dụng để phân tán dữ liệu một cách đồng nhất trên các DataNode được đặt tên là:
Scheduler
Balancer
Spreader
Reporter
Công nghệ nào được sử dụng để lưu trữ dữ liệu trong Hadoop?
HBase
Avro
Sqoop
Zookeeper
Công nghệ nào được sử dụng để nhập và xuất dữ liệu trong Hadoop?
HBase
Avro
Sqoop
Zookeeper
Công nghệ nào được sử dụng để tuần tự hóa dữ liệu trong Hadoop?
HBase
Avro
Sqoop
Zookeeper
Công nghệ nào sau đây là cơ sở dữ liệu lưu trữ tài liệu?
HBase
Hive
Cassandra
CouchDB
Công ty nào đã phát triển Apache Cassandra giai đoạn đầu tiên
Cơ chế chịu lỗi của datanode trong HDFS
dử dụng ZooKeeper để quản lý các thành viên datanode trong cụm
sử dụng cơ chế heartbeat, định kỳ các datanode thông báo về trạng thái cho Namenode
sử dụng cơ chế heartbeat, Namenode định kỳ hỏi các datanode về trạng thái tồn tại của datanode
Cơ chế nào sau đây không phải là cơ chế hàng rào cho NameNode đã hoạt động trước đó?
Tắt cổng mạng của nó thông qua lệnh quản lý từ xa
Thu hồi quyền truy cập của nó vào thư mục lưu trữ được chia sẻ
Định dạng ổ đĩa của nó
STONITH
Cơ chế nhân bản dữ liệu trong HDFS
Namenode quyết định vị trí các nhân bản của các chunk trên các datanode
Datanode là primary quyết định vị trí các nhân bản của các chunk tại các secondary datanode
Client quyết định vị trí lưu trữ các nhân bản với từng chunk
Cơ chế tổ chức dữ liệu của Datanode trong HDFS
các chunk là các tệp tin trong hệ thống tệp tin cục bộ của máy chủ datanode
các chunk là các vùng dữ liệu liên tục trên ổ cứng của máy chủ data node
các chunk được lưu trữ tin cậy trên datanode theo cơ chế RAID
DataNode và NameNode là tương ứng
Nút chính và nút công nhân
Nút công nhân và nút chính
Cả hai đều là các nút công nhân
Không có
