vietjack.com

100+ câu trắc nghiệm Tổng quan về Khoa học dữ liệu có đáp án
Quiz

100+ câu trắc nghiệm Tổng quan về Khoa học dữ liệu có đáp án

V
VietJack
Đại họcTrắc nghiệm tổng hợp6 lượt thi
27 câu hỏi
1. Trắc nghiệm
1 điểmKhông giới hạn

Chọn phát biểu sai:

Internet vạn vật khiến cho lượng dữ liệu được thu thập tăng cao.

AI sử dụng kết quả từ khoa học dữ liệu để có thể thông minh hơn, chính xác hơn.

Bigdata là công nghệ lưu trữ và khai thác dữ liệu có dung lượng lớn (volume), đa dạng (variety), yêu cầu tốc độ cao (velocity) và có tính xác thực (Veracity).

Data mining là một phương pháp phân tích dữ liệu của khoa học dữ liệu.

Xem đáp án
2. Trắc nghiệm
1 điểmKhông giới hạn

Kết quả mà khoa học dữ liệu hướng đến là: thông tin và tri thức

Dữ liệu

Thông tin

Tri thức

Tất cả đều đúng

Xem đáp án
3. Trắc nghiệm
1 điểmKhông giới hạn

Công cụ thống kê mô tả nào được sử dụng khi cần tổng hợp dữ liệu đa chiều

Subtotal

Consolidate

PivotTable

Tất cả đều sai

Xem đáp án
4. Trắc nghiệm
1 điểmKhông giới hạn

Công cụ thống kê mô tả nào có thể sử dụng trong trường hợp dữ liệu 2 chiều:

Subtotal

Consolidate

PivotTable

Tất cả đều đúng

Xem đáp án
5. Trắc nghiệm
1 điểmKhông giới hạn

Để hợp nhất dữ liệu từ nhiều bảng không cùng cấu trúc khác nhau ta sử dụng:

Subtotal

Consolidate

PivotTable

Tự làm bằng tay

Xem đáp án
6. Trắc nghiệm
1 điểmKhông giới hạn

Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây:

Trung bình trượt (Moving Average)

San bằng mũ (Exponential Smoothing)

Hồi quy (Regression)

Tất cả đều sai

Xem đáp án
7. Trắc nghiệm
1 điểmKhông giới hạn

Để dự đoán xu hướng tăng/giảm của một mã chứng khoán bất kỳ dựa trên thông tin về giá cả, lượng cổ phiếu mua vào và bán ra của các ngày trước đó. Ta sử dụng công cụ nào sau đây:

Trung bình trượt (Moving Average)

San bằng mũ (Exponential Smoothing)

Hồi quy (Regression)

Tất cả đều sai

Xem đáp án
8. Trắc nghiệm
1 điểmKhông giới hạn

Lựa chọn nào sau đây không phải là một bước trong quy trình khai thác dữ liệu:

Data Understanding

Data Preparation

Data Mining

Evaluation

Xem đáp án
9. Trắc nghiệm
1 điểmKhông giới hạn

Thuộc tính “Loại khách hàng” có hai giá trị: “VIP”, “Premium” và “Economic” là thuộc tính thuộc kiểu dữ liệu nào sau đây:

Liên tục

Rời rạc

Xếp hạng/thứ tự

Định danh

Xem đáp án
10. Trắc nghiệm
1 điểmKhông giới hạn

Tiền xử lý dữ liệu không bao gồm các bước nào sau đây:

Làm sạch dữ liệu

Chuyển đổi dữ liệu

Thu thập dữ liệu

Rút gọn dữ liệu

Xem đáp án
11. Trắc nghiệm
1 điểmKhông giới hạn

Có mấy cách dùng để xử lý khi dữ liệu bị thiếu:

2

3

4

5

Xem đáp án
12. Trắc nghiệm
1 điểmKhông giới hạn

Khi nào thì ta cần rời rạc hóa dữ liệu:

Dữ liệu bị thiếu

Dữ liệu thuộc kiểu số học

Dữ liệu thuộc kiểu định danh

Dữ liệu thuộc kiểu nhị phân

Xem đáp án
13. Trắc nghiệm
1 điểmKhông giới hạn

Phân lớp dữ liệu là thuộc phương pháp:

Không giám sát

Bán giám sát

Có giám sát

Phương pháp lai

Xem đáp án
14. Trắc nghiệm
1 điểmKhông giới hạn

Thuật toán phân lớp tham gia vào quá trình nào sau đây trong mô hình phân lớp dữ liệu:

Huấn luyện

Kiểm thử

Đánh giá

Dự đoán

Xem đáp án
15. Trắc nghiệm
1 điểmKhông giới hạn

Thuật toán phân lớp nào sau đây cho phép xử lý trên nhiều kiểu/loại dữ liệu khác nhau:

SVM

Cây quyết định

Logistic Regression

Mạng nơ ron

Xem đáp án
16. Trắc nghiệm
1 điểmKhông giới hạn

Trong Orange, biến có kiểu dữ liệu categorical là để chỉ các thuộc tính:

Liên tục

Rời rạc

Định lượng

Số học

Xem đáp án
17. Trắc nghiệm
1 điểmKhông giới hạn

Đối với bài toán phân lớp đa nhãn thì chỉ số đánh giá nào thường được dùng để đánh giá độ hiệu quả của mô hình phân lớp:

Precision

Recall

F1-score

Accuracy

Xem đáp án
18. Trắc nghiệm
1 điểmKhông giới hạn

Giá trị a[i;j] trong ma trận nhầm lẫn (confusion matrix) cho biết:

Số lượng mẫu i được phân vào đúng mẫu i

Số lượng mẫu i được phân nhầm vào mẫu j

Số lượng mẫu j được phân đúng vào mẫu j

Số lượng mẫu j được phân nhầm vào mẫu i

Xem đáp án
19. Trắc nghiệm
1 điểmKhông giới hạn

Phương pháp chọn mẫu dữ liệu nào sau đây dùng để khắc phục tình trạng over-fitting:

Chọn mẫu ngẫu nhiên (Random sampling)

Đánh giá chéo (k-fold cross validation)

Hold-out

Huấn luyện và kiểm thử trên cùng tập dữ liệu

Xem đáp án
20. Trắc nghiệm
1 điểmKhông giới hạn

Một người bị nghi ngờ bệnh lao đi thực hiện xét nghiệm. Nếu kết quả xét nghiệm cho thấy người này bị lao trong khi anh ta thật sự không mắc bệnh lao. Trường hợp này, được gọi là:

Tỷ lệ bỏ sót

Độ nhạy

Tỷ lệ báo động nhầm

Độ lỗi

Xem đáp án
21. Trắc nghiệm
1 điểmKhông giới hạn

Phân cụm dữ liệu là thuộc phương pháp

Có giám sát

Không giám sát

Phương pháp lai

Bán giám sát

Xem đáp án
22. Trắc nghiệm
1 điểmKhông giới hạn

Một phương pháp phân cụm tốt là phương pháp cho kết quả phân cụm mà trong đó:

Độ tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm cao.

Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm cao.

Độ tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm thấp.

Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm thấp.

Xem đáp án
23. Trắc nghiệm
1 điểmKhông giới hạn

Thuật toán nào sau đây cho phép một phần tử có thể thuộc về một hoặc nhiều cụm khác nhau:

Diana

K-means

DBSCAN

Fuzzy C-mean

Xem đáp án
24. Trắc nghiệm
1 điểmKhông giới hạn

Thuật toán phân cụm nào sau đây không cần biết trước số cụm:

K-means

Agnes

Fuzzy C-mean

DBSCAN

Xem đáp án
25. Trắc nghiệm
1 điểmKhông giới hạn

Trong Orange, đối với thuật toán phân cụm phân cấp (HAC) để có được kết quả phân cụm với số lượng cụm cụ thể ta cần làm gì?

Chọn số lượng cụm k trên hộp thoại.

Chọn phương pháp tính khoảng cách trước khi chọn thuật toán.

Chọn đường cắt phù hợp trên cây phân cấp kết quả.

Không cần làm gì cả

Xem đáp án
26. Trắc nghiệm
1 điểmKhông giới hạn

So sánh kết quả giữa các mô hình để xem xét tính hiệu quả của việc phân cụm thuộc cách đánh giá nào sau đây:

Đánh giá ngoài

Đánh giá trong

Đánh giá tương đối

Tất cả các cách trên

Xem đáp án
27. Trắc nghiệm
1 điểmKhông giới hạn

Trong Orange, đối với thuật toán K-means, tham số đầu vào nào sau đây dùng để kiểm soát trong trường hợp dữ liệu hội tụ chậm hoặc không hội tụ:

Số lượng cụm (number of cluster)

Khởi tạo các phần tử đại diện của cụm (Initialization)

Số lần chạy (re-runs)

Số lần lặp tối đa (maximum iterations)

Xem đáp án
© All rights reserved VietJack