vietjack.com

100+ câu trắc nghiệm tổng hợp Khoa học dữ liệu trong kinh tế và kinh doanh có đáp án - Phần 2
Quiz

100+ câu trắc nghiệm tổng hợp Khoa học dữ liệu trong kinh tế và kinh doanh có đáp án - Phần 2

A
Admin
15 câu hỏiĐại họcTrắc nghiệm tổng hợp
15 CÂU HỎI
1. Nhiều lựa chọn

Phân lớp dữ liệu là thuộc phương pháp:

a. Không giám sát

b. Bán giám sát

c. Có giám sát

d. Phương pháp lai

2. Nhiều lựa chọn

Thuật toán phân lớp tham gia vào quá trình nào sau đây trong mô hình phân lớp dữ liệu:

a. Huấn luyện

b. Kiểm thử

c. Đánh giá

d. Dự đoán

3. Nhiều lựa chọn

Thuật toán phân lớp nào sau đây cho phép xử lý trên nhiều kiểu/loại dữ liệu khác nhau:

a. SVM

b. Cây quyết định

c. Logistic Regression

d. Mạng nơ ron

4. Nhiều lựa chọn

Trong orange, biến có kiểu dữ liệu categorical là để chỉ các thuộc tính:

a. Liên tục

b. Rời rạc

c. Định lượng

d. Số học

5. Nhiều lựa chọn

Đối với bài toán phân lớp đa nhãn thì chỉ số đánh giá nào thường được dùng để đánh giá độ hiệu quả của mô hình phân lớp:

a. Precision

b. Recall

c. F1-score

d. Accuracy

6. Nhiều lựa chọn

Giá trị a[i;j] trong ma trận nhầm lẫn (confusion matrix) cho biết:

a. Số lượng mẫu i được phân vào đúng mẫu i

b. Số lượng mẫu i được phân nhầm vào mẫu j

c. Số lượng mẫu j được phân đúng vào mẫu j

d. Số lượng mẫu j được phân nhầm vào mẫu i

7. Nhiều lựa chọn

Phương pháp chọn mẫu dữ liệu nào sau đây dùng để khắc phục tinh trạng over-fitting:

a. Chọn mẫu ngẫu nhiên (Random sampling)

b. Đánh giá chéo (k-fold cross validation)

c. Hold-out

d. Huấn luyện và kiểm thử trên cùng tập dữ liệu

8. Nhiều lựa chọn

Một người bị nghi ngờ bệnh lao đi thực hiện xét nghiệm. Nếu kết quả xét nghiệm cho thấy người này bị lao trong khi anh ta thật sự không mắc bệnh lao. Trường hợp này, được gọi là:

a. Tỷ lệ bỏ sót

b. Độ nhạy

c. Tỷ lệ báo động nhầm

d. Độ lỗi

9. Nhiều lựa chọn

Phân cụm dữ liệu là thuộc phương pháp

a. Có giám sát

b. Không giám sát

c. Phương pháp lai

d. Bán giám sát

10. Nhiều lựa chọn

Một phương pháp phân cụm tốt là phương pháp cho kết quả phân cụm mà trong đó:

a. Độ tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm cao.

b. Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm cao.

c. Đô tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm thấp.

d. Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm thấp.

11. Nhiều lựa chọn

Thuật toán nào sau đây cho phép một phần tử có thể thuộc về một hoặc nhiều cụm khác nhau:

a. Diana

b. K-mean

c. DBSCAN

d. Fuzzy C-mean

12. Nhiều lựa chọn

Thuật toán phân cụm nào sau đây không cần biết trước số cụm:

a. K-mean

b. Agnes

c. Fuzzy C-mean

d. DBSCAN

13. Nhiều lựa chọn

Trong Orange, đối với thuật toán phân cụm phân cấp (HAC) để có được kết quả phân cụm với số lượng cụm cụ thể ta cần làm gì?

a. Chọn số lượng cụm k trên hộp thoại.

b. Chọn phương pháp tính khoảng cách trước khi chọn thuật toán.

c. Chọn đường cắt phù hợp trên cây phân cấp kết quả.

d. Không cần làm gì cả

14. Nhiều lựa chọn

So sánh kết quả giữa các mô hình để xem xét tính hiệu quả của việc phân cụm thuộc cách đánh giá nào sau đây:

a. Đánh giá ngoài

b. Đánh giá trong

c. Đánh giá tương đối

d. Tất cả các cách trên

15. Nhiều lựa chọn

Trong Orange, đối với thuật toán K-mean, tham số đầu vào nào sau đây dùng để kiểm soát trong trường hợp dữ liệu hội tụ chậm hoặc không hội tụ:

a. Số lượng cụm (number of cluster)

b. Khởi tạo các phần tử đại diện của cụm (Initialization)

c. Số lần chạy (re-runs)

d. Số lần lặp tối đa (maximum iterations)

© All rights reserved VietJack