19 câu hỏi
Một phương pháp gom cụm tốt là phương pháp cho kết quả gom cụm mà trong đó
Độ tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm thấp
Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm thấp
Độ tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm cao
Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm cao
Thuật toán gom cụm nào sau đây không cần biết trước số cụm
Fuzzy C-mean
Diana
DBSCAN
K-mean
Giá trị tại phần tử (i;j) trong ma trận nhầm lẫn cho biết:
Số lượng mẫu i được phân vào mẫu j
Số lượng mẫu i phân lớp nhầm vào mẫu j
Số lượng mẫu i không được phân vào mẫu j
Số lượng mẫu j phân lớp nhầm vào mẫu i
So sánh kết quả giữa các thuật toán phân cụm khác nhau để xem xét tính hiệu quả của mô hình phân cụm thuộc loại đánh giá nào sau đây
Tất cả đều sai
Đánh giá trong
Đánh giá tương đối
Đánh giá ngoài
Có mấy cách xử lý khi dữ liệu bị thiếu
3
4
6
5
Để dự đoán xu hướng tăng/giảm của một mã chứng khoán bất kỳ dự trên thông tin về giá cả, lượng cổ phiếu mua vào và bán ra của các ngày trước đó. Ta sử dụng công cụ nào sau đây:
Hồi quy (Regression)
San bằng mũ (Exponential Smoothing)
Tất cả đều sai
Trung bình trượt (Moving Average)
Thuộc tính “Loại khách hàng” có giá trị “VIP”, “Premium” và “Economic” là thuộc tính thuộc kiểu dữ liệu nào sau đây:
Liên tục
Định danh
Rời rạc
Xếp hạng/ thứ tự
Công cụ thống kê nào được sử dụng để tổng hợp dữ liệu đa chiều:
Subtotal
Tất cả đều đúng
PivotTable
Consolidate
Thuật toán nào sau đây cho phép xử lý trên nhiều kiểu dữ liệu khác nhau:
Logistic Regression
Cây quyết định
Mạng nơ ron
SVM
Đối với bài toán phân lớp đa nhãn/ đa lớp thì chỉ số đánh giá nào thường được dùng để đánh giá độ hiệu quả của mô hình phân lớp
Accuracy
Recall
Precision
F1-score
Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây:
Trung bình trượt (Moving Average)
San bằng mũ (Exponential Smoothing)
Hồi quy (Regression)
Tất cả đều sai
Chọn phát biểu sai
Bigdata là công nghệ lưu trữ, xử lý và khai thác dữ liệu có dung lượng lớn (volume), đa dạng (variety), đòi hỏi tốc độ cao (velocity) và có tính xác thực (varacity).
Data mining là một trong những phương pháp phân tích dữ liệu của khoa học dữ liệu
Ai sử dụng kết quả của khoa học dữ liệu để thông minh hơn, chính xác hơn
Internet vạn vật khiến cho lượng dữ liệu được thu thập tăng lên nhanh chóng
Chọn phát biểu sai:
Internet vạn vật khiến cho lượng dữ liệu được thu thập tăng cao.
AI sử dụng kết quả từ khoa học dữ liệu để có thể thông minh hơn, chính xác hơn.
Bigdata là công nghệ lưu trữ và khai thác dữ liệu có dung lượng lớn (volume), đa dạng (variety), yêu cầu tốc độ cao (velocity) và có tính xác thực (veracity).
Data mining là một phương pháp phân tích dữ liệu của khoa học dữ liệu.
Kết quả mà khoa học dữ liệu hướng đến là:
Dữ liệu
Thông tin
Tri thức
Tất cả đều đúng
Công cụ thống kê mô tả nào được sử dụng khi cần tổng hợp dữ liệu đa chiều?
Subtotal
Consolidate
PivotTable
Tất cả đều sai
Công cụ thống kê mô tả nào có thể sử dụng trong trường hợp dữ liệu 2 chiều?
Subtotal
Consolidate
PivotTable
Tất cả đều đúng
Để hợp nhất dữ liệu từ nhiều bảng không cùng cấu trúc khác nhau ta sử dụng:
Subtotal
Consolidate
PivotTable
Tự làm bằng tay
Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây?
Trung bình trượt (Moving Average)
San bằng mũ (Exponential Smoothing)
Hồi quy (Regression)
Tất cả đều sai
Để dự đoán xu hướng tăng/giảm của một mã chứng khoán bất kỳ dựa trên thông tin về giá cả, lượng cổ phiếu mua vào và bán ra của các ngày trước đó. Ta sử dụng công cụ nào sau đây?
Trung bình trượt (Moving Average)
San bằng mũ (Exponential Smoothing)
Hồi quy (Regression)
Tất cả đều sai
