12 CÂU HỎI
Chọn phát biểu sai:
a. Internet vạn vật khiến cho lượng dữ liệu được thu thập tăng cao.
b. AI sử dụng kết quả từ khoa học dữ liệu để có thể thông minh hơn, chính xác hơn.
c. Bigdata là công nghệ lưu trữ và khai thác dữ liệu có dung lượng lớn (volume), đa dạng (variety), yêu cầu tốc độ cao (velocity) và có tính xác thực (Veracity).
d. Data mining là một phương pháp phân tích dữ liệu của khoa học dữ liệu.
Kết quả mà khoa học dữ liệu hướng đến là: thông tin và tri thức
a. Dữ liệu
b. Thông tin
c. Tri thức
d. Tất cả đều đúng
Công cụ thống kê mô tả nào được sử dụng khi cần tổng hợp dữ liệu đa chiều
a. Subtotal
b. Consolidate
c. PivotTable
d. Tất cả đều sai
Công cụ thống kê mô tả nào có thể sử dụng trong trường hợp dữ liệu 2 chiều:
a. Subtotal
b. Consolidate
c. PivotTable
d. Tất cả đều đúng
Để hợp nhất dữ liệu từ nhiều bảng không cùng cấu trúc khác nhau ta sử dụng:
a. Subtotal
b. Consolidate
c. PivotTable
d. Tự làm bằng tay
Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây:
a. Trung bình trượt (Moving Average)
b. San bằng mũ (Exponential Smoothing)
c. Hồi quy (Regression)
d. Tất cả đều sai
Để dự đoán xu hướng tăng/giảm của một mã chứng khoán bất kỳ dự trên thông tin về giá cả, lượng cổ phiếu mua vào và bán ra của các ngày trước đó. Ta sử dụng công cụ nào sau đây:
a. Trung bình trượt (Moving Average)
b. San bằng mũ (Exponential Smoothing)
c. Hồi quy (Regression)
d. Tất cả đều sai
Lựa chọn nào sau đây không phải là một bước trong quy trình khai thác dữ liệu:
a. Data Understading
b. Data preparatiion
c. Data mining
d. Evaluation
Thuộc tính “Loại khách hàng” có hai giá trị: “VIP”, “Premium” và “Economic” là thuộc tính thuộc kiểu dữ liệu nào sau đây:
a. Liên tục
b. Rời rạc
c. Xếp hạng/thứ tự
d. Định danh
Tiền xử lý dữ liệu không bao gồm các bước nào sau đây:
a. Làm sạch dữ liệu
b. Chuyển đổi dữ liệu
c. Thu thập dữ liệu
d. Rút gọn dữ liệu
Có mấy cách dùng để xử lý khi dữ liệu bị thiếu:
a. 2
b. 3
c. 4
d. 5
Khi nào thì ta cần rời rạc hóa dữ liệu:
a. Dữ liệu bị thiếu
b. Dữ liệu thuộc kiểu số học
c. Dữ liệu thuộc kiểu định danh
d. Dữ liệu thuộc kiểu nhị phân