30 câu hỏi
Kết luận nào trong các kết luận sau là sai:
Thuật toán Quilan chọn ngẫu nhiên 1 thuộc tính để làm gốc cây quyết định
Độ phân biệt (độ lộn xộn) của một thuộc tính với kết luận C cao nhất thì Entropy của nó thấp nhất
Thuật toán học khái niệm CLS chọn ngẫu nhiên 1 thuộc tính để làm gốc cây quyết định
Entropy là một số biến thiên trong đoạn
Kết luận C gồm 2 giá trị Yes và No. Entropy(C) = 1 nói nên điều gì:
Số kết luận Yes = Số kết luận No
Số kết luận Yes = 0
Số kết luận No = 0
Không kết luận được điều gì
Kết luận C gồm 2 giá trị Yes và No. Entropy(C) = 0 nói nên điều gì:
Số kết luận Yes = 0 hoặc Số kết luận No
Số kết luận Yes = Số kết luận No
Số kết luận No = 1 và Số kết luận Yes = 1
Không kết luận được điều gì
Khi sử dụng thuật toán Quilan để xây dựng cây quyết định. Tại mỗi bước của thuật toán ta chọn thuộc tính nào trong số các thuộc tính còn lại để làm gốc phân nhánh?
Thuộc tính có độ phân biệt cao nhất
Thuộc tính có độ phân biệt thấp nhất
Thuộc tính có Entropy cao nhất
Chọn ngẫu nhiên
Khi sử dụng thuật toán CLS (Concept Learning System) để xây dựng cây quyết định. Tại mỗi bước của thuật toán ta chọn thuộc tính nào trong số các thuộc tính còn lại để làm gốc phân nhánh?
Chọn ngẫu nhiên
Thuộc tính có độ phân biệt thấp nhất
Thuộc tính có Entropy cao nhất
Thuộc tính có độ phân biệt cao nhất
Entropy là một đại lượng có miền giá trị là:
[0; 1]
(0; 1)
Miền giá trị là tập số nguyên dương
Miền giá trị là tập số thực dương
Thuật toán Quilan là thuật toán dùng để:
Xây dựng cây quyết định
Tìm các luật
Tìm độ phân biệt của các thuộc tính
Giúp ta tìm ra 1 thuộc tính làm gốc cây quyết định
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Có bao nhiêu tổ hợp gồm có 1 thuộc tính:
4 tổ hợp
5 tổ hợp
6 tổ hợp
2 tổ hợp
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Có bao nhiêu tổ hợp gồm có 2 thuộc tính phân biệt:
6 tổ hợp
5 tổ hợp
4 tổ hợp
2 tổ hợp
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Có bao nhiêu tổ hợp gồm có 3 thuộc tính phân biệt:
4 tổ hợp
1 tổ hợp
6 tổ hợp
2 tổ hợp
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Có bao nhiêu tổ hợp gồm có 4 thuộc tính phân biệt:
1 tổ hợp
4 tổ hợp
6 tổ hợp
2 tổ hợp
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Với bảng Play Ball = No, xét tổ hợp 1 thuộc tính. Tổ hợp thuộc tính nào là tổ hợp lớn nhất:
Humidity = High
Wind = Weak
Outlook = Sunny
Humidity = Normal
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Với bảng Play Ball = No ta tìm được bao nhiêu luật:
2 luật
3 luật
1 luật
4 luật
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Với bảng Play Ball = No ta tìm được các luật sau:
If Humidity = High Then Play Ball = No và If Outlook = Rain Then Play Ball = No
If Humidity = High Then Play Ball = No
If Humidity = Normal Then Play Ball = No và If Outlook = Rain Then Play Ball = No
If Outlook = Sunny Then Play Ball = No và If Wind = Strong Then Play Ball = No
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Với bảng Play Ball = Yes ta tìm được các luật sau:
If Outlook = Overcast Then Play Ball = No và If Outlook = Sunny and Temperature = Cold Then Play Ball = Yes
If Humidity = Normal Then Play Ball = Yes
If Humidity = Weak Then Play Ball = Yes và If Outlook = Overcast Then Play Ball = Yes
If Outlook = Sunny Then Play Ball = Yes và If Wind = Strong Then Play Ball = Yes
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Với bảng Play Ball = Yes ta tìm được mấy luật:
2 luật
3 luật
1 luật
0 luật
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Tập ví dụ học trên sinh ra ít nhất mấy luật:
4 luật
3 luật
2 luật
6 luật
Cho tập ví dụ học như bảng. Sử dụng thuật toán ILA. Với bảng Play Ball = Yes, xét tổ hợp 1 thuộc tính. Tổ hợp thuộc tính nào là tổ hợp lớn nhất:
Outlook = Overcast
Wind = Weak
Outlook = Sunny
Humidity = Normal
Độ đo gần gũi là gì?
Đây là một độ đo chỉ ra mức độ tương tự hay không tương tự giữa hai vector đặc trưng
Độ đo giữa 2 phần tử bất kỳ
Khoảng cách giữa 2 phần tử trong không gian
Độ đo sử dụng trong Data Mining để phân cụm dữ liệu
Độ đo gần gũi gồm có:
Độ đo tương tự và độ đo không tương tự
Độ đo khoảng cách và độ đo tình cảm
Độ đo Ơclit và độ đo phi Ơclit
Độ đo tương tự và độ đo khoảng cách trong không gian 2 chiều
Độ đo khoảng cách trong không gian Ơclit là độ đo:
Độ đo không tương tự
Độ đo tương tự
Độ đo giữa 2 đối tượng cùng loại
Độ đo giữa 2 đối tượng khác loại
Cho 2 điểm trong mặt phẳng tọa độ Oxy, cho 2 điểm A(x1, y1), B(x2, y2). Khoảng cách Ơclit giữa 2 điểm này là:
d = sqr(sqrt(x1 - x2) + sqrt(y1 - y2)), trong đó sqr là hàm bình phương, sqrt là hàm lấy căn.
d = sqr(sqrt(x1 + x2) + sqrt(y1 + y2)), trong đó sqr là hàm bình phương, sqrt là hàm lấy căn.
d = x1 * x2 + y1 * y2
Công thức khác
Cho hai điểm A(0, 1), B(4, 4). Sử dụng độ đo khoảng cách Ơclit thì khoảng cách giữa 2 điểm là:
d(A, B) = 5
d(A, B) = 3
d(A, B) = 4
d(A, B) = 1
Cho tập C = {x1, x2, ..., xk} gồm k phần tử, mỗi phần tử là một vector trong không gian N chiều. Vector trung bình mC của tập C là một vector trong không gian N chiều được định nghĩa là:
mC = (x1 + x2 + ... + xk) / k
mC = (x1 + x2 + ... + xk)
mC = (x1 + x2 + ... + xk) / N
mC = (x1 + x2 + ... + xk) / k * N
Trong thuật toán phân cụm k-mean, sau khi chọn được k điểm làm tâm, phần tử x sẽ được gán vào cụm C sao cho:
Khoảng cách từ x đến tâm cụm C là nhỏ nhất
Khoảng cách từ x đến tâm cụm C là lớn nhất
Khoảng cách từ x đến tâm cụm C bằng 0
Khoảng cách từ x đến tâm cụm C bằng k
Trong thuật toán k-mean, sau khi gán các đối tượng vào k cụm cần phải:
Tính lại tâm của các cụm
Tính khoảng cách giữa các phần tử trong cụm
Tìm một số phần tử đại diện của cụm
Trộn các cụm lại với nhau để số cụm sinh ra là ít nhất
Cho các điểm A(1, 1), B(2, 1), C(4, 3), D(5, 4). Sử dụng thuật toán phân cụm k-mean để chia 4 điểm vào 2 cụm. Kết quả phân cụm là:
C1 = {A, B}; C2 = {C, D}
C1 = {A, C}; C2 = {B, D}
C1 = {A, B, C}; C2 = {D}
C1 = {A, B, D}; C2 = {C}
Cho các điểm A(1, 1), B(2, 1), C(4, 3), D(5, 4), E(1, 0). Sử dụng thuật toán phân cụm k-mean để chia 5 điểm vào 2 cụm. Kết quả phân cụm là:
C1 = {A, B, E}; C2 = {C, D}
C1 = {A, C, E}; C2 = {B, D}
C1 = {A, B, C}; C2 = {D, E}
C1 = {A, B, D}; C2 = {C, E}
Cho cụm C gồm các điểm A(1, 1), B(2, 1), C(3, 1). Giả sử đại diện của cụm là một điểm (vector trung bình). Vectơ trung bình của cụm là:
mC = (2; 1)
mC = (2; 0)
mC = (2.5; 1.5)
mC = (0; 0)
Cho cụm C gồm các điểm A(1, 1), B(2, 4), C(6, 1). Giả sử tâm của cụm là vector trung bình. Tâm của cụm là:
mC = (3; 2)
mC = (2; 3)
mC = (2.5; 1.5)
mC = (6; 1)
