30 câu hỏi
Data Mining được định nghĩa là gì?
Là một quy trình tìm kiếm, phát hiện các tri thức mới, tiềm ẩn, hữu dụng trong cơ sở dữ liệu lớn
Khai phá dữ liệu
Khai khoáng dữ liệu
Tìm kiếm thông tin trên Internet
Thuật ngữ Data Mining dịch ra tiếng Việt có nghĩa là:
Khai phá dữ liệu hoặc Khai thác dữ liệu
Khai phá luật kết hợp
Khai phá tập mục thường xuyên
Khai phá tri thức từ dữ liệu lớn
Thuật ngữ Knowledge Discovery from Databases – KDD có nghĩa là:
Trích chọn các mẫu hoặc tri thức hấp dẫn (không tầm thường, ẩn, chưa biết và hữu dụng tiềm năng) từ tập dữ liệu lớn
Khai phá dữ liệu
Khai thác dữ liệu
Tìm kiếm dữ liệu
Phát biểu nào sau đây là đúng?
Data Mining là một bước trong quá trình khai phá tri thức-KDD
Thuật ngữ Data Mining đồng nghĩa với thuật ngữ Knowledge Discovery from Databases
Data Mining là quá trình tìm kiếm thông tin có ích trên Internet
Tiền xử lí dữ liệu là quá trình tìm kiếm thông tin có ích từ cơ sở dữ liệu lớn
Hiện nay, Data Mining đã được ứng dụng trong:
Hệ quản trị CSDL SQL Server
Hệ quản trị CSDL Access
Hệ quản trị CSDL Foxpro
Microsoft Word 2010
Thuật ngữ Tiền xử lí dữ liệu bằng tiếng Anh là:
Data Preprocessing
Data Processing
Preprocessing in Database
Data Process
Cho CSDL giao tác như hình vẽ, Số lượng giao dịch trong cơ sở dữ liệu là:
5
16
6
10
Cho CSDL giao dịch như hình vẽ, Độ hỗ trợ của tập mục X={A, M} là:
3 (60%)
4 (80%)
5 (100%)
2 (40%)
Thuật toán Apriori có nhược điểm chính là:
Tốn nhiều bộ nhớ và thời gian. Không thích hợp với các mẫu lớn. Chi phí để duyệt CSDL nhiều.
Không tìm được các tập thường xuyên
Kết quả của thuật toán không ứng dụng được trong các bài toán thực tế
Thuật toán quá phức tạp, khó hiểu
Tập nào là tập mục thường xuyên thỏa Min_support:
{A, C}
{D}
{A, D}
{B, C, D}
Tập nào không là tập mục thường xuyên:
{A, C, D}
{A, E}
{A, C}
{B, E}
Tập nào không là tập mục thường xuyên:
{D}
{A, E}
{A, C}
{B, E}
Sử dụng thuật toán Apriori, sau lần duyệt thứ nhất, tập mục chứa 1-item bị loại bỏ là:
{D}
{A}
{B}
{A}, {D}
Tập nào không là tập mục thường xuyên:
{B, D}
{A, E}
{A, C}
{B, E}
Tập nào là tập mục thường xuyên với độ hỗ trợ là 75%:
{B, E}
{A, E}
{A, C}
{B, C}
Tập nào là tập mục thường xuyên với độ hỗ trợ là 70%?
Không có tập nào
{A, E}
{A, C, D}
{B, C, D}
Luật kết hợp nào thỏa mãn các điều kiện đã cho?
A → C
A → D
A → E
AB → C
Luật kết hợp nào thỏa mãn các điều kiện đã cho?
B → E
A → D
A → E
AB → C
Luật kết hợp nào thỏa mãn các điều kiện đã cho?
A → C
A → D
A → E
AB → C
Luật kết hợp nào có độ tin cậy = 100%?
A → C
A → D
AD → E
AB → C
Cho tập mục thường xuyên X = {A, B}, từ tập X có thể sinh ra các luật kết hợp sau:
A → B, B → A, không tính luật AB → và → AB
A → B, B → A, A → và → B
A → B
B → A
Cho FP-Tree như hình vẽ, có mấy đường đi kết thúc ở nút m?
2 đường đi
1 đường đi
3 đường đi
4 đường đi
Cho FP-Tree như hình vẽ, có mấy đường đi kết thúc ở nút p?
2 đường đi
1 đường đi
3 đường đi
4 đường đi
Hai thuật toán FP-Growth và Apriori dùng để:
Tìm các tập mục thường xuyên
Tìm các luật kết hợp
Tìm các tập mục có k-item
Thực hiện công việc khác
Phương pháp nào không phải là phương pháp phân lớp?
Chia các đối tượng thành từng lớp để giảng dạy
Phân lớp dựa trên Cây quyết định
Phân lớp dựa trên xác suất Bayes
Phân lớp dựa trên Mạng Nơron
Cho tập ví dụ học như bảng. Có bao nhiêu thuộc tính để phân lớp?
4 thuộc tính
3 thuộc tính
5 thuộc tính
6 thuộc tính
Cho tập ví dụ học như bảng. Thuộc tính kết luận Play Ball có bao nhiêu giá trị?
2 giá trị
3 giá trị
5 giá trị
1 giá trị
Cho tập ví dụ học như bảng. Các thuộc tính dùng để phân lớp là:
Outlook, Temperature, Humidity, Wind
Outlook, Temperature, Humidity, Wind, Play Ball
Day, Outlook, Temperature, Humidity, Wind
Day, Outlook, Temperature, Humidity, Wind, Play Ball
Khi chọn 1 thuộc tính A để làm gốc cây quyết định. Nếu thuộc tính A có 3 giá trị thì cây quyết định có bao nhiêu nhánh?
3 nhánh
2 nhánh
Nhiều nhánh
Phải biết kết luận C có bao nhiêu giá trị thì mới phân nhánh được
Sử dụng thuật toán ILA, khi kết luận C có n giá trị thì ta cần chia bảng chứa các ví dụ học thành mấy bảng con?
n bảng con
2 bảng con
Không phải chia
Thành nhiều bảng tùy theo giá trị của n
