30 câu hỏi
Trong học máy, thuật ngữ "hyperparameter" ám chỉ điều gì?
Các tham số mà mô hình học từ dữ liệu.
Các tham số không thể thay đổi được trong quá trình huấn luyện mô hình.
Các tham số được thiết lập trước cho mô hình và không thay đổi dựa trên dữ liệu.
Các tham số quyết định cách mà mô hình được huấn luyện và tối ưu hóa.
Trong học máy, thuật ngữ "gradient descent" ám chỉ điều gì?
Một thuật toán tối ưu hóa được sử dụng để cập nhật các tham số của mô hình để giảm thiểu hàm mất mát.
Quá trình tăng độ phức tạp của mô hình để tăng hiệu suất.
Quá trình chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Quá trình chia tách dữ liệu thành các phần nhỏ để đánh giá mô hình.
Trong học máy, "batch size" là gì?
Số lượng mẫu dữ liệu được sử dụng để cập nhật các tham số của mô hình trong mỗi lần lặp.
Số lượng lớp trong một mô hình neural network.
Số lượng neurons trong một lớp của mạng neural.
Số lượng epochs được sử dụng trong quá trình huấn luyện.
Trong học máy, "accuracy" là gì?
Tỉ lệ số lần mô hình dự đoán đúng trên tổng số mẫu dữ liệu.
Số lượng dữ liệu được sử dụng để huấn luyện mô hình.
Số lượng đặc trưng của mỗi mẫu dữ liệu.
Tổng số lần lặp trong quá trình huấn luyện mô hình.
Trong học máy, "confusion matrix" là gì?
Một bảng tổng hợp thể hiện kết quả của mô hình dự đoán so với nhãn thực tế.
Một phương pháp để giảm kích thước của dữ liệu đầu vào.
Một phương pháp để xử lý dữ liệu bị thiếu.
Một phương pháp để chọn lọc các đặc trưng quan trọng từ dữ liệu.
Trong học máy, "cross-validation" là gì?
Một kỹ thuật chia tập dữ liệu thành các tập con để đánh giá hiệu suất của mô hình.
Một phương pháp để chọn lọc các đặc trưng quan trọng từ dữ liệu.
Một phương pháp để xử lý dữ liệu bị thiếu.
Một phương pháp để giảm kích thước của dữ liệu đầu vào.
Trong học máy, thuật ngữ "variance" ám chỉ điều gì?
Sự chệch của mô hình so với dữ liệu thực tế.
Một thành phần của mô hình thể hiện độ phức tạp của nó.
Sự phù hợp của mô hình với dữ liệu huấn luyện.
Sự không ổn định của mô hình khi áp dụng cho dữ liệu mới.
Trong học máy, thuật ngữ "regularization" ám chỉ điều gì?
Quá trình giảm kích thước của mô hình để giảm overfitting.
Quá trình tăng độ phức tạp của mô hình để tăng hiệu suất.
Quá trình chia tập dữ liệu thành các phần nhỏ để đánh giá mô hình.
Quá trình tạo ra các mô hình phức tạp hơn để đối phó với dữ liệu phức tạp.
Trong học máy, "grid search" là gì?
Một kỹ thuật tìm kiếm siêu tham số tốt nhất cho mô hình bằng cách thử tất cả các giá trị trong một lưới.
Một phương pháp để giảm kích thước của dữ liệu đầu vào.
Một phương pháp để tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
Một phương pháp tối ưu hóa cho mô hình học sâu.
Trong học máy, thuật ngữ "pipeline" ám chỉ điều gì?
Một chuỗi các bước xử lý dữ liệu hoặc mô hình hóa được kết hợp trong một quy trình duy nhất.
Một phương pháp tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
Một phương pháp để tối ưu hóa các tham số của mô hình.
Một phương pháp để giảm kích thước của dữ liệu đầu vào.
Trong học máy, thuật ngữ "bag-of-words" (BoW) là gì?
Một phương pháp biểu diễn văn bản thành một tập hợp không có thứ tự của các từ và số lượng của chúng.
Một phương pháp để giảm kích thước của dữ liệu đầu vào.
Một phương pháp tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
Một phương pháp để chia tập dữ liệu thành các tập con để đánh giá mô hình.
Trong học máy, "data augmentation" là gì?
Một phương pháp tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu bằng cách thêm các biến thể nhỏ.
Một phương pháp để giảm kích thước của dữ liệu đầu vào.
Một phương pháp tối ưu hóa cho mô hình học sâu.
Một phương pháp để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Trong học máy, "dropout" là gì?
Một kỹ thuật sử dụng để giảm kích thước của dữ liệu đầu vào.
Một phương pháp tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
Một kỹ thuật chính regularize trong mạng neural network bằng cách ngẫu nhiên loại bỏ một số đơn vị trong quá trình huấn luyện.
Một phương pháp để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Trong học máy, "batch normalization" là gì?
Một kỹ thuật sử dụng để giảm kích thước của dữ liệu đầu vào.
Một phương pháp tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
Một kỹ thuật chuẩn hóa dữ liệu đầu ra từ các lớp trước trong mạng neural network.
Một phương pháp để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Trong học máy, thuật ngữ "ReLU" là gì?
Một thuật toán tối ưu hóa được sử dụng để cập nhật các tham số của mô hình để giảm thiểu hàm mất mát.
Một phương pháp biểu diễn từng từ trong văn bản thành một vector số.
Một hàm kích hoạt phổ biến trong mạng neural network, được định nghĩa bởi f(x) = max(0, x).
Một phương pháp để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Trong học máy, "backpropagation" là gì?
Một kỹ thuật để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Một phương pháp tối ưu hóa cho mô hình học sâu.
Một thuật toán được sử dụng để lan truyền ngược thông tin gradient qua mạng neural network để cập nhật các trọng số.
Một phương pháp tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
Trong học máy, "epoch" là gì?
Một số lượng mẫu dữ liệu được sử dụng để cập nhật các trọng số của mạng neural network.
Một phương pháp để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Một số lần lặp lại toàn bộ tập dữ liệu trong quá trình huấn luyện mô hình.
Một phương pháp tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
Trong học máy, "early stopping" là gì?
Một kỹ thuật tăng số lượng lớp trong một mạng neural network.
Một kỹ thuật dừng quá trình huấn luyện mô hình khi hiệu suất trên tập kiểm tra bắt đầu giảm.
Một kỹ thuật để tối ưu hóa các tham số của mô hình.
Một kỹ thuật sử dụng để giảm kích thước của dữ liệu đầu vào.
Trong học máy, "validation set" là gì?
Một tập dữ liệu được sử dụng để đánh giá hiệu suất của mô hình trong quá trình huấn luyện.
Một phương pháp tối ưu hóa cho mô hình học sâu.
Một tập dữ liệu được sử dụng để kiểm tra hiệu suất cuối cùng của mô hình sau khi huấn luyện.
Một phương pháp để tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
Trong học máy, "cross-entropy loss" là gì?
Một hàm mất mát thường được sử dụng trong bài toán phân loại, tính toán sự chênh lệch giữa phân phối dự đoán và phân phối thực tế của các lớp.
Một phương pháp để tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
Một phương pháp để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Một kỹ thuật tối ưu hóa cho mô hình học sâu.
Trong học máy, "mean squared error (MSE)" là gì?
Một phương pháp để tối ưu hóa các tham số của mô hình.
Một hàm mất mát thường được sử dụng trong bài toán phân loại, đo lường sự khác biệt giữa dự đoán và giá trị thực tế.
Một phương pháp để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Một hàm mất mát thường được sử dụng trong bài toán hồi quy, tính toán bình phương của sự chênh lệch giữa dự đoán và giá trị thực tế.
Trong học máy, "learning rate" là gì?
Mức độ quan trọng của mỗi đặc trưng trong việc xác định kết quả dự đoán của mô hình.
Tốc độ mà mô hình học từ dữ liệu huấn luyện, tỉ lệ cập nhật các tham số của mạng neural.
Số lượng lớn nhất của mẫu dữ liệu được sử dụng trong một epoch.
Số lượng mẫu dữ liệu được sử dụng để đánh giá hiệu suất của mô hình trong quá trình huấn luyện.
Trong học máy, "momentum" là gì?
Một phương pháp để tối ưu hóa các tham số của mô hình.
Một kỹ thuật tối ưu hóa cho mô hình học sâu.
Một hệ số giúp điều chỉnh tốc độ học của mô hình trong quá trình lan truyền ngược.
Một phương pháp để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.
Thuật toán K-means thuộc loại bài toán nào sau đây?
Học có giám sát
Học không giám sát
Học tăng cường
Học bán giám sát
Trong học máy, để giảm số chiều của dữ liệu mà vẫn giữ được các đặc trưng quan trọng, ta thường sử dụng phương pháp nào?
Principal Component Analysis (PCA)
K-Means Clustering
Support Vector Machine (SVM)
Decision Trees
Trong học máy, thuật toán nào được sử dụng để tìm cực trị của hàm mất mát?
Gradient Descent
K-Means Clustering
Decision Trees
K-Nearest Neighbors
Trong mô hình mạng nơ-ron nhân tạo (ANN), hàm activation function sigmoid có giá trị thuộc khoảng nào?
(-1, 1)
(0, 1)
(-∞, +∞)
D.
Trong mô hình mạng nơ-ron, đạo hàm của hàm sigmoid được tính như thế nào?
σ(s)(1 – σ(s))
σ(s) – (1 – σ(s))
σ(s)
1 – σ(s)
Đối với thuật toán K-Means, việc chọn số lượng cụm (clusters) thích hợp được gọi là gì?
Elbow method
Gradient Descent
Confusion Matrix
Silhouette Analysis
Trong mô hình Linear Regression, hệ số hồi quy (regression coefficients) được tính như thế nào?
Bằng cách giải phương trình đạo hàm của hàm mất mát
Bằng cách chia tổng của đầu ra cho tổng của đầu vào
Bằng cách tối ưu hàm mất mát bằng Gradient Descent
Bằng cách tính đạo hàm riêng của từng biến đầu vào
