BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH
TS. NGUYỄN MẠNH HÙNG
GIÁO TRÌNH
MÁY HỌC
NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA
THÀNH PHỐ HỒ CHÍ MINH – 2025
2
Mục lục
DANH MỤC TỪ VIẾT TẮT .............................................................................. 7
LỜI NÓI ĐẦU ..................................................................................................... 9
CHƯƠNG 1. GIỚI THIỆU VỀ MÁY HỌC ..................................................... 11
1.1 CÁC BÀI TOÁN TRONG MÁY HỌC ..................................................... 11
1.1.1 Học có giám sát ....................................................................................... 12
1.1.2 Học không giám sát ................................................................................. 13
1.1.3 Học tăng cường ....................................................................................... 14
1.2 QUY TRÌNH PHÁT TRIỂN MÔ HÌNH MÁY HỌC ............................... 14
1.2.1 Quy trình KDD: Khám phá kiến trúc cơ sở dữ liệu................................. 14
1.2.2 Quy trình SEMMA .................................................................................. 19
1.3 HƯỚNG DẪN CÀI ĐẶT PYTHON VÀ CÁC THƯ VIỆN HỖ TRỢ ..... 21
1.3.1 Giới thiệu Python .................................................................................... 21
1.3.2 Giới thiệu SKlearn ................................................................................... 21
1.3.3 Giới thiệu Jupyter Notebook ................................................................... 22
1.3.4 Các thư viện cơ bản cần dùng ................................................................. 22
1.4 HƯỚNG DẪN HUẤN LUYỆN MÔ HÌNH CƠ BẢN .............................. 27
1.4.1 Khảo sát tập dữ liệu ................................................................................. 28
1.4.2 Chuẩn bị tập huấn luyện (training) và tập kiểm tra (testing) ................... 31
1.4.3 Khảo sát đặc tính của dữ liệu .................................................................. 33
1.4.4 Xây dựng mô hình phân loại ................................................................... 35
1.4.5 Thực hiện dự đoán cho một mẫu mới ...................................................... 36
1.4.6 Đánh giá độ chính xác của mô hình trên dữ liệu đánh giá hiện tại.......... 37
1.5 Tóm tắt .................................................................................
...
...
caler().fit_transform(X)
for digit in digits.target_names:
ax.scatter(
*X[y == digit].T,
marker=f${digit}$,
s=60,
color=plt.cm.Dark2(digit),
alpha=0.425,
zorder=2,
)
288
shown_images = np.array([[1.0, 1.0]]) # just something big
for i in range(X.shape[0]):
# plot every digit on the embedding
# show an annotation box for a group of digits
dist = np.sum((X[i] - shown_images) ** 2, 1)
if np.min(dist) 4e-3:
# don’t show points that are too close
continue
shown_images =
np.concatenate([shown_images,[X[i]]],axis=0)
imagebox = offsetbox.AnnotationBbox(
offsetbox.OffsetImage(digits.images[i],
cmap=plt.cm.gray_r), X[i]
)
imagebox.set(zorder=1)
ax.add_artist(imagebox)
ax.set_title(title)
ax.axis(off)
289
TÀI LIỆU THAM KHẢO
1. Andreas C. Mu¨ller, and Sarah Guido. Introduction to Machine
Learning with Pythơn: A Guide for Data Scientists. O’Reilly, 2016.
2. William McKinney, Pythơn for Data Analysis: Data Wrangling
with Pandas, NumPy, and IPythơn. O’Reilly, 2017.
3. Shashank Kapadia, 6 Steps towards a Successful Machine
Learning Project, towards- datascience, June-05-2024,
https://towardsdatascience.com/6-steps-towards-a-successfulmachine-learning-project- 3a56f59e2747.
4. Andrew Ng., Machine Learning Coursera course,
https://cs229.stanford.edu/syllabus- autumn2018.html.
5. Fabian Pedregosa el. al., Scikit-learn Machine Learning in
Pythơn, https://scikit-learn.org/stable/.
290
Giáo trình Máy học
Nguyễn Mạnh Hùng
Trường Đại học Sư phạm Kỹ thuật TP HCM
NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
Phòng 501, Nhà Điều hành ĐHQG-HCM, P. Linh Trung, TP Thủ Đức, TP.HCM.
ĐT: 028 62726361
E-mail:
[email protected] - Website: vnuhcmpress.edu.vn
Chịu trách nhiệm xuất bản và nội dung
PGS.TS NGUYỄN MINH TÂM
Biên tập
LÊ THỊ MINH HUỆ
Sửa bản in
THANH HÀ
Trình bày bìa
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỒ HỒ CHÍ MINH
Đối tác liên kết
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỒ HỒ CHÍ MINH
Xuất bản lần thứ 1. Số lượng in: 250 cuốn, khổ 16 x 24 cm. Số XNĐKXB:
3843-2024/CXBIPH/4-58/ĐHQGTPHCM. QĐXB số: 362/QĐ-NXB cấp ngày
31/12/2024. In tại: Công ty TNHH In &amp Bao bì Hưng Phú. Địa chỉ: 162A/1,
KP1A, phường An Phú, TP Thuận An, tỉnh Bình Dương. Nộp lưu chiểu: Năm
2025. ISBN: 978-604-479-893-6.
Bản quyền tác phẩm đã được bảo hộ bởi Luật Xuất bản và Luật Sở hữu trí
tuệ Việt Nam. Nghiêm cấm mọi hình thức xuất bản, sao chụp, phát tán nội dung
khi chưa có sự đồng ý của tác giả và Nhà xuất bản.
ĐỂ CÓ SÁCH HAY, CẦN CHUNG TAY BẢO VỆ TÁC QUYỀN!