ĐỀ THI KẾT THÚC HỌC PHẦN TIN HỌC ỨNG DỤNG ( APCM220307 – 3 TC ) HÌNH THỨC: BÀI TẬP LỚN THEO NHÓM Mã đề thi: 2 41 1 – Nhóm XX ( HK 1 Khóa 20 2 4 - 202 5 ) Thời gian phát đề : …… Thời gian nộp bài : sau 14 ngày kể từ phát đề Thời gian báo cáo vấn đáp : Cập nhât sau THÔNG TIN LƯU Ý Đề thi và file dữ liệu đề thi được cung cấp trên hệ thống LMS của trường (đối với hệ CLC & QT là trang https://fhqx.hcmute.edu.vn/ và hệ đại trà là trang https://utex.hcmute.edu.vn/ ) , các file dữ liệu bao gồm 1 file PDF đề thi ( thông tin về đề thi và điểm thành phần ). Sinh viên làm việc theo nhóm và làm bài trên máy tính của mình và GOOGLE COLAB , sau đó nén toàn bộ các file thành file nén (rar/zip/7z..) và nộp lên LMS . File nén có định dạng như sau: Nhom_MaLopHP .rar ( hoặc .zip, .7z…) Các file nộp lên bao gồm: - 1 hoặc nhiều fi le dữ liệu thô ( định dạng là excel , csv , hoặc định dạng khác ) , bao gồm phần dữ liệu download về từ các trang công bố dữ liệu đáng tin cậy ( như worldbank , adb… ) - 1 hoặc nhiều file excel đã được xử lý và tổng hợp dữ liệu theo yêu cầu đề bài, lưu ý các file này có phần vba, nên phần mở rộng của file excel này phải đúng định dạng - 1 hoặc nhiều file python notebook , download từ GOOGLE COLAB để xử lý các yêu cầu của đề bài - 1 file word , là báo cáo tổng hợp các nội dung đã làm . Đây là file quan trọng nhất của bài tập này, trình bày rõ ràng dễ hiểu, và có đề mục rõ r àng, mạch lạc và có mục đích. Yêu cầu file word như sau: + Trình bày như một bài tiểu luận, gồm phần mở đầu (tại sao chọn đề tài này…) , nội dung và kết luận. + Ngoài ra, trong này cũng phải có một phần về làm việc nhóm, phân chia công việc và đánh giá mức độ hoàn thiện công việc của các thành viên trong nhóm. + Là phần trình bày tất cả các nội dung của nhóm đã làm được theo yêu cầu của đề bài. + File word này cần được kiểm tra đạo văn thông qua cổng turnitin.com mà nhà trường có hỗ trợ cung cấp . Trường hợp nhà trường không đủ chi phí cho sinh viên sử dụng turnitin, thì có thể sử dụng trang https://kiemtratailieu.vn/ thay thế. Yêu cầu không được quá 40% trùng lắp . Nếu kiểm tra đạo văn với turnitin , nhóm sinh viên cần liên hệ GV để cung cấp tài khoản cho các bạn nhóm trưởng check. + Được phép sử dụng chatGPT hoặc
...
--------------------------------------
...về bộ dữ liệu mà nhóm tìm được. Sau đó tìm kiếm các lý thuyết, các nghiên cứu trước đó (lịch sử nghiên cứu), các bài báo hoặc cái bài luận liên quan, để làm nền tảng cho việc phân tích các kết quả đạt được. Gợi ý thực hiện các yêu cầu sau: Tải file dử liệu lên drive, và kết nối được google drive với google colab. Chạy các lệnh đọc file bằng pandas , sau đó cho biết kích thức của bộ dữ liệu, ngoài ra kết hợp với SciPy , Numpy để xử lý dữ liệu nếu cần. Mô tả các trường dữ liệu. Nếu trường nào là số, thì thống kê mô tả sơ bộ cho các trường đó. Sau đó nhận xét. Vẽ biểu đồ phân bố cho các biến / cột dữ liệu, nhận xét. Vẽ các biểu đồ bằng seaborn , trong đó phải có nhiều loại biểu đồ khác nhau, càng nhiều càng tốt. Sau đó, nhận xét cho các biểu đồ này. Từ việc nhận xét dữ liệu, hãy rút ra được tính chất của dữ liệu, kết luận về nó. Liên hệ thực tế, các nghiên cứu trước, các lý thuyết trước. Phần 5 – Hoàn thành và viết báo cáo Gợi ý kết cấu bài tiểu luận như sau: Lời mở đầu Danh sách nhóm và phân chia công việc Mục Lục Giới Thiệu Lý do chọn đề tài Mục tiêu của tiểu luận Phạm vi của nghiên cứu Ý nghĩa của đề tài Cách tiếp cận và phương pháp nghiên cứu Chọn Chủ Đề và Thu Thập Dữ Liệu Tổng quan về vấn đề nghiên cứu Các lý thuyết liên quan Các công trình nghiên cứu trước (trong nước & quốc tế) Mô tả quá trình chọn chủ đề Các tiêu chí và lý do chọn lựa chủ đề Nguồn dữ liệu được sử dụng và quy trình thu thập dữ liệu Xử Lý Dữ Liệu Thô với Excel Mô tả quy trình xử lý dữ liệu trên Excel Các bước sắp xếp, làm sạch, và chuẩn hóa dữ liệu Sử dụng hàm VLOOKUP, HLOOKUP, Rank, và các hàm thời gian Áp dụng Conditional Formatting Dashboard và báo cáo Phân Tích Dữ Liệu Sử Dụng Python và Google Colab Các bước chuyển dữ liệu sang định dạng .csv hoặc .xls Phân tích tính chất dữ liệu sử dụng Python Các kỹ thuật và thư viện Python được sử dụng (ví dụ: pandas, numpy, matplotlib, seaborn) Kết Quả và Thảo Luận Mô tả kết quả phân tích dữ liệu Thảo luận về ý nghĩa và tầm quan trọng của kết quả So sánh với lý thuyết và nghiên cứu trước đó Kết Luận và Đề Xuất Tổng kết các phát hiện chính từ nghiên cứu Đề xuất cho các nghiên cứu tiếp theo và ứng dụng thực tế Hạn chế của nghiên cứu và cơ hội cải thiện Phụ Lục : Chứa bất kỳ thông tin bổ sung hoặc tài liệu tham khảo Tài Liệu Tham Khảo: Danh sách các nguồn dữ liệu, bài báo, và tài liệu nghiên cứu đã sử dụng (khoảng từ 15 tài liệu tham khảo trở lên ) ( Hết )