Nguyen Duc Ngoc | DA News
Giới thiệu về các ví dụ Làm sạch file dữ liệu ban đầu Phân Tích Các Báo Cáo 1 File / 1 Lần Phân Tích Các Báo Cáo Nhiều File / 1 Lần
NGUYEN DUC NGOC | Language

Date: 03/05/2024

Giới thiệu về các phân tích báo cáo

A. Làm sạch dữ liệu

Bằng các công cụ làm sạch của pandas xử lý các ô số liệu bị thiếu

1, Dữ liệu ban đầu có thể chứa các ô bị thiếu số liệu. ( đối với các ô dạng object ( text) thì không xét tới ở đây)
Cho nên để tiến hành xử lý chính xác dữ liệu thì cần phải làm sạch
Pandas cung cấp các công cụ mạnh mẽ để thực hiện làm sạch dữ liệu
Đối với kinh nghiệm và kiến thức đã học được, tôi xin được giới thiệu 6 cách đề làm sạch dữ liệu số bị khuyết thiếu
Cách 1, Xóa cột bị thiếu
Cách 2, Xóa dòng bị thiếu
Cách 3, Lấy giá trị trung bình của cột
Cách 4, Lấy giá trị trung vị của cột
Cách 5, Lấy giá trị kề trên
Cách 6, Lấy giá trị kề dưới

2, Hãy vào link https://nguyenducngoc.pythonanywhere.com/clean-file để thực hiện thử các cách ở trên.
Bằng công cụ có sẵn của pandas mà dữ liệu được xử lý chính xác và nhanh chóng.Bạn có thể tải về file sau khi được làm sạch để so sánh

B. Phân tích dữ liệu

Sau khi dữ liệu được làm sạch, pandas cũng cung cấp rất nhiều các công cụ để tiến hành phân tích

Hãy vào link https://nguyenducngoc.pythonanywhere.com/report-full để thực hiện thử phân tích dữ liệu
Hãy post file đã được làm sạch của bạn lên ( khuyến nghị để có kết quả chính xác nhất) và chọn các phân tích mà bạn muốn như ở form
Chọn truy vấn để nhận được kết quả ở một tab mới
Bạn có thể tiến hành 1 hoặc nhiều hoặc là toàn bộ các truy vấn tới dữ liệu của bạn

C.Phân tích báo cáo với 1 file / 1 lần tải

Báo cáo về thị trường xe hơi hàng tháng

1, Dữ liệu được sử dụng được tải ở trang : https://www.kaggle.com/datasets/toramky/automobile-dataset
Sau khi tải dữ liệu ở trên về , hãy giải nén file zip để thấy được file data dưới dạng file .csv

2, Hãy vào link https://nguyenducngoc.pythonanywhere.com/upload-1file để upload file Automobile Dataset
Ở phần Name, trang chỉ chấp nhận 1 trong 3 tên để thực hiện phân tích: xinh, ngoan, tuoi
Các trường hợp tên khác sẽ hiển thị User không được xác thực và sẽ không thực hiện phân tích
Click vào Show kết quả để thấy kết quả phân tích báo cáo.
File tải lên được phân tích tự động bằng thư viện python-pandas

D. Kết luận

Hãy vào link https://nguyenducngoc.pythonanywhere.com/ để tìm hiểu và thực hiện phân tích dữ liệu của bạn một cách nhanh chóng và chính xác nhât
Bạn có thể cho tôi biết thêm các yêu cầu của bạn thông qua comment facebook ở phía dưới
Chúc bạn thành công