Thật khó để tưởng tượng rằng bạn mở một tờ báo hoặc tạp chí mà không thấy một số biểu đồ thanh hoặc biểu đồ cho bạn biết về số người hút thuốc ở các nhóm tuổi nhất định, số ca sinh mỗi năm, v.v. Đó là một cách tuyệt vời để mô tả sự thật mà không cần phải sử dụng quá nhiều từ, nhưng mặt trái của chúng cũng có thể được sử dụng để thao túng hoặc nói dối với số liệu thống kê. Họ cung cấp cho chúng tôi thông tin định lượng về nhiều chủ đề. Biểu đồ thanh và biểu đồ cột cho chúng ta thấy rõ thứ hạng của các chính trị gia hàng đầu của chúng ta. Họ cũng thông báo về hậu quả của hành vi nhất định. hút thuốc hay không hút thuốc. Ưu điểm và nhược điểm của các hoạt động khác nhau. Phân phối thu nhập, v.v. Một mặt, chúng đóng vai trò là nguồn thông tin để chúng ta thấy được suy nghĩ và hành động của chính mình trong sự so sánh thống kê với những người khác, mặt khác, chúng – bằng cách nhận thức chúng – thay đổi suy nghĩ và hành động của chúng ta trong nhiều trường hợp.
Tuy nhiên, chúng tôi chủ yếu quan tâm đến cách tạo biểu đồ và biểu đồ trong chương này. Một cách tuyệt vời để tạo các biểu đồ như vậy là sử dụng Python kết hợp với Matplotlib
một biểu đồ là gì? . Đó là biểu diễn đồ họa về phân bố tần số của một số dữ liệu số. Hình chữ nhật có chiều rộng bằng nhau có chiều cao với các tần số liên quan
Nếu chúng tôi xây dựng một biểu đồ, chúng tôi bắt đầu với việc phân phối phạm vi của các giá trị x có thể thành các khoảng hoặc các khoảng hoặc ngăn liền kề có kích thước bằng nhau
Bây giờ chúng ta bắt đầu với một chương trình Python thực tế. Chúng tôi tạo một biểu đồ với các số ngẫu nhiên
import matplotlib.pyplot as plt import numpy as np gaussian_numbers = np.random.normal(size=10000) gaussian_numbers
ĐẦU RA
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
plt.hist(gaussian_numbers) plt.title("Gaussian Histogram") plt.xlabel("Value") plt.ylabel("Frequency") plt.show()
Chúng ta đã thấy rằng hàm hist (thực ra là matplotlib. pyplot. hist) tính toán các giá trị biểu đồ và vẽ biểu đồ. Nó cũng trả về một bộ ba đối tượng (n, bins, patch)
n, bins, patches = plt.hist(gaussian_numbers)
n[i] chứa số giá trị của số gaussian nằm trong khoảng có ranh giới bins [i] và bins [i + 1]
print("n: ", n, sum(n))
ĐẦU RA
n: [ 4. 27. 278. 1152. 2647. 3120. 1968. 650. 138. 16.] 10000.0
Vì vậy, n là một mảng tần số. Giá trị trả về cuối cùng của hist là danh sách các bản vá, tương ứng với các hình chữ nhật với các thuộc tính của chúng
print("patches: ", patches) for i in range(10): print(patches[i])
ĐẦU RA
patches: Rectangle(xy=(-4.27293, 0), width=0.810195, height=4, angle=0) Rectangle(xy=(-3.46274, 0), width=0.810195, height=27, angle=0) Rectangle(xy=(-2.65254, 0), width=0.810195, height=278, angle=0) Rectangle(xy=(-1.84235, 0), width=0.810195, height=1152, angle=0) Rectangle(xy=(-1.03215, 0), width=0.810195, height=2647, angle=0) Rectangle(xy=(-0.221955, 0), width=0.810195, height=3120, angle=0) Rectangle(xy=(0.58824, 0), width=0.810195, height=1968, angle=0) Rectangle(xy=(1.39844, 0), width=0.810195, height=650, angle=0) Rectangle(xy=(2.20863, 0), width=0.810195, height=138, angle=0) Rectangle(xy=(3.01883, 0), width=0.810195, height=16, angle=0)
Hãy xem xét kỹ hơn các giá trị trả về. Để tạo mảng biểu đồ gaussian_numbers được chia thành các khoảng bằng nhau, tôi. e. các “thùng”. Các giới hạn khoảng thời gian được tính toán bởi hist được lấy trong thành phần thứ hai của bộ giá trị trả về. Trong ví dụ của chúng tôi, chúng được biểu thị bằng biến bins
________số 8
ĐẦU RA
n: [ 4. 27. 278. 1152. 2647. 3120. 1968. 650. 138. 16.] 10000.0 bins: [-4.27293135 -3.46273611 -2.65254087 -1.84234562 -1.03215038 -0.22195514 0.58824011 1.39843535 2.2086306 3.01882584 3.82902108] 0.8101952436745292 0.8101952436745292 0.8101952436745288 0.8101952436745292 0.8101952436745292 0.8101952436745288 0.8101952436745297 0.8101952436745288 0.8101952436745288 0.8101952436745297 patches: Rectangle(xy=(-3.46274, 0), width=0.810195, height=27, angle=0) Rectangle(xy=(-2.65254, 0), width=0.810195, height=278, angle=0)
Hãy tăng số lượng thùng. 10 thùng không phải là nhiều, nếu bạn tưởng tượng rằng chúng tôi có 10.000 giá trị ngẫu nhiên. Để làm như vậy, chúng tôi đặt tham số từ khóa bins thành 100
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
0
(adsbygoogle = window.adsbygoogle || []).push({});
Indem wir den Định hướng tham số auf vertical setzen, können wir das Histogramm auch seitwärts ausgeben
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
1
Một tham số từ khóa quan trọng khác của lịch sử là mật độ, thay thế tham số định mức không dùng nữa. Nếu được đặt thành true, thành phần đầu tiên – tức là tần số – của bộ giá trị trả về được chuẩn hóa để tạo thành mật độ xác suất, i. diện tích (hoặc tích phân) dưới biểu đồ tạo nên tổng 1
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
2
ĐẦU RA
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
3
Nếu cả hai tham số ‘mật độ’ và ‘xếp chồng’ được đặt thành ‘True’, thì tổng biểu đồ được chuẩn hóa thành 1. Với các tham số edgecolor và color chúng ta có thể xác định màu của đường và màu của các bề mặt
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
4
Được rồi, bạn muốn xem dữ liệu được mô tả dưới dạng biểu đồ giá trị tích lũy?
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
5
Lô đất
Bây giờ chúng ta đến với một trong những loại biểu đồ được sử dụng phổ biến nhất, nổi tiếng ngay cả với những người không phải là nhà khoa học. Biểu đồ thanh bao gồm các hình chữ nhật vuông góc với trục x và tăng lên giống như các cột. Chiều rộng của hình chữ nhật không có ý nghĩa toán học
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
6
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
7
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
8
Đào tạo Python trực tiếp
Thưởng thức trang này?
Nhìn thấy. Tổng quan về các khóa học Python trực tiếp
đăng ký tại đây
Barplots với Ve tùy chỉnh
array([ 0.13541263, -0.23671488, -0.0991283 , ..., -1.26408285, 0.0923674 , 1.49284271])
9
Tệp ‘dữ liệu/GDP. txt’ chứa danh sách các quốc gia, GDP và số lượng dân số năm 2018 ở định dạng sau
1 Hoa Kỳ 20.494.050 326.766.748
— Liên minh Châu Âu 18.750.052 511.522.671 2 Trung Quốc 13.407.398 1.415.045.928 3 Nhật Bản 4.971.929 127.185.332
4 Đức 4.000.386 82.293.457
5 Vương quốc Anh 2.828.644 66.573.504 6 Pháp 2.775.252 65.233.271
7 Ấn Độ 2.716.746 1.354.051.854 8 Ý 2.072.201 59.290.969 9 Brazil 1.868.184 210.867.954
10 Ca-na-đa 1.711.387 36.953.765
11 Nga 1.630.659 143.964.709 12 Hàn Quốc 1.619.424 51.164.435 13 Tây Ban Nha 1.425.865 46.397.452
14 Úc 1.418.275 24.772.247
15 Mexico 1.223.359 130.759.074 16 Indonesia 1.022.454 266.794.980 17 Hà Lan 912.899 17.084.459 18 Ả Rập Saudi 782.483 33.554.343 19 Thổ Nhĩ Kỳ 766.428 81.916.871
20 Thụy Sĩ 703.750 8.544.034
Tạo một biểu đồ thanh với GDP danh nghĩa bình quân đầu người
plt.hist(gaussian_numbers) plt.title("Gaussian Histogram") plt.xlabel("Value") plt.ylabel("Frequency") plt.show()
0
Biểu đồ thanh dọc (Biểu đồ đường)
plt.hist(gaussian_numbers) plt.title("Gaussian Histogram") plt.xlabel("Value") plt.ylabel("Frequency") plt.show()
1
Đào tạo Python trực tiếp
Thưởng thức trang này?
Nhìn thấy. Tổng quan về các khóa học Python trực tiếp
(adsbygoogle = window.adsbygoogle || []).push({});
Các khóa học trực tuyến sắp tới
Python dành cho kỹ sư và nhà khoa học
Phân tích dữ liệu với Python
đăng ký tại đây
Biểu đồ thanh được nhóm
Cho đến nay, chúng tôi đã sử dụng trong các biểu đồ thanh của mình cho mỗi nhóm phân loại một thanh. Tôi. e. , đối với mỗi quốc gia trong ví dụ trước, chúng tôi có một thanh cho “GDP bình quân đầu người” của một năm. Chúng ta có thể nghĩ về một biểu đồ biểu thị các giá trị này cho các năm khác nhau. Điều này có thể được thực hiện với các biểu đồ thanh được nhóm. Biểu đồ thanh được nhóm chứa hai hoặc nhiều thanh cho mỗi nhóm phân loại. Các thanh này được mã hóa màu để đại diện cho một nhóm cụ thể. Ví dụ: chủ doanh nghiệp, điều hành dây chuyền sản xuất với hai sản phẩm chính có thể tạo biểu đồ thanh được nhóm với các thanh màu khác nhau để thể hiện từng sản phẩm. Trục hoành sẽ hiển thị các tháng trong năm và trục tung sẽ hiển thị doanh thu
plt.hist(gaussian_numbers) plt.title("Gaussian Histogram") plt.xlabel("Value") plt.ylabel("Frequency") plt.show()
2
Tập thể dục
Tệp dữ liệu/german_election_results. txt chứa bốn kết quả bầu cử của Đức
Tạo biểu đồ biểu đồ thanh với dữ liệu
plt.hist(gaussian_numbers) plt.title("Gaussian Histogram") plt.xlabel("Value") plt.ylabel("Frequency") plt.show()
3
Chúng tôi thay đổi mã trước đó bằng cách thêm từ điển sau
plt.hist(gaussian_numbers) plt.title("Gaussian Histogram") plt.xlabel("Value") plt.ylabel("Frequency") plt.show()
4
Chúng tôi cũng thay đổi cách tạo mã vạch bằng cách gán giá trị màu cho tham số ‚color’
plt.hist(gaussian_numbers) plt.title("Gaussian Histogram") plt.xlabel("Value") plt.ylabel("Frequency") plt.show()
5
Bây giờ chương trình hoàn chỉnh với màu sắc tùy chỉnh
plt.hist(gaussian_numbers) plt.title("Gaussian Histogram") plt.xlabel("Value") plt.ylabel("Frequency") plt.show()
6
Biểu đồ thanh xếp chồng lên nhau
Có thể sử dụng các biểu đồ thanh xếp chồng lên nhau để thay thế cho biểu đồ thanh được nhóm
Biểu đồ thanh xếp chồng chồng lên nhau các thanh đại diện cho các nhóm khác nhau. Chiều cao của thanh kết quả hiển thị kết quả tổng hợp hoặc tổng của các nhóm riêng lẻ
Biểu đồ thanh xếp chồng lên nhau là tuyệt vời để mô tả tổng số và đồng thời cung cấp chế độ xem các phần riêng lẻ có liên quan như thế nào đến tổng số
Biểu đồ thanh xếp chồng không phù hợp với tập dữ liệu trong đó một số nhóm có giá trị âm. Trong những trường hợp như vậy, biểu đồ thanh được nhóm là lựa chọn tốt hơn
Bạn đang đọc : Thêm nhãn dữ liệu vào biểu đồ trong python được cập nhập bởi Tekmonk
Thông tin và kiến thức về chủ đề Thêm nhãn dữ liệu vào biểu đồ trong python do Học viện Công nghệ Tekmonk chọn lọc và tổng hợp cùng với các chủ đề liên quan khác.
Tham khảo thêm các khóa học công nghệ đỉnh cao tại: Học viện công nghệ Tekmonk
Nguồn: Internet
Có thể bạn muốn biết: