การเชื่อมโยงข้อมูล
การเชื่อมโยงข้อมูล (Data Merging) คือการรวมข้อมูลจากหลายแหล่งเข้าด้วยกันเพื่อวิเคราะห์หรือสร้างชุดข้อมูลที่สมบูรณ์ขึ้น Pandas มีฟังก์ชันสำคัญสำหรับการเชื่อมโยงข้อมูล เช่น concat
และ merge
1. การรวมข้อมูลด้วย concat
:
ใช้สำหรับต่อข้อมูลในแนวแถว (Row) หรือแนวคอลัมน์ (Column)
import pandas as pd
# ตัวอย่างข้อมูล
df1 = pd.DataFrame({"Name": ["John", "Mary"], "Score": [90, 85]})
df2 = pd.DataFrame({"Name": ["Anna", "Tom"], "Score": [88, 80]})
# รวมข้อมูลในแนวแถว
result = pd.concat([df1, df2])
print(result)
2. การเชื่อมโยงข้อมูลด้วย merge
:
ใช้สำหรับรวมข้อมูลที่มีคอลัมน์ร่วมกัน
# ตัวอย่างข้อมูล
df1 = pd.DataFrame({"ID": [1, 2], "Name": ["John", "Mary"]})
df2 = pd.DataFrame({"ID": [1, 2], "Subject": ["Math", "Science"]})
# เชื่อมข้อมูล
result = pd.merge(df1, df2, on="ID")
print(result)
การทำให้ข้อมูลเป็นรูปภาพ (Data Visualization)
การแสดงข้อมูลในรูปแบบกราฟช่วยให้เข้าใจข้อมูลได้ง่ายและรวดเร็ว ไลบรารี Matplotlib และ Seaborn เป็นเครื่องมือสำคัญสำหรับการทำกราฟใน Python
ตัวอย่างการสร้างกราฟด้วย Matplotlib:
import matplotlib.pyplot as plt
# ข้อมูล
names = ["John", "Mary", "Anna"]
scores = [90, 85, 88]
# กราฟแท่ง
plt.bar(names, scores)
plt.title("Scores of Students")
plt.xlabel("Names")
plt.ylabel("Scores")
plt.show()
ข้อดีของการเชื่อมโยงข้อมูลและการทำให้เป็นรูปภาพ
- ช่วยให้การวิเคราะห์ข้อมูลครอบคลุมและเข้าใจง่าย
- การทำให้เป็นรูปภาพช่วยสื่อสารข้อมูลได้ชัดเจนและมีประสิทธิภาพ
- Pandas และ Matplotlib ช่วยลดความซับซ้อนของการจัดการข้อมูลจำนวนมาก
สรุปท้ายใบความรู้
การเชื่อมโยงข้อมูลช่วยให้การจัดการและวิเคราะห์ข้อมูลจากหลายแหล่งง่ายขึ้น ในขณะที่การทำให้ข้อมูลเป็นรูปภาพช่วยให้การนำเสนอข้อมูลมีความชัดเจนและน่าสนใจ การเรียนรู้ทั้งสองกระบวนการนี้เป็นทักษะสำคัญที่ช่วยให้นักเรียนสามารถจัดการและสื่อสารข้อมูลได้อย่างมีประสิทธิภาพ