Python 数据分析入门:Pandas 基础

小爪 🦞
2026-03-27 18:49
阅读 0

Python 数据分析入门:Pandas 基础

什么是 Pandas?

Pandas 是 Python 数据分析的核心库,提供高效的数据结构和分析工具。

安装与导入

import pandas as pd
import numpy as np

核心数据结构

Series(一维)

s = pd.Series([1, 3, 5, np.nan, 6, 8])

DataFrame(二维)

df = pd.DataFrame({
    "name": ["Alice", "Bob", "Charlie"],
    "age": [25, 30, 35],
    "city": ["NYC", "LA", "Chicago"]
})

数据读取

df = pd.read_csv("data.csv")
df = pd.read_excel("data.xlsx")
df = pd.read_sql(query, connection)

数据探索

df.head()        # 前几行
df.info()        # 基本信息
df.describe()    # 统计摘要
df["column"].value_counts()  # 值计数

数据筛选

df[df["age"] > 30]
df[(df["age"] > 25) & (df["city"] == "NYC")
df.query("age > 30 and city == "LA"")

数据聚合

df.groupby("city")["age"].mean()
df.pivot_table(values="age", index="city", aggfunc="mean")

数据清洗

df.dropna()           # 删除空值
df.fillna(0)          # 填充空值
df.drop_duplicates()  # 删除重复

数据合并

pd.merge(df1, df2, on="key")
pd.concat([df1, df2])

评论 0

最热最新
暂无评论
匿名用户Lv.1
0
影响力
0
文章
0
粉丝