📊 数据处理
合并多个 Excel 表格
将多个 Excel 或 CSV 文件合并为一个统一的表格,自动处理表头和数据对齐
★★☆ 中级 10-15 min 2025年1月12日
概述
在处理数据时,经常需要合并来自不同来源、不同时间段的多个表格文件。Claude 可以帮你自动合并这些文件,处理表头差异、数据对齐等问题,生成统一的汇总表格。
适用场景
- 合并每月的销售数据表
- 汇总多个部门提交的数据
- 整合不同来源的调查问卷结果
- 合并拆分的大型数据集
操作步骤
1
检查文件一致性
先分析要合并的文件是否结构一致。
请检查 ~/data/sales 文件夹中所有 Excel 文件:
- 列出所有文件名和大小
- 检查每个文件的列名是否一致
- 统计每个文件的行数
- 识别数据类型差异
- 报告是否可以直接合并
2
简单合并
合并结构完全相同的文件。
请将 ~/data/sales 文件夹中的所有 .xlsx 文件合并:
- 所有文件具有相同的列结构
- 保留第一个文件的表头,其他文件跳过表头行
- 输出到 ~/data/sales_merged.xlsx
- 添加一列”来源文件”标注每行数据来自哪个文件
3
处理列差异
合并列名不完全相同的文件。
文件的列名略有差异,请智能合并:
- 识别意义相同但名称不同的列(如”姓名”和”Name”)
- 对于缺失的列,填充空值
- 对于额外的列,也包含在输出中
- 生成列映射报告,显示如何处理每个列
4
按条件合并
只合并符合特定条件的数据。
合并 ~/data/reports 中的所有 CSV 文件,但:
- 只包含”状态”列为”已完成”的行
- 过滤掉空行和重复行
- 按”日期”列排序
- 输出为 ~/data/completed_reports.csv
5
添加汇总信息
在合并文件中添加统计信息。
合并数据后,请在新工作表中添加汇总:
- 每个源文件贡献的行数
- 按类别统计的总数
- 日期范围
- 关键数值字段的求和、平均值
创建一个包含”原始数据”和”汇总”两个工作表的 Excel 文件
合并大量文件可能耗时较长且占用内存。建议先在小范围测试,确认合并逻辑正确后再处理全部文件。
如果需要定期合并文件,可以让 Claude 创建一个脚本,只需双击运行即可自动完成合并任务。
常见问题
Q: 合并后 Excel 文件打不开怎么办? A: 可能是文件过大超出 Excel 限制(约100万行)。可以考虑分批合并,或输出为 CSV 格式。
Q: 日期格式不统一怎么处理? A: 告诉 Claude 识别常见日期格式(如 2024-01-01、01/01/2024 等),统一转换为标准格式后再合并。
Q: 可以合并不同格式的文件吗? A: 可以。Claude 可以同时处理 .xlsx、.xls、.csv 等不同格式,统一合并为指定格式输出。