📊 数据处理

合并多个 Excel 表格

将多个 Excel 或 CSV 文件合并为一个统一的表格,自动处理表头和数据对齐

★★☆ 中级 10-15 min 2025年1月12日

概述

在处理数据时,经常需要合并来自不同来源、不同时间段的多个表格文件。Claude 可以帮你自动合并这些文件,处理表头差异、数据对齐等问题,生成统一的汇总表格。

适用场景

  • 合并每月的销售数据表
  • 汇总多个部门提交的数据
  • 整合不同来源的调查问卷结果
  • 合并拆分的大型数据集

操作步骤

1

检查文件一致性

先分析要合并的文件是否结构一致。

请检查 ~/data/sales 文件夹中所有 Excel 文件:

  • 列出所有文件名和大小
  • 检查每个文件的列名是否一致
  • 统计每个文件的行数
  • 识别数据类型差异
  • 报告是否可以直接合并
2

简单合并

合并结构完全相同的文件。

请将 ~/data/sales 文件夹中的所有 .xlsx 文件合并:

  • 所有文件具有相同的列结构
  • 保留第一个文件的表头,其他文件跳过表头行
  • 输出到 ~/data/sales_merged.xlsx
  • 添加一列”来源文件”标注每行数据来自哪个文件
3

处理列差异

合并列名不完全相同的文件。

文件的列名略有差异,请智能合并:

  • 识别意义相同但名称不同的列(如”姓名”和”Name”)
  • 对于缺失的列,填充空值
  • 对于额外的列,也包含在输出中
  • 生成列映射报告,显示如何处理每个列
4

按条件合并

只合并符合特定条件的数据。

合并 ~/data/reports 中的所有 CSV 文件,但:

  • 只包含”状态”列为”已完成”的行
  • 过滤掉空行和重复行
  • 按”日期”列排序
  • 输出为 ~/data/completed_reports.csv
5

添加汇总信息

在合并文件中添加统计信息。

合并数据后,请在新工作表中添加汇总:

  • 每个源文件贡献的行数
  • 按类别统计的总数
  • 日期范围
  • 关键数值字段的求和、平均值 创建一个包含”原始数据”和”汇总”两个工作表的 Excel 文件

合并大量文件可能耗时较长且占用内存。建议先在小范围测试,确认合并逻辑正确后再处理全部文件。

如果需要定期合并文件,可以让 Claude 创建一个脚本,只需双击运行即可自动完成合并任务。

常见问题

Q: 合并后 Excel 文件打不开怎么办? A: 可能是文件过大超出 Excel 限制(约100万行)。可以考虑分批合并,或输出为 CSV 格式。

Q: 日期格式不统一怎么处理? A: 告诉 Claude 识别常见日期格式(如 2024-01-01、01/01/2024 等),统一转换为标准格式后再合并。

Q: 可以合并不同格式的文件吗? A: 可以。Claude 可以同时处理 .xlsx、.xls、.csv 等不同格式,统一合并为指定格式输出。