📊 数据处理

通讯录合并去重

合并多个来源的联系人信息,智能去重并补全缺失字段

★☆☆ 初级 10-15 min 2025年1月12日

概述

从手机、邮箱、社交媒体等多个来源导出的联系人常常有重复和冲突。Claude 可以智能合并这些联系人,去除重复,保留最完整的信息。

适用场景

  • 更换手机前整理通讯录
  • 合并工作和个人联系人
  • 清理重复的联系人条目
  • 补全联系人的缺失信息

操作步骤

1

导入并分析联系人

检查各个文件的联系人数量和格式。

请分析以下联系人文件:

  • ~/contacts/phone_contacts.csv
  • ~/contacts/email_contacts.csv
  • ~/contacts/linkedin_contacts.csv 显示每个文件的联系人数量、字段列表、数据完整性
2

识别重复联系人

找出可能是同一个人的记录。

基于以下规则识别重复联系人:

  • 电话号码完全相同(忽略格式差异)
  • 邮箱地址相同
  • 姓名高度相似(忽略大小写、空格) 将可能重复的联系人分组,每组显示:
  • 各个来源的信息
  • 信息完整度评分
  • 建议保留哪一条
3

智能合并字段

为每个人创建最完整的联系信息。

对于重复的联系人,请合并信息:

  • 优先使用非空字段
  • 电话号码统一格式后合并(可能有多个)
  • 邮箱合并(主邮箱和备用邮箱)
  • 地址、公司等信息选择最新的或最详细的
  • 添加”来源”字段标注信息来自哪里
  • 添加”最后更新”时间戳
4

标准化和清理

统一格式并清理无效数据。

请标准化联系人信息:

  • 电话号码格式:+86 XXX XXXX XXXX
  • 姓名首字母大写
  • 邮箱全部小写
  • 删除明显无效的联系方式(如 00000000)
  • 删除只有姓名没有任何联系方式的记录
5

导出合并结果

生成清理后的通讯录文件。

请生成两个文件:

  1. ~/contacts/merged_contacts.csv - 合并后的完整通讯录 按姓名拼音排序,包含所有字段
  2. ~/contacts/merge_report.txt - 合并报告
    • 原始联系人总数
    • 发现的重复组数
    • 最终联系人数量
    • 删除的无效记录数

合并通讯录前务必备份原文件!某些看似重复的联系人可能确实是不同的人(如同名同姓)。建议仔细检查合并建议后再确认。

可以要求 Claude 将合并后的通讯录转换为 vCard 格式(.vcf),方便直接导入到手机或邮箱应用。

常见问题

Q: 如何判断两个姓名相似的人是否是同一人? A: 除了姓名,Claude 会综合判断电话、邮箱、公司等信息。如果只有姓名相似但其他信息完全不同,会标记为可疑重复,需要人工确认。

Q: 可以保留所有来源的完整信息吗? A: 可以。可以要求 Claude 不删除任何信息,而是将同一人的多条记录合并为一条,用分号分隔多个电话号码和邮箱。

Q: 导入后通讯录应用显示异常怎么办? A: 可能是格式不兼容。告诉 Claude 你使用的应用(如 iOS 通讯录、Google Contacts),它会生成兼容的格式。