

同一公司在 Europages、Kompass、本土黄页 各出现一次 → 跨平台合并时重复
同一公司 用不同拼写登记(ABC Ltd / ABC Limited / ABC GesmbH)→ 系统无法自动合并
同一集团 不同分公司/不同品牌页 指向同一总部 → 人为判断是否去重
付费导出时常带多条相同记录(多地址分支)→ 需按主键去重
第1步:统一采集关键字段
黄页找到客户后,表格至少记:
| 公司全名 | 官网域名 | 国家 | 城市 | 电话 | 邮箱 | 来源黄页 |
例:ABC Hardware GmbH | abchardware.de | Germany | Hamburg | +49-40-xxx | info@abchardware.de | GelbeSeiten
第2步:用"官网域名"做主键去重(最准)
同一家公司不同黄页基本官网一样
Excel 选中 域名列 → 数据 → 删除重复值(Remove Duplicates),勾选仅域名列
留下第一条完整记录,其余删掉
⚠️ 无官网的小企业用【公司名标准化+城市】去重:把 ABC Ltd / ABC Limited 统一改成 ABC Ltd,再按 标准化名+城市 去重。第3步:人工核查相似名
搜索或排序查看近似名:
Smith & Sons Wholesalevs Smith & Sons Ltd
Möbelhaus Müller GmbHvs Müller Möbelhandel GmbH
若电话/地址/域名一致→合并为一条
Kompass / Europages Premium 导出 CSV 后:
打开 Excel → 数据 → 删除重复值
勾选 Company Name + Country 或 Website 做依据
优先用 Website(去 http://只留 domain.com再比)
无网站用 标准化公司名+国家
若有分公司不想合并,可加 City 字段一起判断
清洗小技巧:
新建列用公式提取纯域名:=SUBSTITUTE(SUBSTITUTE(LOWER(C2),"http://",""),"www.","")再取第一段
公司名列统一转小写、去标点(Ltd. → Ltd ,& → and 可视情况做)降低误判
Excel Power Query / WPS 智能去重:按域名或模糊匹配公司名
OpenRefine(免费):导入 CSV → 用 Cluster & Edit按键盘距离/指纹算法合并近似公司名(ABC Ltd ≈ ABC Limited),非常适合黄页多源合并
CRM(HubSpot / Zoho / Pipedrive):导入时开"按邮箱/域名去重",重复自动合并或标记
Dedupe.io / Dedupely:上传列表做模糊匹配去重(付费,适合千条以上)
同一集团不同独立法人(各国有独立 VAT 号)→ 建议保留分别开发,标注集团关系
同一品牌不同站点页(UK站/DE站)但同公司→ 按域名去重留总部那条
当你不确定是否同一家→先保留,备注"疑似重复待核"
