Claude Codeで営業リストの重複排除と表記ゆれ修正を自動化する方法|Google Sheets運用を壊さず整える
営業リストの重複排除や表記ゆれ修正を手作業で続けると、同じ会社が別名で残り、担当が重複し、CRM へ入れる前から更新が止まります。特に Google Sheets を正本にしているチームほど、関数やフィルタだけで吸収できない揺れが積み上がりがちです。
Claude Code は、この前処理を repeatable に整えるのに向いています。CSV やスプレッドシートの書き出しデータを読み、名寄せルール、正規化辞書、レビュー対象の条件をファイルで管理することで、「担当者の勘」で回っていた cleaning を運用資産に変えられます。
本記事のポイント
- Claude Codeは、営業リストの重複排除、表記ゆれ修正、列整形のルールをファイル化し、Google Sheets運用の前処理を repeatable に回しやすくする。
- Google Sheets 画面を直接触る段階は Claude Cowork や人手、書き出した CSV を正規化して名寄せルールを改善する段階は Claude Code、と分けると責任境界が明確になる。
- 名寄せの正解は会社名だけでは決まらないため、除外条件、正規化辞書、レビュー対象の条件を先に固定しないと運用が定着しない。
Claude Codeが向いている営業リスト cleaning とは
このテーマで Claude Code が強いのは、Google Sheets を直接クリックすることではなく、書き出した CSV をルールベースで整えることです。たとえば、株式会社表記の揺れ、部署名付き会社名、全角半角の差、同一メールドメインの複数表記といった「定義できる揺れ」は、ファイル処理に寄せた方が再現性が上がります。
| 判断軸 | Claude Code | Claude Cowork | 関数や手作業で残す場面 |
|---|---|---|---|
| 主な入力 | CSV、正規化辞書、除外ルール | ブラウザ、Google Sheets画面、ローカルGUI | 単発の軽い修正 |
| 向いている処理 | 重複候補抽出、会社名正規化、列整形 | 画面確認、権限設定、実入力 | 最終 merge 判断 |
| 再現性 | 高い。辞書と除外ルールを残せる | 中。画面手順に依存しやすい | 担当者依存になりやすい |
つまり、営業リストの前処理は Claude Code、その後に Google Sheets や CRM へ戻す段階は人手や Claude Cowork という切り分けが自然です。スプレッドシートの重複問題や スプレッドシートが壊れる運用 と合わせて見ると、どこで構造的に詰まっているかが見えやすくなります。
先に固定したい入力と出力の型
名寄せで最初に決めるべきなのは、アルゴリズムより「何を正本とするか」です。最低限、元データ、正規化辞書、除外ルール、出力の4つを分けるだけで、レビューのやり方がかなり楽になります。
| ファイル | 役割 | 最低限入れる項目 |
|---|---|---|
lead-export.csv | 元データ | 会社名、担当者、メール、電話、流入元 |
normalization-rules.md | 正規化ルール | 法人格の扱い、全角半角、略称ルール |
company-alias.csv | 辞書 | 正規名、別表記、NGパターン |
cleaned-leads.csv | 出力 | canonical_company、duplicate_group、review_flag |
ここで重要なのは、「何を同一企業とみなすか」を先に決めることです。会社名だけでなく、URL、ドメイン、担当者の所属、既存 CRM の account_id をどう見るかまで決めないと、cleaning の精度は安定しません。Google Workspace CRM や 活動ログ設計 と接続するなら、出力列はそのまま転記できる粒度に寄せるべきです。
重複判定と表記ゆれ修正の考え方
営業リストの cleaning は、完全自動化より「人が見直す候補を減らす」方向で設計した方が実務向きです。たとえば、次のように判定を分けるとレビュー対象が絞れます。
| 判定 | 条件の例 | 出力 |
|---|---|---|
| auto-merge | 法人格差だけ、同一ドメイン、同一電話 | canonical_company を自動付与 |
| review | 略称一致、住所一致、担当者違い | review_flag を付与して確認対象に送る |
| keep-separate | 子会社や別部門の可能性が高い | 別レコードとして残す |
この分類があると、営業リード選別 の前段も整えやすくなります。cleaning が崩れている状態で優先度付けをしても、同一企業へ違う next action が付くので、後工程が壊れます。
実装イメージは「シート修正」ではなく「正規化バッチ」
失敗しやすいのは、Claude Code に直接シートを書き換えさせようとすることです。実務では、まず書き出しデータで正規化を回し、レビュー後にシートへ戻す方が安全です。
lead-cleaning/
input/
lead-export.csv
company-alias.csv
rules/
normalization-rules.md
output/
cleaned-leads.csv
review-candidates.csv
依頼は「lead-export.csv を読み、company-alias と normalization-rules に従って canonical_company を付与し、review が必要な行は review-candidates.csv へ分けて」とする方が安定します。レビュー対象を分ける設計にすると、名寄せの責任境界も保ちやすくなります。
人が確認する境界を決めておく
営業リスト cleaning で最も危険なのは、同じ会社だと思って勝手に統合することです。次の3点は最初から人が見る前提で固定します。
| 確認ポイント | 人が見る理由 | 固定すべきこと |
|---|---|---|
| 子会社 / 部門違い | 会社名が近くても営業対象が別の場合がある | 別管理にする条件 |
| 既存 CRM の account_id | 既存取引との衝突を避ける必要がある | CRM正本との照合ルール |
| review_flag 条件 | 自動統合のしすぎを防ぐ | 人が必ず見る条件 |
この境界を決めないと、cleaning は進んでも営業現場が信用しません。権限設計や 営業管理の設計まで見ておくと、誰がどこまで触るべきかが見えます。
よくある質問
Google Sheets の関数だけでは足りませんか?
軽い整形なら足ります。ただ、辞書ファイル、除外ルール、review 分離まで含めると、Claude Code で前処理した方が再現性を持ちやすいです。
Claude Code だけでシート更新まで完結させるべきですか?
最初からは勧めません。まずは cleaned CSV を安定して出し、レビュー後に Google Sheets へ戻す方が安全です。
CRM がある場合も Google Sheets cleaning は必要ですか?
必要な場面があります。特に展示会や営業リスト購入後の一時データは、CRM に入れる前の前処理がないと重複が増えやすいです。
どのくらいの件数から意味がありますか?
数百件でも十分意味があります。件数より、担当者ごとに正規化ルールが違っている状態を止められるかが重要です。
関連ページと関連記事
営業リスト cleaning は、スプレッドシート運用、CRM設計、営業リード選別と一緒に見ると運用が崩れにくくなります。
- スプレッドシートの重複を減らす方法:重複管理の基本論点を確認できます。
- Googleスプレッドシート運用が壊れる理由:前処理なしで運用が崩れる構造を整理できます。
- スプレッドシートの権限設計:誰が cleaning 結果を戻すかの責任分界に関わります。
- Claude Codeで営業リード選別を自動化する方法:cleaning 後の優先度付けをつなげて見られます。
- Google Workspace CRMの考え方:正規化したデータをどこへ置くかを検討できます。
営業リストの整備を運用へ載せたい場合
名寄せルール、Google Sheets、CRM 前処理まで含めて現場運用を整えたい場合は、相談ページから状況を共有できます。