CPCのリストを入手して分析に使えるようにする【Twitterで発信したTIPS】

2022/11/22のツイートの解説記事です。

CPCのリストの入手から特許情報分析に使えるようにするところまで解説していました。

まずは以下にアクセスしてBulk DATAを入手してください。
https://www.cooperativepatentclassification.org/cpcSchemeAndDefinitions/bulk

「CPC Title List (2023.05)」をダウンロードするとtxtのデータが入手できます。エクセルで開けばコードと説明が分かれたデータになります。

ダウンロードできるファイルは以下(この例では作成時の少し古いデータです)

ファイルの中身はこんな感じです。

エクセルに読み込むとこんな感じです。

全セクションのテキストを1つのエクセルに取込み、セクションの1文字をタブ名にしてください。

そして、いい感じの検索シートを作ったら完成です。

数式は以下のような形にします。indirect関数を使うことで説明をセクション毎のシートから読み取らせることができます。
=IF(ISERROR(VLOOKUP(A2,INDIRECT(LEFT(A2,1)&"!a:c"),3,0)),"",VLOOKUP(A2,INDIRECT(LEFT(A2,1)&"!a:c"),3,0))

読み込ませた英語のCPCを機械翻訳すると使いやすくなります。google spreadsheetsでは翻訳関数があるので便利です。
エクセルでも機械翻訳の関数をVBAで作れば翻訳させられますが、処理に時間がかかるので事前に翻訳した方がいい場合もあります。