Lens.orgのヒートマップ分析機能が便利なので同じようなツールを作ってみた。
今回は特許分類の分析用に作ったエクセルツールの話です。
Lens.orgでは、検索母集団についてIPCやCPCといった特許分類がどれだけ付与されたか集計してヒートマップとして表示するマップ機能があります。
この機能では下のように、特許分類のコードごとの文献数を、5列×n行のマスにコードの並び順で表示させることができます。また、ヒートマップとして文献数が多いほど濃い色に表示されるため主要な技術分野がどこにあるか分かりやすいです。また、オプションの設定をすることでIPC/CPCのセクションとサブグループ階層における分類の説明も表示できます。これにより、これを見るだけで検索母集団ではどんな技術分野への出願がされているか俯瞰することができ分かりやすいです。
このマップの検索条件:Lens Patent Search: applicant.name:("TAIWAN SEMICONDUCTOR MFG")
しかし、このマップにもいくつか弱点があると感じています。
①各マスに表示される4種の情報のうち、上から3段目に表示されるセクションの説明の繰り返しが多く加される情報として価値が低いこと、
②横方向が5列しか表示されないので横長の資料用に取り込んで使いにくいこと、
③英語表示なので英語が苦手な人には使いづらいし機械翻訳はできるものの誤訳のリスクがあること、
④Lens.orgのデータの仕様や精度について不明点があること、などです。
ということで、手元のデータでも同等のマップを作成できるようにChatGPTと相談してエクセルツールを作りました。
ここに示すマップでも母集団は上の母集団と同じで、上位100位まで表示しています。
構成としては、分類のコードと件数の組み合わせである2列のデータを貼り付けるとサブクラスとサブグループの説明を読み込み、50マス表示できるヒートマップのシート上に左上からコードの昇順に並べて表示します。
そして、マクロを実行することで件数が最も多いマスを赤色にし、最も少ないマスを白色にし、中間の値は件数が多いほど赤に近い色とするようにしています。
最初は1コード(1マス)を1セルにまとめたかったのですがエクセルの仕様上「セル内に表示された文字列のフォントサイズを行毎に変える」ことを自動化できませんでした。
しかたないので3行1列のセルを1マスとし、条件付き書式で色づけを実装しようとしたのですがコードと説明のセルに件数と同じ色を付けることができませんでした。
ということで1マス分の3行1列のセルに対応する件数の情報を読み込ませ、その値に基づいて1マス分のセルは同じ色にするようにChatGPTとマクロを作りました。
これなら、まあ合格ですかね。ということで完成しました。
このツールのよいところは、
①各マスにセクションではなくサブクラスの説明を入れているので情報量が多いこと、
②横方向に10列並べて表示されるので横長のパワーポイントのプレゼンなどにマップとして取り込んで使いやすいこと、
③日本国特許庁から入手した日本語の説明を入れているので翻訳不要で誤訳の心配がないこと、
④サブグループの説明をセルに全て読み込ませているのでセルの高さを変えればそれらを確認できること、
⑤上位10位については件数を太字にしているので重要な技術分類が分かりやすいこと、
などがあります。何より良いのはエクセルで作っているので自由にカスタマイズできる点とも言えます。そういう意味で、①についてはクラスの情報を入れてもよいし、②については5列バージョンを作っても良いかもしれません。これらをユーザが自由に設定できるようにしてもいいですね。
Lensのマップ機能との違いとして、グラデーションが赤から白までで幅が狭いとか、コード上位100件とか1000件表示できないというところはありますが、通常の使い方をするぶんには問題は無さそうです。
ということで、今回はChatGPTを使って作成したエクセルで特許分類のヒートマップ作成ツールを紹介しました。このようなツールを含め弊所では様々な特許情報分析の手法を用意しており、クライアントの要望に沿った分析手法の開発も行っています。
また、このような分析手法に関する個別指導・セミナーや、個別の分析プロジェクトについても対応可能です。ご相談などありましたら管理人の特許事務所のページからお知らせください。
よろしくお願いします。