人工知能
特許・情報フェアでは、この数年、多くのブースでの出展があり、見学者の人々の話題になっているテーマが
人工知能(AI:Artificial intelligence)です。
つまり人工知能(AI)を使った特許情報の分析や検索などのサービスです。私は実は特許情報の処理では、
あまりAIには期待していません。皆さんがせっかく盛り上がっているのに水を差すようで申し訳ないのですが、実用面ではちょっと気になります。
コンピュータを使った、囲碁や将棋が名人と言われる人と戦って勝利したといった話題がニュースに流れ、ある分野に特化したAIシステムは確実な進歩を遂げています。
多言語間の翻訳システムもこの数十年で飛躍的な進歩を遂げています。翻訳を手掛ける人の話ではAIを使った自動翻訳は相当のレベルに達して危機感があると言います。
特許・情報フェアの会場で、何人かのメーカまたはサービス提供者やユーザの人々とお話ししましたが、未だ良く分からないといった印象がほとんどでした。しかしユーザさんの中には特に知的財産業務を一人または少人数でこなさなくてはならない会社では大きな期待を以て熱心にデモを見て、説明を聞いていた人が少なくありません。
実は10年くらい前には、特許情報の概念検索システムが出展されていて、多くの企業にも導入されましたが、期待ほどの効果的なシステムでなかったことがあります。なぜ概念検索システムが話題ほど定着しなかったかは、検索結果を人が見て何故このヒットが探しているものに近いモノなのか疑問になる結果が出てきたからです。概念検索は文章全体の中での言葉の一致率が高いものが上位に出ますので、言葉の出現頻度が結果を大きく左右します。何で出てきたのだろうと思われるものも含まれるのです。
しかし、使いようで用語検索の補助システムとして使う分には良いのです。知人の中では今回のAIサービスブームは概念検索システムの再来だという人もいます。期待しすぎると同じ事になるのは同感です。
実は私は30年以上前に、全文検索システムの補助手段としてAI検索システムの開発を試みたことがあります。しかし検索ノウハウをAIシステムに知識として教え込むための整理に膨大な工数が取られるため断念しました。最近のAIシステムはディープラーニング機能を持ち、しかもコンパクトに処理できる発明も出てきています。例えば特開2018―132830号「ニューラルネットワーク構築方法、ニューラルネットワーク装置及びニューラルネットワーク装置更新方法」などです。
こうした学習技術を使うには的確な教師データが求められます。今回の出展の中では特許情報を全分野にわたり収録して教師データにしているケースが目立ちました。変な表現ですが、「味噌くそ」一緒のデータからディープラーニングできるのは、まだ無理だと思う次第です。ある程度分野を限定して、さらに検索ノウハウを加味できる仕組みが出来れば、実用的なシステムとしての実現性は早まると思います。良い教師に習わなくては、良いAIはできないと思うのです。