私は2005年からデータをビジネスに生かす仕事をしてきた。この連載では、「現状のAIでできること、できないこと」というテーマでビジネス面でのAI活用について記述したい。また、AIの未来についても簡単にふれたいと思う。

まず、AIについて定義したい。AIといっても人によって異なるイメージがあるからだ。AIに関係したニュースを見ても、将来の研究開発に関するAI、現在すでに実用化されているAI、また、おおよそAIとは無縁と思われる製品にAIという枕言葉が使われているものもある。今回、記述するAIは、ビジネスの世界でベテラン社員が行っていることを高度化・自動化するAIについてである。コンピューター上で人間と同様の知識を実現しようとするものだ。
では、ビジネスで役に立つAIとは何か。例えば、CMをどのように打てば効果が最大化できるのか、ある資源の来年の売買価値はいくらなのか、生産設備の最適化なパラメータの値はいくつか、などをコントロールするAIである。これは、社内である程度上手にやっている人がいることが前提となる。いい換えれば、その人が判断するために見ているデータがあるということだ。
データ分析屋の仕事は、データを生かしてビジネスに役立つものを作っていくことなので、役に立つデータが存在することが大前提になる。ここでよく問題になるのが、「データはあるのですがそれは紙なんです」とか、「それはPDFなんです」ということだ。また、暗黙知としての知見もある。数値を見つけて実装していくのがAIなので、実装ができないとモデルはつくれない。このようなケースでは、数値や知見をデータベース化していくという地道な作業が必要となる。データベース化ができなければ、AIはつくれないのである。
また、データは存在しても別の課題が発生する。それはデータには、「人の心の入っていないデータ」と「人の心が入っているデータ」がある点だ。
「人の心が入っていないデータ」とは、自然のデータや機械などのデータで、比較的簡単に分析ができる。正規分布の形をとっているからだ。
一方、「人の心が入っているデータ」は分析が難しい。これらは、人の判断が入っている恣意的なデータともいっても良い。売上予測をしようとしても、「この商品を売りたい」とか「この月の売り上げを確保したい」など、人の判断が入っていると予測が難しくなる。さらに、「人の心が入っているデータ」は欠損したりすることもある。都合の悪いデータは隠してしまうからだ。
このようなデータを前処理で利用できるように整えることはデータ分析屋の腕の見せ所だ。うまく整えることができないと役に立たないAIが出来上がってしまう。以上のことからもわかるように、データ分析屋の仕事は大変泥臭いものと言える。顧客と意見交換しながら、一緒に試行錯誤していくことで、初めて使えるデータが見つかる。それは、顧客と共感できるデータなのである。
繰り返しになるがAIは役に立つデータがないと動かない。経験と記憶から成功パターンを見つけた人の知能が必要なのだ。成果を出した人は答えを知っている。AIモデルの構築では、前処理が7割から8割を占めるというのは、こういったことが背景にある。上手に前処理ができれば、ビジネスに役立つAIがモデル化できるだろう。

最後に未来のAIについて簡単にふれたい。過去にAIの冬の時代といわれた時期がある。データがなかった時代である。90年代は机上の空論の時代であった。では、また冬の時代に戻るのか。答えはNOだ。AIはビックデータによる知識量の向上と機械学習による学習効率の向上で飛躍的な進歩を遂げた。今後はビッグデータをベースに、精度の高い機械学習が登場してくる。そして業界は、機械学習を進化させるエンジニアリング力の高いグローバルIT企業と、独自のノウハウによって広義の前処理や社会応用を行うデータ活用企業に二分化されていくだろう。
執筆者プロフィール

酒巻隆治(サカマキ リュウジ)
The ROOM4D 代表取締役
専門は人間が環境に残す各種行動・購買ログの解析。慶応義塾大学、同大学院で人工知能を専攻。東京大学大学院で博士号を取得。KDDI、楽天技術研究所、ドリコムを経てDATUM STUDIOを設立、売却を経験。2019年8月1日、The ROOM4Dを設立。
こちらの記事は「週刊BCN+」に掲載(2022/4/22 )しております。