AIが「識別」「予測」「実行」を行う上でデータが必要だが、紙しかない場合はどうするのか。よくある話であるが、この場合、業務フローを改善してデータをデジタル化する方法を模索しなければならない。地道な業務の整理とデジタル化のための業務プロセスの再設計が必要なのだ。DXを目指す企業が最初に直面する課題といっても良い。では、実際にAIモデルをつくる上で必要と思われるデータが用意できたとして、どうやってAIをつくるのか。
まず、AIで解決したい課題を設定して、用意できたデータを俯瞰してみると「これはいけるでしょう」とか、「これは難易度が高そうなのでいろいろ試行錯誤が必要でしょう」とか、ざっくりとした感じは分かる。とはいえ、「これだけやれば大丈夫です」ということはプロでも分からない。直観よりも早くできることもあれば、時間がかかることもある。また、理論上はできると考えても、結果的に「できませんでした」ということもあり得るのだ。
そのため、ウォーターフォール型の開発はできない。アジァイル型で試行錯誤を繰り返すことになるのである。一般的にAIで解決したい課題を設定してから、最終的に何を目指すか決めるのに1カ月ほどの期間を要することが多い。
次に対象となるデータを全て集めて内容を詳しく確認するのだが、ここでも1カ月ほどの期間がかかる。「用意したデータを全て入れてみます」的なことをすると収拾がつかずに大変なことになることが多いので、前提条件を満たすのかをチェックしていくのである。その上で、機械学習モデルで用いる型に変換して、適切と考えるアルゴリズムに投入するのだが、この学習自体は短期間で終わることが多い。
つまり、よくいうAIをつくっている時間というのは数日なのだ。そして、AIモデルの精度を検証してドキュメントに落とすことになる。このようにAIモデルの構築は、全体の8割以上が地道な作業で、3カ月ほどで上述の作業を一回転することなる。そして、このサイクルでモデルチューニングを繰り返し、最終的に自動化システムを完成させるのである。

AI技術に関する現状をまとめると、AIは「人間ほど正確ではないが、大量の処理を自動で実行することが可能」で、「入出力データの組から処理を自動でつくる道具」であり、「一般的に工数や予算は、AIモデルを作る部分ではなく、データの基礎処理に時間をかけた方が良い結果になることが多い」といえる。AIモデルの構築でPoCに終始してしまい、最終目的である自動化システム構築まで到達できなかったという話があるが、データの基礎処理に時間をかけることで回避できる、と考えている。

執筆者プロフィール

戸嶋 龍哉(トジマ タツヤ)
The ROOM4D 取締役
長岡技術科学大学で情報工学系、特に自然言語処理やデータ分析に関わる分野を専門として学ぶ。ドリコムでソーシャルゲーム分析に従事。その後、DATUM STUDIOに創業期から参画し、幅広い分野のAIモデル構築やシステム開発を経験。2019年8月、The ROOM4Dを共同で設立。
こちらの記事は「週刊BCN+」に掲載(2022/9/30 )しております。