DX推進におけるAI・データ活用プロジェクトの課題と取り組み方【後編】

  • HOME
  • DX推進におけるAI・データ活用プロジェクトの課題と取り組み方【後編】

DX推進の一環としてのAI・データ活用プロジェクトの推進について、NTTデータビジネスシステムズ、リアライズ(現:NTTデータ バリュー・エンジニア)、NTTデータ数理システムの3社がシステム開発、データマネジメント、AI活用のプロフェッショナルとしてそれぞれの観点からAI・データ活用プロジェクトの推進のポイントを話し合った対談の後編です。
前編では、DX推進の一環としてのAI・データ活用プロジェクトの進め方、組織作り・人材育成について話し合いました。前編の記事も併せてご覧ください。

後編では、具体的なタスクの推進に向けて、データの準備、AI・データ分析、業務への適用、運用の各フェーズの中での注意点を中心に議論を行っていきます。

写真左より

Profile:NTTデータビジネスシステムズ 村山 晴俊
第一システム事業本部 ITソリューション事業部 ITソリューション企画営業部 グループマネージャー
データ&アナリティクス領域のセールスマネージャーとして活動中。データ統合基盤の導入だけでなく、データマネジメントやBIを活用したデータ分析の支援などお客様のデータ活用の推進を支援している。
Profile:NTTデータビジネスシステムズ 下間 大輔
第一システム事業本部 コンサルティング部 グループマネージャー
データ活用をベースにした新規ビジネスの検討や既存ビジネスの差別化をコンサルタントという立場で活動中。全社的なデジタル構想として3-5年先のビジョン設定やありたい姿の検討、また各種施策のロードマップ等も支援している。
Profile:NTTデータ数理システム 多田 将志
営業部 グループリーダー
機械学習・数理最適化などのAI関連の技術を提供する同社で、技術者としてデータ分析・AI活用関連の業務を経て、同領域での営業活動に従事。機械学習ツールの導入やデータサイエンティスト育成支援などに伴走型で取り組む。
Profile:リアライズ 海老原 吉晶
マーケティング・営業本部 マーケティング&ブランディング担当部長
データマネジメントの専門会社である同社でマーケティングを担当。ビジネスにおけるデータ活用の意義と価値、それを実現するために必要なデータマネジメントの重要性をブログ、講演会、書籍出版を通じて発信している。

データの準備

具体的なタスクを進めるためにはデータの準備が重要ですが、データマネジメントの観点で進め方などありますか?

海老原 構想フェーズからしっかり取り組み、目的の確認、具体化・明確化を行うことは絶対に欠かせません。これらを行った後に、目的達成に必要なデータを洗い出します。その際、「データはある」ということが確認できたものの、実際にはデータの品質が不足していることがあります。たとえデータを管理する各種システムや基盤がしっかりしていても、データ品質の問題は起こり得ますので、データアセスメントを行うことが必要です。 当社のデータアセスメントは、項目に値が入っているか、ユニーク性があるか、規定値外の値が入っていないかなどのシンタックス分析に加え、項目の実値が趣旨と一致しているか、趣旨以外の値が存在していないかなどのセマンティック分析も行います。例えば、本来商品名が入るべきところに個人名など異なる情報が混入してしまうというようなことがあるのですが、このような問題はデータの中身の意味を確認しなければなりません。

品質に問題があるケースは多いのでしょうか?また、品質に問題がある場合はどのように対応するのでしょうか?

海老原 例えば顧客データなどでは、住所の表記ゆれや企業名の前株後株問題など色々な課題を含んでいることが多いです。
目的を果たせる品質に達していないケースでは、簡単に修正できるものはアセスメントに併せてデータクレンジングまで行ってしまうこともありますが、外部の人間では修正の判断が難しいケースでは、お客様側で判断いただかなければならない場合もあります。また、見つかった問題にアドホックに対応するだけでは将来的に同じ問題が起き続けてしまいますので、データマネジメントプロセスを見直し、データオーナー、データスチュワードを始めとしたデータガバナンス体制の整備を行う場合もあります。
AI・データ分析を実施したい、という方からするとなかなか進まなくてじれったいと思われることもあるかもしれませんが、データアセスメントはとても重要です。例えば外部から購入したデータでも間違いがあったり、内部のデータと結合する段階で問題が発生したりするというのはよくある話です。元データの品質が悪かったために、これまでお客様の中で実施してきた分析・BIの結果が、実は大きく間違っていた、ということもよくある話ですから、努力を無駄にしないためにもしっかりとアセスメントすることが重要です。

リアライズ
海老原

実際にデータの品質に問題があって苦労したエピソードなどはありますか?

海老原 最近よくある話なのですが、オンラインとオフラインの両方で商品を販売するビジネスを展開されていて、それらを連携して OMO(オンラインマージドオフライン)を実現しようとされているお客様がいました。UXを主軸にしたマーケット戦略を推進していく上で、オンライン・オフラインの垣根を意識せずにユーザーにあったコミュニケーションを提供するということを考えていました。実現のためにはオンラインとオフラインのシステムのデータ統合が必要になります。
データ統合と言っても、顧客データどうし、商品データどうしの統合であるため、簡単に結合できるだろうと甘い見通しで、データアセスメントを怠り、十分な検証を行わないまま進めてしまったところ、結果的にごく一部のデータしか結合できず、予算と納期の見直しが必要になってしまいました。
既存システムの残存による様々なリスクを2025年の崖と最近よく言いますが、こんなところにも「2025年の崖の手前の落とし穴」的なものがあるのだと気づかされました。ちなみに、この事例をベースにしたケーススタディをブログに書いていますので、ぜひご覧ください。

お客様に寄り添いたいのに…【前編】 ~気をつけろ、2025年の崖の手前には落とし穴があるぞ!シリーズ

オンラインとオフラインの融合が必要になるケースは最近多いと思いますが、データマネジメントの観点ではどちらを軸にするべきでしょうか?

海老原 オンライン・オフラインは1つの軸であり、現実にはどのようなビジネス戦略を意図しているかが重要になります。企業によっては中間的な通信販売やサブスクリプション型のサービス、さらにはグローバル展開など様々な戦略軸が考えられます。既存のデータ資産を活用しながら今後のビジネス戦略を見据えてデータの活用モデルを設計する必要があります。

一時期、きちんとデータを加工してデータウェアハウス(DWH)を作るのではなく、データレイクにどんどんローデータを貯めていこうという風潮もありましたが、このあたりはどのように考えるべきでしょうか?

海老原 データレイク、DWH、データマートなどは、各々の利用目的に応じた範囲で考えるものという前提を置いた方が良いと思います。ここでも利用目的が大事だと思っていまして、「何でもかんでもデータを格納しておく」のではなく、現在と将来求められるであろう目的から遡ってどのようなデータが必要か検討し、その上で必要なローデータであればデータレイクに格納するという考え方が良いと思います。実際そういったお客様が増えてきていますね。

村山 データ貯めているけども活用できていない、コストだけがかかる、というお客様もまだまだ多いですが、とりあえずなんでもかんでも貯めておけ、というのは最近の風潮だと変わってきているかなと思います。海老原さんのおっしゃる通りで、目的に沿ってデータをためていく重要性を認識しておられる方が増えてきたように思います。

NTTデータビジネスシステムズ
村山

海老原 重要な背景の1つとして、データのガバナンスやセキュリティを気にするお客様が増えているという点があると思います。大量のデータを集めたとしても、どの範囲のユーザーが利用できるのかが整理されていない状態だと、結局すぐには使えないデータになってしまったり、いたずらにセキュリティリスクの要因を増やしてしまったりします。

多田 当社は「こういう分析をするならこういうデータが必要ですよ」とお客様に伝えて、お客様側でデータを準備していただく場合が多いのですが、「データはあるのですぐに渡せます」と言われてから実際に渡してもらうまでに1か月以上かかるということは珍しくありません。社外に出せるデータ出せないデータ、いちいち個別の審査が必要になることも多いですからね。利用目的、利用可能なユーザーの範囲などがきちんと整理されてこのあたりのオーバーヘッドが小さくなると分析のサイクルを回すスピードも上がるので助かります。

AI・データ分析

データが準備できたら分析フェーズですね。このフェーズでの進め方のポイントはあるでしょうか?

多田 AIモデル作成、データ分析というタスクに閉じた範囲においても、何のための分析なのかという観点を常に意識することが重要です。これまでの構想フェーズで検討したタスクや目標を、分析のタスクと目標にブレイクダウンするという作業が求められます。やりたいことを予測やクラスタリングなどの分析タスクに落とし込み、業務的な目標を達成するための精度目標も併せて決めていきます。また、モデルの説明可能性、処理速度、実行するタイミングで使える最新データはどこまでかなど、実際の運用時の条件や制約を整理して、分析タスクとしての要件を洗い出していきます。
データ分析は試行錯誤で仮説検証を繰り返す作業と見ることもできますが、目的意識があいまいだと繰り返し作業の中で徐々にモデル作成やデータ分析が自己目的化されてしまい、業務で求められるものから遠ざかってしまいがちです。そもそも何を実現するためにAIモデル作成、データ分析を始めたのか、要件は緩和したり変更したりする余地があるのか、といったあたりを関連業務の担当者と分析者の間でしっかり意識合わせすることが重要です。

お客様側にも AI 等の知識が必要が必要になりそうですが、お客様のリテラシーとしてどこまで期待しているものでしょうか?

多田 具体的なタスクの話は現場よりの方と進めていくことが多いと思いますが、大半の方は、プログラミングやアルゴリズムなどの、AI・データサイエンスを実現する方法論に対する造詣はそこまで深くないのが実際です。当社の場合はお客様側に AI に対する技術的な知識を期待していません。具体的な分析結果をお見せしながら、我々が作ったモデルの概要や結果の解釈の仕方を説明しながら進めていきます。お客様自身が普段接している業務に関するデータから得られた分析結果ですと、細かい説明をほとんどしなくても本質的な理解に至ってしまうケースが多いのがとても印象的です。AI に対する技術的な理解よりは、業務理解や業務改善のための仮説への興味といった部分の方が重要かもしれません。
プロジェクトを通じてデータサイエンススキルそのものを強化したいというお客様も増えてきており、そのようなお客様向けにはデータサイエンス教育プランや当社ツールの活用で分析ノウハウをつけながら進めるような方法をご提案します。目の前の課題を解決すれば良いという方向けには、あまり教育という観点の話をせずに、お客様から業務知識を教わりながら当社が主導で進めます。
単に目の前の課題を解決したいという観点では全面的に当社側で進めてしまった方が早いと思いますが、今後のAIの内製化も見据えて底力を蓄えることも目的の1つだという場合もあります。どちらのお客様も最近非常に増えているのですが、どちらがいいとは当社からは一概には言えないところでして、お客様の希望をお伺いしながら、ご希望に沿う形でご提案しています。

NTTデータ数理システム
多田

AI に対する過度な期待、例えば「AIって勝手にどんどん賢くなるんでしょ?」みたいなものを抱いているお客様もいると思います。お客様との温度感の差などはありますか?

多田 「AIって勝手にどんどん賢くなるんでしょ?」という問いに対しては、一般的なモデルでは特別に追加学習機能を付けなければ勝手に賢くなることはない、という回答になりますね。結局のところただのプログラムですので、実装した内容やモデルの学習に用いたデータを超えたことを実現してくれるわけではありません。
しかし、単なるプログラムを超えた大きな期待をもっている方もいらっしゃるのは事実です。期待をしていただくのは AI を扱っている企業としてはとても喜ばしいこともある一方で、ボタンを掛け違えながらプロジェクトを進めることはとても危険なことです。今すぐ業務に適用するために使える AI、技術開発という観点で数年後の実用化に向けて取り組むには良いがすぐに業務運用するのは難しそうな AI、実現まで10年以上かかりそうな近未来の AI、一口でAIと呼ばれてニュースなどで取り上げられているものの中に実現難易度が大きく異なるものが混在しています。AI に対する夢を打ち砕く、というと聞こえが悪いかもしれませんが、実際のプロジェクトに対して、現状の AI に期待すべきことやレベル、現時点では AI ではなく人が継続して実施した方が良い点などを事例なども参考にしながら丁寧にお伝えします。

最近裾野が広がったということで、やりにくいお客様というのもいますか?

多田 「あまり詳しくないから全部丸投げでお願いします」みたいなご相談のされ方をすると難しいなと感じています。AIやデータ分析の技術的な部分に関しては当然当社で責任を持って対応するのですが、目標設定や結果の解釈の方向性などは業務的な観点が確実に必要になりますので、お客様とともに当事者意識を持ってプロジェクトに臨みたいと思っています。

海老原 完全に丸投げになってしまわないようにどうするか、ということですね。やる気がある部署から始めるというところにも通じますが、関係者が一貫して当事者意識を持っていけるようなプロジェクト推進がよいかなと思います。まずは初期の構想策定のところで目的をきちんと明確化するということ、そしてプロジェクトの途中結果をこまめに共有していくことが大事だと思います。共有の際には「実際のデータで客観的にファクトを見る」ということを意識しています。データを通じてお客様と一緒にビジネスの現場で何が起きているのかを探っていきます。DXプロジェクト推進のストーリーの一方で、データに基づいて現実に則した議論ができるように導くことで、現場の方も積極的に参画していただけるようになると思います。

業務への適用、運用について

AIモデルができた後に業務に適用するというフェーズでの注意点などはあるでしょうか?

多田 当社は、完成したモデルにちょっとした GUI をつけて、よりユーザーを拡大した業務 PoC の支援を行うというところまでお手伝いさせていただきます。業務やシステム連携の本番に向けて非常に重要なフェーズと考えています。ただ、いざ実業務、となった際に、特に大規模システム開発が必要な場合は当社だけだと難しいので、リアライズさんやビジネスシステムズさん、お客様のシステム部門や指定の SIer と連携してプロジェクトを進めることになります。現場の方とプロジェクトを進めてきた場合はここで一気に温度感が変わることも多いです。これまで和気あいあいと「解決できそう」と進んでいたプロジェクトも、セキュリティや運用にかかるコストやリソースの話など、当然ですが厳しい目で見られるようになります。よくある「情報システム部門と現場の壁」みたいな話になるのですが、現場主導で始めたプロジェクトの場合、データ連携やシステム連携の要件定義で苦戦することがままあります。
分析の観点の課題としては、再学習のタイミングをどのようにするか、再学習の範囲や対象データをどのように設定するかというのがポイントになります。作成した時点では精度が高かったモデルも、データの傾向が変わってしまうと精度が大きく下がってしまいますので、データの傾向がどの程度で変わるのか、あるいは変わったことをどのように検知するのかの検討が必要になります。このあたりはデータの内容やデータ取得方法によって適した方法が変わりますので、お客様と一緒に設計していきます。

海老原 データマネジメントの観点からは、業務やシステムへのデプロイから本番がスタートしデータのビジネス価値が生まれます。しかしデータは放っておくと陳腐化してしまうものですから、ビジネス価値を発揮し続けるには継続してメンテナンスしていける体制と仕組みが重要です。
お客様にそのパワーがない場合には、当社が運用を引き受けるケースもあります。お客様が内製で実施される場合においても、運用方針策定、運用設計、運用フロー作成など、データ品質維持のための体制・仕組み作りを支援しています。最近は特にデータガバナンスの相談も多いですし、データは日々変化していくものですから、作成して終わりでなく常に最新化する取り組み自体を設計することが重要と考えています。

成果の横展開という話も出てくるのでしょうか?

多田  現場での取り組みがうまくいきそうだという報告を上げても、全社的なDXの取り組みとかみ合わず「横展開はどうした!」と逆に怒られてしまって、先に分かっていれば違う動きができたはずと少し後悔することも正直ありました。

下間 現場目線でプロジェクトを進めていると、その範疇で最良の選択をするためにプロジェクト一丸となって頑張ることになりますから、横展開しにくくなりやすいですよね。
うまくコミュニケーションできていないと全社的な目論見が後出しになったりしがちなので、現場側から相談が来た場合には早めに全社的な方針との不整合がないかという点を確認したいですね。知らないところで同じような取り組みが複数走っていた、というのはかなりあるあるだと思います。 私たちは事業部門が知らない全社方針がないように、トップと現場のコミュニケーションをきちんと促しながら進めていくことを心がけています。

NTTデータビジネスシステムズ
下間

海老原 現場からスタートした案件は全社展開しにくい、というのはとても理解できます。下間さんがおっしゃったことに加えて、中長期計画作成の中で、横展開など、どこまでやるかというのをきちんと合意しないといけないですね。細かい話ではありますが、それによってガイドライン作成やマニュアル作成など、やるべきことが全然変わってきてしまいます。初めに意識を合わせることが大事ですね。

AI・データ分析によるDX推進のためのヒント

最後にこれからAI・データ活用や DX 推進を進めたい読者へアドバイスをお願いします。また支援できるところもお伝えください。

村山 何度も申し上げていることですが、AI・データ活用を進めるためには、目的というところが最も重要と考えています。ここをきちんと定めてきちんと共有するところからはじめましょう。
当社は、データ利活用実現サービスをご提供しており、コンサルティングフェーズから基盤の構築データマネジメント・AIデータ活用など、すべて包含してご提供しています。当社コンサルタントがお客様に伴走し、データマネジメント領域ではリアライズさん、データサイエンス領域は数理システムさんと適宜連携しながらお客様のデジタルサクセス®[1]を実現します。
アイディア出しのところ、初期の構想のところからご支援させていただきます。

海老原 データというのは根本をたどると、ビジネスの写像・マーケットの写像そのものと考えています。真摯にそれを受け止める企業文化が必要かなと思います。データや分析結果は経営者にとって不愉快な現実を突きつけることもありますが、その怒りはデータサイエンティストにぶつけるものではありません。「客観的なデータをきちんと受け止める」という企業文化、これは目に見えませんがとても重要です。データを正しく活用するために、現在蓄積されているそのデータをいつでも活用できる状態にするというのが、当社の得意な領域です。
当社は日本で数少ない専門家として、多くの先進企業のデータマネジメント支援を行ってきましたので、お客様の業界特性のあるデータも紐解く自信があります。社内で点在するデータの統合や整備、データ品質維持のためのデータ運用やデータガバナンス支援など、データマネジメント全般でお役に立てると思っています。
本日の話題で出ている通り、まずは目的の設定がとても大事です。そのフェーズからデータマネジメントのプロフェッショナルとして、ご提案させていただきます。

多田 AI・データ分析をこれから始めたいという方は、最初から様々な手法を習得することを目指すのではなく、具体的な目的に向けて小さく取り組みを始めることが大事かなと思います。
様々な手法を知っているとそれを試したくなるのですが、データ自体に問題があってどの手法を試してもうまくいかないということがよくあります。ここでデータが悪いことに気づければ良いのですが、データの内容の検討をするよりもパラメータの調整や手法の変更の方が手っ取り早くできてしまうので、その方向でがんばり始めてドはまりしてしまうというのはありがちです。
まずはデータの集計・可視化で目的を達成するだけのポテンシャルのありそうなデータかどうかを探り、「このデータならこんなことが分かりそう」という仮説を持って分析手法を適用してみるというような形で進めていきましょう。仮説が間違っている場合もありますので、深追いしすぎずに仮説の再検討やデータの見直しに立ち返ることも必要です。
データサイエンス領域に関して、AI開発のご支援、AI構築支援ツールや伴走型の教育・コンサルティングサービスを提供などを行っています。これから始めたい方も、やってみたけどうまくいかなかったという方も、是非ご相談ください。

おわりに

システム開発、データマネジメント、AI活用のプロフェッショナルとしてそれぞれの観点からAI・データ活用プロジェクトの推進のポイントを語ってもらいました。参考にしていただける部分はあったでしょうか。

各社関連するソリューションを展開していますので、よろしければ下記のページもご覧ください。

株式会社NTTデータビジネスシステムズ:
お客様のデジタルサクセス®の実現へむけて、データマネジメント基盤の導入だけでなく事業戦略の構想「事業戦略策定支援コンサルティング」からデータ活用の実現「データ利活用実現サービス」までお客様へ伴走し支援をいたします。

株式会社リアライズ:
NTTデータグループのデータマネジメント専門会社として事業を開始し、一貫してデータマネジメントを通じた企業・組織のデータ活用を支援しています。昨今、競争力のあるデータ活用推進を目指す企業から、自社にデータマネジメントを根付かせる「データガバナンス」の相談を多くいただいています。

株式会社NTTデータ数理システム:
「数理科学とコンピュータサイエンスにより現実世界の問題を解決する」をミッションとしています。長年のデータ分析、AIシステム開発の業務で培ってきた技術やノウハウを活かしたデータ分析プラットフォーム「Alkano」の開発や、データサイエンス教育プログラムの提供を行っています。

個別のご相談をご希望の方は下記のフォームからお問い合わせください。

ご相談はこちら

監修:株式会社NTTデータ数理システム 機械学習、統計解析、数理計画、シミュレーションなどの数理科学を 背景とした技術を活用し、業種・テーマを問わず幅広く仕事をしています。
http://www.msi.co.jp NTTデータ数理システムができること
「数理科学の基礎知識」e-book無料ダウンロードはこちら

関連記事