入力データから知見へ:機械学習によるトーン検出
From Input to Insight: Detecting Tone through Machine Learning
ビッグデータ、データ解析、機械学習、人工知能といった言葉はその他の多くの言葉と同様に、マーケティング・営業活動から採用、従業員の定着などビジネスのあらゆる局面で使用される。不正検査の技法についての議論においても、これらは普通に話題になるべきだ。公認不正検査士協会(ACFE)の「2016年度国民への報告書(2016 Report to the Nations)」によると積極的なデータの監視・分析は、その他の不正防止対策に比べて不正による損失中央値と不正の継続期間中央値の両方を最も効果的に削減することに密接に関連している。
最近の事例では、解析と機械学習が様々なテキスト形式のデータ源の分析に応用されている。不正スキームの多くは、簿外で実行され企業の財務諸表に記載されることはない。依拠すべき取引データを持たない不正検査担当者は、調査で利用する他のデータを活用し、面接調査の過程をより向上させるために情報を提供した。
ある大企業が、IT担当役員とその直属の部下の関与を伴う潜在的な窃盗スキームの存在に気付いた。以前に解雇されたある内部通報者による申立てが企業の注意を引いた。このスキームに関与した人物は、まだ価値のある古いIT機器をeBay(米国のオークションサイト)で売却した。機器の売却に使われたユーザーIDはその会社名によるものだったが、その会社の管理下にあるものではなかった。むしろそのIT担当役員は、自身のペイパルのアカウントを「会社の」eBayアカウントと紐づけていて、eBayアカウントへの入金は直接彼の私的なアカウントに送られ、会社に送金されることは決してなかった。
通常は、取引ベースの解析は出発点を持っている。しかし分析すべき取引がないので、不正検査担当者は、IT部門の人員の電子メールとインスタントメッセージに注意を向けた。キーワード検索が最初の試みだったが、直接証拠という点に関しては多くを得ることはできなかった。
第二の取組みはトーン検出だったが、これによりIT担当役員とある管理者の間の内緒話のような口調を含む多数のインスタントメッセージが特定された。(不正検査で一般的なトーンとしては他に緊張した、回避的、不安な、親密な、などがある)。これらのやり取りの話題はeBayによるスキームだった。
加えて、トーン検出は、そのIT担当役員と同僚の女性数名との間の通常の職場の関係としては少々「親しすぎる」数通の電子メールを発見した。これらはこの調査で使用されることはなかったが、この類の結果は、セクハラ関連の訴訟や調査で有用である可能性がある。
テキストメッセージを用意した不正検査担当者は、IT担当役員とインタビューを行い、彼はそのスキームを自白した。機械学習-この事例では特にトーン検出―とキーワード検索を利用した従来型の分析の両方が目前で行われていたスキームを首尾よく発見した。
この事例とその他の追加情報がACFEの2日間のセミナー“Using Data Analytics to Detect Fraud”で扱われる。データ分析のプロセスに取り組み、データという観点から事例学習を評価することにより、このコースでは次のことが学習できる。
解析を不正検査に上手く応用するために解析に注目する
基本的なデータ分析技法の学習と多種のソフトウェア・ソリューションでそれらを実行する方法
テキスト解析、視覚的解析、予測モデリングなどを含む上級の解析技法についての学習
個々の不正スキームへの解析の応用方法の戦略化とその応用のための枠組みの開発
取引、情報伝達、先端技術、その他の資産は、日々継続してより多くのデータを生成する。解析、機械学習、人工知能、その他の高度な解析手法は、不正対策専門家が、複雑な職業上の不正に追いついていくための手段を進化させるのを支援する。