機械学習への期待

機械学習と監査

  機械学習とは

何らかの事実の裏付けを持つある大量データの塊を解析し、特徴量と呼ばれる変数を捉えて、変数同士の関係をモデル化したり、関係性から類似性を見出して一定の基準で分類することを、コンピュータのアルゴリズムを用いて実現しようとするもの。

また、導かれた大量のデータの傾向や法則を「知識」として位置づけ、それをモデル化して実務に応用する一連の過程を言う。

知識ないし知見を得ることを学習するという。「データを解析」するにあたっては、統計的知見や数学に裏打ちされた確率論などがあり、解析作業にあたってはコンピュータとソフトウェアを用いることから機械学習と一般に称されているが、あくまで知見を得るのは人間だから、機械学習とは「機械に学習させる」ことではなく、「人が機械を用いて学習する」のである。

例えば、アメダスは全国に大量にある気象観測点から頻繁に気象データを収集しているが、ある時点ある場所での天候と、その数時間前の気象データとの関係に何らかの傾向があることを掴んでモデル化できれば、今度は、今時点の気象データから数時間先の天候が予想できることになる。古典的な機械学習の活用例である。

別の例では、(分類)

機械学習とは何かという点に関しては多くの参考文献があるので、ぜひそちらも参照願いたい。

  前置き

歴史的概観

処理能力の向上

監査にコンピュータの能力が使えないだろうかという議論は、筆者が会計士になったは80年代終り頃に既にあり、EDP監査という言葉になっていたが、帳簿データの分類・集計の再実施や取引の抜取という比較的単純な技術が多かったように思う。人工知能を監査に使うという話題もあったが、コンピュータの処理能力が低く、またリソース自体の利用可能性が一部に限られていたこともあって、夢物語の域を出なかった。

しかしここ最近の人工知能ブームともいえる社会現象に流されてか、また同じような議論が出てきている。80年代当時と様相を異にするのは、一人一台のPC環境のみならずネットワークを通じてコンピュータリソース(高速CPUや分析ツールなど)を使いやすくなっていることが研究の可能性を広げているが、むしろ監査対象組織の業務における情報処理が情報システムに依っており、「データを扱う」ということが当然視されるようになったことが大きいだろう。監査人の立場からは、不正等の大型化による増大するリスクに対して人材供給が限られているという切実な現状は、何かに助けを求めざるを得ないところでもあるだろう。

筆者は「人工知能」というものを見たことも触ったこともないので、その実在性には懐疑的でもあり、おとぎの国の白馬の王子様に淡い期待を抱くような議論をしたくないので、ここでは機械学習というデータ解析の方法論を監査にどう用いるかという観点で現実的に考えたい。

媒介の変化(紙からデータへ)

取引が記録された紙の証跡を基礎として仕訳が生成され科目別に分類されて財務諸表が作成されるというのは、パチオリ以来の簿記学のパラダイムだった。会計処理ソフトが登場してからも、しばらくはコンピュータの役割は経理担当者の起こした仕訳を集計することだったが、90年代にERPが登場してからは、組織の活動記録(人の稼働やモノの移動、資金移動など)をもとに仕訳を中心とする会計データが自動生成されるようになった。これに伴い、従来は経理が一手に執り行っていた仕事が分散し、経営資源を管理するのは企画、その観測(色々な意味での組織の活動データ集め)をするのは情報システム、決算と開示を取り持つのが経理の役割になってきた。

これに伴い、監査人の見る範囲は急拡大する。監査人の仕事は、組織の現場で起こっている事実が会計基準にしたがって適切に開示されているかという点にあるから、会計以外にも経営資源管理方法、情報処理システムの理解が必須となるのは道理だろう。

こういった動きは、全てが組織の情報システムの中でのデータの生成から分類、集計、加工という流れとして捉えることができるわけだから、しっかりとデータ証跡から監査証拠を得ようとするのは、歴史的に概観すればごく当然の成り行きに見える。

データから証拠を得る

証跡(audit trail)と証拠(audit evidence)の違い

監査にデータを用いるということの意味を理解するために、証跡(audit trail)と証拠(audit evidence)の違いを知っておかねばならない。

証拠とは監査人の心証を裏付ける事実ないし事象である。これに対して証跡とは組織の事業活動や管理活動が記録されたものであり、議事録、契約書、稟議書、伝票のように紙に記録されることもあれば、データとして記録されることもあろう。すなわち証跡から証拠を得るということは、監査人がそれらの記録類を見てその背後にある事実関係を捉え、処理された会計記録の適否判断の根拠となったものが証拠として採用されるということである。大事なことは判断して心証を得ることであって、証跡を入手することではない。言い換えれば、販売契約書があれば売上取引の証拠を得られたとするのではなく、契約書から推定される事実と他の既知の事実とを積み重ねて販売の事実があったのだと判断しているということなのだ。

データ証跡と紙の証跡

データ証跡の場合においても同様である。

会計記録としての売上高の裏付けとして個々の売上が記録されたデータを得ただけでは証拠を得たとは言えないだろう。かといって売上の証跡はそれしかないということもあるため、ここで思考停止してはならない。注文の事実、発送の事実、入金の事実など、販売を裏付けると考えられる他の記録はあるので、それらの記録と綜合したときに整合するか、矛盾がないかという観点でも証拠は得られる。

紙の証跡は組織から見た第三者が作ることが多いため、記録としての信憑性が高くかつては強い証拠力があるとされていたが、しかし第三者作成の証跡がないケースは一般化している。

証拠を「積極的に得る」

財務諸表は個々の取引を反映した仕訳の積み上げである点は不変だが、個々の取引の裏付けとして強い証拠力を持つ証跡を確かめればよいとするのは、旧パラダイムの簿記会計に基づく考え方である。すなわち、データ証跡の時代にあって、データから証拠を得るにあたっては監査人は組織の活動を全体を鳥瞰した上で活動がどの時点でどのような方法でどこに記録保管され、その記録が監査人にどのように提供されるのかという理解を前提に、証拠を得る戦術を決めなければならないのである。この際、データに対する理解が何よりも重要なのである。

機械学習を用いた監査証拠

では、機械学習が監査でどのように役立つのだろうか。これまでの議論から言えることは、組織の活動を記録したデータを機械学習によって解析した結果として得られる何らかの傾向なり法則が、組織活動の事前理解に対する裏付けとなったり、機械学習モデルから提供される予測値(推定値)が実際に記録されている値とある範囲で合理的に一致するなどの結果が得られたりすることによって、監査人が何らかの心証を形成できれば、機械学習によって監査証拠を得たと言えることになると考えられる。従来の監査論に当てはめて言えば、分析的手続において機械学習の方法論を応用しようとするものだ。また、監査証拠ではないが分析という観点から言えば、データの中の属性の組合せが示す「例外性」は、監査では非通例的な取引を意味したり、不正の兆候を示唆するものだが、ここには機械学習を用いた異常検知の手法が応用できるのではないかと考えられる。

機械学習を用いた監査手法の例

 監査に使える機械学習

前置きが長くなったが漸く本題に入る。

監査においては、次のような使い方が考えられるのではないでしょうか。

モデル化

まず、モデル化は既存のデータからモデルを抽出することで、取引や事業活動の特徴を関数という形で表現できることになります。

一番端的なモデルは、お馴染みの、

利益=販売単価×販売数量×利益率

ですが、全体の平均的なモデルだけ作るのであればそれで構いませんが、あまりに大雑把過ぎて有用な情報にならない可能性があります。これに、商品の種類、相手先などの条件が加わることでそれなりに有用さが増した情報が得られますが、たくさんの組み合わせが発生するので、それをいちいち手で計算していたのでは、いくら時間があっても足りません。

そこに機械学習の方法を使って、モデルを生成できないかと考えるわけです。

推定値

モデルができれば推定値を計算することも可能です。とある条件の下での取引単価を推定したり、利益率を推定したりします。分析的実証手続に活用できそうです。

分類

監査では分析によって取引を組織単位や商品単位で分類して、それぞれにリスクを捉えて監査アプローチを決める方法を採ります。これは、全体をざっくりと捉えるよりも、分類したほうがよりリスクの高い領域を特定できる可能性があるからで、分析はリスクアプローチの根幹を担います。

通常の監査においてはデータが持っている変数(フィールド名)によって分類することが多いでしょう。それが、組織や担当者、あるいは商品カテゴリや取引先といった項目で分類されるのは必定ですし、実際それだけでも相当有用な情報を提供してくれます。

異常検知

推定や分類の方法を援用すると異常検知