確定申告、悩ましいですよねぇ。
(個人で申告を)しない人でも、
職場の小口清算などで、
紙のレシート情報を
テキスト入力することは多いのでは?
面倒ですよね、アレ。
1件ごとの文字量(情報量)は
ごくわずかなんですけれど、
積もり積もれば、
結構な分量になりますし、
(まぁ、積もらせたワタクシ・五十男浪(いそおろう)がすべて悪いのですが…汗; )
枚数が多すぎて、
どこまで入力完了したか、
すぐわからなくなってしまうし、
コーヒーはこぼすし…。
とにかくこの作業のせいで、
貴重なお休みが1日や2日くらいは
あっという間に消えてしまう😭
Excelのパワークエリや、
Windows 11標準のSnipping Toolで
画像OCRができるようにはなりましたが、
なんせ精度がねぇ…。
特に漢字やカタカナなどの2バイト文字は、
全く何処の国の言葉かわからないような
テキストに変換されてしまいます。
嗚呼、面倒くさいなぁ…😮💨
しかし!
実は画像に写った日本語のテキスト情報化には、
「生成AIが効く」ってご存知でしたか?
たまたま
「確定申告の仕分け作業、「AI」に任せると本当にラク? 精度を試してみた」
という記事を見つけて、
「この手があったか!!」とヒザ打って、
早速試してみた結果がなかなか使えたので、
ご報告しますね。
Copilotでは頓珍漢(トンチンカン)だったが、Geminiでは最適解が得られました!
画像の中の文字情報をテキスト化するのには、
OCRソフトを利用することが真っ先に思い浮かびますが、
実は最近の生成AI各サービスでは、
画像を読み込んで解析できるサービスが提供されています。
Microsoft Copilotだったら、↓コレですね。

レシートの金額情報を
Microsoft Excelで集計しようと考えていたので、
せっかくだから同じメーカー製のCopilotに、
以下のようなプロンプト(命令文)を投げました。
添付の画像ファイル(店舗の領収書です)から、日付,時刻,店名,税込支払金額の4項目を見つけ出して、この4項目をそれぞれ「日付,時刻,店名,税込支払金額」の並び順で、各項目間にカンマを入れて、csv保存できるような1行のテキストを返してください。
Copilotが、どんな回答をよこしたと思います?

「本当は力になりたのですが、」!?
↑本気でそう思ってる? Copilot(副操縦士)くん!!
あまりの肩すかしにがっかりして、
とりあえずMicrosoft Copilotを使い続けることは止め、
Google Geminiに同じプロンプトを投げかけてみました。

バッチリでしたよ✌️

手元に30枚以上あった紙のレシートが、
この方法で一気に
(しかもかなり正確に!!)
テキストデータ化できました。
確定申告、めっちゃはかどりました!!
複式簿記なら、仕訳もAIに相談だ!?
青色申告をしている人なら、
単式簿記(家計簿レベル)ではなく、
複式簿記の帳簿を用意する必要があります。
その際に面倒なのが
勘定科目(仕入原価、雑費、交通費など)の
振り分けですね。
それもAIに相談です。
先ほどのプロンプトを、
次のように書き換えます。
添付の画像ファイル(店舗の領収書です)から、日付,時刻,店名,税込支払金額の4項目を見つけ出してください。次に、飲食店レシートであれば勘定科目=”取材費”、飲食店以外のレシートであれば勘定科目=”雑費”として、「日付,時刻,勘定科目,店名,税込支払金額」の並び順で、各項目間にカンマを入れて、csv保存できるような1行のテキストを返してください。
Google Geminiは、
ちゃんとフォローしてくれましたよ。

結論;紙情報をテキスト化するには、まずOCRよりも、生成AIに相談だ!?
レシートは、
令和時代になってもいまだに残る
紙情報の典型。
なんとか楽にテキストデータ化して、
スマホやパソコンでちゃっちゃと
処理してしまいたいですよね。
紙情報のテキスト化には、
まずOCRソフトウエアを思いつきますが、
同じこと
(いやOCRより楽に正確に)を
スマホでちゃっちゃと解決してくれる
生成AIにまず相談してみることを
実体験的にオススメしますよ!!
(生成AIは時々、いやかなり頻繁に
しれっと嘘もつきますけどね。)
コメント