【五十男浪ブログ】レシートの文字読みは、GeminiなどのAIに相談だ!?

五十男浪ブログ

確定申告、悩ましいですよねぇ。

(個人で申告を)しない人でも、

職場の小口清算などで、

紙のレシート情報を

テキスト入力することは多いのでは?

面倒ですよね、アレ。

1件ごとの文字量(情報量)は

ごくわずかなんですけれど、

積もり積もれば、

結構な分量になりますし、

(まぁ、積もらせたワタクシ・五十男浪(いそおろう)がすべて悪いのですが…汗; )

枚数が多すぎて、

どこまで入力完了したか、

すぐわからなくなってしまうし、

コーヒーはこぼすし…。

とにかくこの作業のせいで、

貴重なお休みが1日や2日くらいは

あっという間に消えてしまう😭

Excelのパワークエリや、

Windows 11標準のSnipping Toolで

画像OCRができるようにはなりましたが、

なんせ精度がねぇ…。

特に漢字やカタカナなどの2バイト文字は、

全く何処の国の言葉かわからないような

テキストに変換されてしまいます。

嗚呼、面倒くさいなぁ…😮‍💨

しかし!

実は画像に写った日本語のテキスト情報化には、

「生成AIが効く」ってご存知でしたか?

たまたま

確定申告の仕分け作業、「AI」に任せると本当にラク? 精度を試してみた

という記事を見つけて、

「この手があったか!!」とヒザ打って、

早速試してみた結果がなかなか使えたので、

ご報告しますね。

Copilotでは頓珍漢(トンチンカン)だったが、Geminiでは最適解が得られました!

画像の中の文字情報をテキスト化するのには、

OCRソフトを利用することが真っ先に思い浮かびますが、

実は最近の生成AI各サービスでは、

画像を読み込んで解析できるサービスが提供されています。

Microsoft Copilotだったら、↓コレですね。

レシートの金額情報を

Microsoft Excelで集計しようと考えていたので、

せっかくだから同じメーカー製のCopilotに、

以下のようなプロンプト(命令文)を投げました。

添付の画像ファイル(店舗の領収書です)から、日付,時刻,店名,税込支払金額の4項目を見つけ出して、この4項目をそれぞれ「日付,時刻,店名,税込支払金額」の並び順で、各項目間にカンマを入れて、csv保存できるような1行のテキストを返してください。

Copilotが、どんな回答をよこしたと思います?

「本当は力になりたのですが、」!?

↑本気でそう思ってる? Copilot(副操縦士)くん!!

あまりの肩すかしにがっかりして、

とりあえずMicrosoft Copilotを使い続けることは止め、

Google Geminiに同じプロンプトを投げかけてみました。

バッチリでしたよ✌️

手元に30枚以上あった紙のレシートが、

この方法で一気に

(しかもかなり正確に!!)

テキストデータ化できました。

確定申告、めっちゃはかどりました!!

複式簿記なら、仕訳もAIに相談だ!?

青色申告をしている人なら、

単式簿記(家計簿レベル)ではなく、

複式簿記の帳簿を用意する必要があります。

その際に面倒なのが

勘定科目(仕入原価、雑費、交通費など)の

振り分けですね。

それもAIに相談です。

先ほどのプロンプトを、

次のように書き換えます。

添付の画像ファイル(店舗の領収書です)から、日付,時刻,店名,税込支払金額の4項目を見つけ出してください。次に、飲食店レシートであれば勘定科目=”取材費”、飲食店以外のレシートであれば勘定科目=”雑費”として、「日付,時刻,勘定科目,店名,税込支払金額」の並び順で、各項目間にカンマを入れて、csv保存できるような1行のテキストを返してください。

Google Geminiは、

ちゃんとフォローしてくれましたよ。

結論;紙情報をテキスト化するには、まずOCRよりも、生成AIに相談だ!?

レシートは、

令和時代になってもいまだに残る

紙情報の典型。

なんとか楽にテキストデータ化して、

スマホやパソコンでちゃっちゃと

処理してしまいたいですよね。

紙情報のテキスト化には、

まずOCRソフトウエアを思いつきますが、

同じこと

(いやOCRより楽に正確に)を

スマホでちゃっちゃと解決してくれる

生成AIにまず相談してみることを

実体験的にオススメしますよ!!

(生成AIは時々、いやかなり頻繁に

しれっと嘘もつきますけどね。)

コメント

タイトルとURLをコピーしました