AIは「4コマ漫画」を認識できるのか試してみた | なおくんの考えるネタ帳☆



AIは「4コマ漫画」を認識できるのか試してみた



こんにちは、AI研究家のなおくんです。 今回のテーマは「AIは4コマ漫画を認識できるのか」についてです。


過去に自分が描いた4コマ漫画「ソラシド!おかりなマン」の第5話使って、人気のチャットAIである「Claude3」「Gemini」「Copilot」の3つに、それぞれ画像を読み取らせ、認識力を試してみました。


1.Claude3


まずはClaude3からです。画像をアップロードして、「この画像には何が書いてありますか」とプロンプトを入力。コマごとの絵に描かれている内容はなんとなく理解できっているぽい?ようですが、コマの読み順が間違っていました。こちらからコマの読み順を指摘しても、なかなか正しく認識できませんでした。日本マンガの右始まりのルールを理解するのが難しかったようです。


2.Gemini


次にGeminiを試してみました。驚いたことに、この漫画がネット上で公開されていることを認識したのか、「おかりなマン第5話」と特定できました。画像そのものには「第5話」という情報は書いていませんから。コマの読み順に関しては、こちらも左から右に進んでいく米国式の解釈になってしまい、ストーリーをうまく理解できていませんでした。


3.Copilot


最後に試したCopilotは、「この画像が何なのかよく分かりません」と言われてしまい、認識にすら至りませんでした。


まとめ


結論として、AIには4コマ漫画の認識は難しいと感じました。マンガにはたくさんの「暗黙の了解」のようなものがあり、それらを読み取ることがまだまだAIにとっては難しいのかもしれないのだと思います。


今回の試みは、AIの画像認識能力は高いものの、まだ人間を完全に置き換えるには課題が残っていることを認識しました。漫画描きとしてはショックを受けましたが、これからのAIの進化に期待したいところです。


>>AIは「4コマ漫画」を認識できるのか試してみた(LISTENで聴く)