2024年の夏ごろに、Geminiに搭載されたファイルアップロード機能は有料ユーザー向けの機能として公開されました。
アップロードできるファイルは以下の通りです。
- Googleドキュメント
- Wordファイル
- テキストファイル
- 画像ファイル
今回、このファイルアップロード機能が、無料ユーザーにも公開されました。
主に有料ユーザーと違う点は、読み込めるデータ量になると思いますが、それでも「テキストファイルで50ページ相当」だそうです。
文章の要約や解析はもちろんですが、「アップロードした画像ファイルの内容を元に文章を作成する」などの方法でも利用できますね。
使い方を少し見ていきましょう。
文章や写真が載っている画像から内容を要約
画像ファイルなのですが、中身は文章や写真が載っている説明ファイルだとします。
この画像ファイルに書かれている文章などの内容を要約してもらいましょう。
上の画面はパソコンのブラウザでGeminiを起動したところです。
プロンプト入力欄の左側に「+」があるのでこれをクリックするとファイルを選択できるようになります。
スマホだと「カメラ」から直接画像を指定できます。
試しに、文章と画像が載っているページをイメージ化したものをアップロードしてみました。
プロンプトで「文章が途中で切れている」旨を伝えて、画像内の文章を要約してもらったのですが・・・。
期待通りで、凄いですね。
画像内の文章であっても、きちっと要約してくれていますし、途中で途切れている文章でもそれまでの部分を綺麗にまとめてくれています。
今回アップロードした画像は、本題の文章とは別に「誰が書いた文章か」、「要点を別枠で掲載」、「ポイントを別枠で掲載」と本文以外にも四角囲みなどで文章が別にあったり、記載されている文章から外れた場所にタイトルや講師紹介などがあったり、文章だけがずらずら書いてある画像ファイルではなかったのですが、それらも踏まえて整理してくれました。
画像ファイルから昔話のオープニングを作成
画像ファイルを元にした新たな文章も作成できます。
犬と猫が4匹並んで草原を走っている画像を提示して、「この画像から昔話のオープニング部分を作成してください」とお願いしてみました。
いつもの通り野原で遊んでいた4匹の犬と猫たちが、突然謎の光に包まれて見知らぬ土地に降り立ち、そこから冒険が始まるオープニングを作ってくれました。
昔話っぽくないですし、べたな構成ですけど(笑)、さらにまたGeminiに相談しながら話を膨らませるのは容易にできそうですね。
第3章でスタンドを武器にエジプトまでDIOを倒しに行くような「犬猫の微妙な冒険」のようなストーリーができ上がりそうな気がしてきました。
(まとめ)
最初に「バード」が出てきた時は、「Google大丈夫か・・?」と思っていましたが、現在のGeminiになってからはあっという間に性能が良くなりましたよね。
Geminiは、YouTubeの要約もできますし、今回ファイルのアップロードからまた色々と作業ができるようになって、今後ますますGeminiの利用頻度が上がりそうです。
「画像を元に新たな画像を作成する」などの高度な要求をしたい場合は、有料の「Gemini Advanced」を契約する必要があるでしょうけれども、記事の要約や文書ファイルの整理などであれば無料プランでも十分に利用できそうです。