動画ACにアップロードした動画が公開中です。下のボタンから一覧をご覧いただけますのでどうぞご利用ください。

ユーザ名:ryo88

動画をダウンロードする

主に風景やエフェクト、背景動画をアップしています。

AIのお話

GoogleのAIメモアプリ「NotebookLM」を使って人口推計データを調査する

2024年6月30日

GoogleのAIメモアプリ「NotebookLM」について、どのように使ったらいいのか悩んでいるかたもいると思います。

今回、以下のような使い方について順を追って操作してみますので、ぜひ参考にしてください。

「NotebookLM」で人口推計データを参照

  • Web上から「人口推計」の統計データをダウンロードする
  • 「NotebookLM」にダウンロードしたファイルを読み込む
  • AIチャットで知りたい情報を探す

では、順番に見ていきましょう。

統計データのダウンロード

まず、「NotebookLM」を使う前提として、データベースとなるデータソース(ファイル)の読み込みが必要になります。

そして、このデータベースの中身を精査するためにAIチャットを使いながら深堀りしていきます。

データベースの中身を深く知ろうと、表を整形したり関数を使ったりせずに対話形式で自分の知りたい情報を探っていけるわけです。

読み込めるファイル形式は以下となります。

  • PDF
  • テキスト
  • gdoc

現時点では、テキストデータが読み込めるデータソースとなります。

「gdoc」はグーグルドキュメントですが、マイクロソフトの「Word」ファイルは読み込めません。

PDFやgdoc内に表データがあれば、表内のデータを抽出したり傾向を探ったりと言う方法も可能になります。

今回は、以下のサイトからデータをダウンロードしました。

PDFデータ(300kb弱)をダウンロードできます。

パソコンの任意の場所にPDFをダウンロードできたら、「NotebookLM」の操作に移ります。

「NotebookLM」にファイルを読み込む

「NotebookLM」にアクセスしたら、お持ちのグーグルアカウントでログインします。

グーグルアカウントを持っていない場合は新規で作成する必要があります。

「新しいノートブック」をクリックします。

データソースの場所を選択します。

今回のように先にWebページからパソコンにダウンロードした場合は、上から2番目の「PDF」をクリックします。

ファイルの場所を選択するウィンドウが表示されるので、先ほど保存した場所からPDFを開きます。

左サイドに読み込んだデータソースのファイルが表示されます。

今回は「202406.pdf」と言うファイル名だったので、そのままそのファイル名が表示されています。

右側ペインには「ノートブックガイド」が表示され、読み込んだデータソースファイルに利用できそうな「質問」などを提案してくれます。

これで、利用する準備はできました。

後は、データソースファイルの中身に関する質問のやり取りをAIチャットで行っていきます。

複雑な表や容量の大きいデータは理解できない

「NotebookLM」に読み込めるデータソースのファイル容量は、1つのノートブックにつき200MBまでとなっています。

十分に余裕があるようにも見えますが、例えファイル容量が大きくなくても、内容が複雑な表であったり、情報量によっては「NotebookLM」がファイルの中身を理解できない場合もあります。

チャットでファイルの中身を調査する

それでは、実際にチャットでファイルの中身を調査してみましょう。

・・・とは言っても、ファイルの中身をある程度分かっておかなければ何を聞いたらいいかも分からないですね。

一旦、データソースである「202406.pdf」を開いてファイルの中身を確認しておきます。

全部で4ページあり、上の画面は1ページ目の情報です。

「日本の総人口を5歳ずつの年齢ごとに区切った一覧表」となっていますね。

ちなみに2ページ目は年度別の人口の推移が一覧表となっています。

ここでは、1ページ目の情報について以下のように問い合わせてみます。

問い合わせ内容


年齢(5歳階級)の一覧で、2024年6月1日現在の総人口(男女計)の人口について聞きます。
年齢階級ごとの人口が表示されています。
人口の多い順番(降順)に年齢階級を並べ替えてください。
ただし年齢階級のデータの範囲は「0~4歳」から「100歳以上」までの範囲とし、「再掲」以下のデータは無視してください。

チャットで上のように問い合わせると、以下のような回答となりました。

1ページ目の「日本の総人口を5歳ずつの年齢ごとに区切った一覧表」をきちんと参照し、年齢階級を人口の多い順に並べてくれたかのように見えたのですが・・・

抽出した年齢階級の範囲は合っているのですが、微妙に人口の多い順番にはなっていないですね。

ただ、ある程度は年齢階級での人口動態を把握できるのが分かると思います。

では、次のように問い合わせてみましょう。

問い合わせ内容


年齢(5歳階級)の一覧で、2024年6月1日現在の総人口(男女計)で一番人口の多い年齢階級はなんですか?

少し、質問をシンプルにしてみました。

この表の総人口の内、一番人口の多い年齢階級が「50歳~54歳」だと分かりました。加えて人口数も回答してくれていますね。

念のため、今回の回答された数字をデータソースである「202406.pdf」ファイルを開いて確認してみると、数字は合っていました。

では、ついでに男女別で人口の多い階級も調べてみましょう。

どのように問い合わせてみますか?問い合わせの文章を考えてみてください。

筆者が問い合わせた結果は以下のようになりました。

男女ともやはり「50歳~54歳」が一番多いようですね。

いわゆる「団塊ジュニア世代」になるわけですが、さすがに人口の多さが数字でもはっきりと分かります。

もし、この回答を保存しておきたい場合は、メッセージ右側の「ピンマーク」をクリックすると、ノートブックを開いた時のトップにこのメモが表示されます。

まとめ

さて、今回は実際に「NotebookLM」でデータソースファイルを読み込んで、その中身であるデータから知りたい情報を抽出する、という作業を行ってみました。

AIチャットではありますが、チャットでやりとりするデータはWeb上の様々な情報ではなく、私たちが用意したファイルになります。

このファイルの信憑性が高ければAIチャットでやりとりするデータも当然信憑性が高くなるので、ファイルのデータについて回答してきた内容は「ChatGPT」などの生成AIよりも信頼のおけるものになるでしょう。

こちらの意図しないデータを引っ張ってきたり、見当違いの情報を参照したりする場合もあるのが玉に瑕ですけどね。

-AIのお話